1、工作项目1:基于多分类的自动告警监控系统
背景:版本外发,时间紧急,人工筛选速度很慢。传统方法是分析5个模块打印出来的告警日志,很依赖经验。
建模:告警信息作为训练数据,标签是5个模块。抽象成多分类问题,使用KNN。
单个告警是1个单词,单位时间内样本是一个样本。
出现的问题:
(1)预处理:去掉一些无用的告警;不能按照次数累加,而是出现一次就为1;
(2)单位时间的选择;
(3)KNN:权重距离加权、kd-tree、ball-tree。没有用LSH,局部敏感哈希,因为还没有那么海量数据。
特征维度:100维*20万样本 标签:1-5
2、工作项目2:
背景:CNN在通信系统里的应用
编码--调制00/01/10/11 空气 信道估计和译码00/01/10/11--解调--解码
3、狗狗识别项目:
4、SVM算法原理和优缺点
5、过拟合的原因、解决方法等
6、针对宝宝树
图片:
(1)上传时:挑选质量高的图片;通过人脸识别出宝宝,提示上传宝宝照片
(2)相册分类:场景分类(室内、外景),姿势分类(站立、坐着),多个宝宝
(3)相册搜索
视频:
(1)视频分类、视频推荐