约翰霍普金斯计算机博士学位答辩

计算机科学学生辩护:项翔 - “用于识别、定位和量化行为的视频的图像集、时间和时空表示”

什么时候:
2018年6月12日@下午3:00 - 下午5:00

地点

Hackerman Hall 320

摘要

本讲座及其相应的论文解决了学习视频表示的问题,这里定义为转换视频,使其基本结构更易于识别和量化。 在文献中,视频可以由一组图像,通过对运动或时间动态进行建模,以及以像素为节点的3D图形来表示。 本论文提出了一套模型来定位,跟踪,分割,识别和评估行为,如(1)通过规范化归一化卷积神经网络(CNN)给出的聚合子集特征的图像集,(2) (3)具有空间全局运动的时间局部模型,其通过鲁棒特征匹配和通过添加运动模型的动作检测估计的局部运动估计,(4)具有通过3D图切割和量化分割的动作的时空模型分别通过分段3D CNN。

最先进的表演已经实现了量化脸部疼痛和人体潜水的任务。 本文的主要结论如下:(1)图像集模型可以有效地捕捉与集体表示有关的面部动作; (ii)脸部动作的稀疏和低秩表示可以将表达,身份和姿势提示解开并且可以使用图像集模型和线性模型来学习; (iii)从人脸网络可以看出,范数与可识别性有关,并且相似性度量和损失函数很重要; (v)将基于多实例学习的增强跟踪器与粒子滤波运动模型相结合,可以在外观相似性和运动一致性之间进行良好的折衷; (iv)在本地分割对象使得它能够分配形状先验,并且从弱数据监控的丰富Web数据中学习在线形状先验等知识是可行的; (v)它可以在空间和时间两方面进行本地工作,以将视频表现为3D图形,并且在输入时间上有意义的剪辑时,3D CNNs也能有效地发挥作用。

希望所提出的模型将导致构建人脸和手势识别系统中的工作组件。 另外,针对视频提出的模型可以适用于其他形式的序列图像,例如高光谱图像和体积医学图像,这些不包括在本讲座和论文中。 论文中包含了联合学习嵌入和量化的监督散列模型,但在时间利益上不会在演讲中呈现。

履历

Xiang Xiang自2012年起担任约翰霍普金斯大学计算机科学博士学位,自2012年起担任Gregory D. Hager(自2012年起担任首席顾问)以及自2014年起担任计算机科学博士学位,Trac D. Tran(2014年起担任首席顾问) D. Hager(自2014年起担任共同顾问)被列为我的官方顾问。 他于2009年获得中国武汉武汉大学计算机科学学士学位,2012年获得中国科学院计算技术研究所硕士学位,并于2012年获得约翰斯学院的MSE学位霍普金斯大学。他的研究兴趣是计算机视觉和机器学习,重点是视频理解,面部分析,情感计算和生物医学应用的表示学习。 他一直是DSP实验室(ECE),CIRL,LCSR,MCEH,CCVL和CIS的积极成员。

霍普金斯之后的专业计划: 
Xiang Xiang将加入Stefano Soatto作为亚马逊AI的应用研究科学家。

导师

Trac D. Tran和Gregory D. Hager

猜你喜欢

转载自blog.csdn.net/eglxiang/article/details/80646696