软件杯-视频全量目标分析和建模需求分析说明

开发环境:

  1. 华为云平台

开发语言:

  1. python3.7

深度学习框架:

  1. TensorFlow1.x

数据集:

  1. 参考voc、cityscapes-image-pairs等

预计初步实现效果:

功能需求:利用视觉分析技术对高分辨率视频进行目标检测和语义分割

具体:

基本要求:
  1. 分类和定位。针对10分钟1080P视频内容进行移动目标识别(包括人、机动车、非机动车、建筑、植物等5种以上)
  2. 语义分割。实现对高清视频图像语义分割(对每帧的每个点的类别预测)
  3. 重点实现对建筑物等固定目标的识别和分割
进阶需求:
    1. 实现移动目标10种以上(其中建筑物必须识别)
    2. 实现实例分割
    3. 性能优化,创新深度学习算法模型
    4. 来源https://www.cnblogs.com/zzstdruan1707-4/

猜你喜欢

转载自www.cnblogs.com/zlj843767688/p/12805717.html