NSFC: 研究目标看似简单

摘要: 研究目标只需要说清楚完成的项目长什么样子, 但并没有那么容易写.

1. 日常生活所讨论的目标

  • 例 1. 我要去北京天安门.
    这里的目标很容易描述, 就是 “北京天安门”.
    如何证明你达成目标? 以下二选一: a) 你用肉眼看到它; b) 你站在门的下方.

  • 例 2. 一个小目标: 先赚它一个亿.
    这里的目标描述没有歧义: 一亿人民币.
    如何证明你达成目标? 银行帐户显示: 资产 − - 负债 ≥ \ge 1 亿元人民币.

2. 软硬件项目所讨论的目标

  • 例 3. 交换机带宽达到 1000 MB/s.
    明确的目标: 带宽达到 (不小于) 1000 MB/s.
    要证明目标的达成, 只需要用数据测试 10 小时.

  • 例 4. Web 办公系统满足 3000 教职工的并发使用, 延迟时间不超过 0.5 秒.
    明确的目标: 3000 教职工并发使用的时候延迟时间不超过 0.5 秒.
    指标很清楚, 通过压力测试也易于验证目标的达成.

3. 机器学习科研项目所讨论的目标

科研项目讨论的目标至少有三种: 算法、模型、系统. 我们倒过来说.

3.1 机器学习系统

作为系统, 应与具体应用强相关, 甚至可以是商用系统. 与之相匹配的是, 通用性不强.

  • 例 5. 人脸识别系统, 识别率 99%.
    这是成熟的软硬件系统. 我们将它安装到小区, 然后再把小区人员的照片放进去, 下次我们通过门闸时, 它就会放行.
    指标很清楚: 100 个小区的人员, 它至少放 99 个过去; 100 个外来人员, 它最多放一个过去.

3.2 机器学习模型

作为模型, 应针对一大类的实际应用, 同时具有较好的通用性.

  • 例 5. 基于图片的的物品识别模型, 识别率 99%.
    需要先给这个模型一定数量的图片, 如 1000 个手机, 2000 个包包, 1200 只鞋子. 同时给定这些图片的标签 (手机/包包/鞋子). 经过模型训练 (获得参数) 后, 它对这些物品的识别率达到 99% 以上. 即错误率小于 1%.
    如果是用深度学习来做这个项目, 模型的结构应该 (包括层数、卷积核大小、drop-out 比例、激活函数等) 是确定的. 训练的目的是获得针对该数据集的参数.
    为了评价这个学习模型的目标是否达成, 我们需要用多个数据集进行训练与测试. 这里的评价比上一节其实更难, 因为不同数据集中, 图片的分辨率不同, 噪声不同, 所以比较难于作出 99% 的承诺.
  • 例 6. 骨干神经网络 backbone neural network.
    What Does Backbone Mean in Neural Networks?
    根据这里的解释, 神经网络中, 骨干网络是一种预训练网络, 可为不同的任务提供属性提取服务.

3.3 机器学习算法

作为比较底层的算法, 针对性弱, 但通用性强.

  • 例 7. 图片分类算法.
    主要讨论算法的机制, 基础的技术. 它的针对性可能并没那么强, 甚至可能支持不同的分类任务, 如 kNN, decision tree.
    它本身并不告诉你如何设置超参数,如: k k kNN 的 k k k 值及采用的距离函数; 深度学习的网络层数、卷积核大小等.

4. 机器学习项目的研究目标范例

有了以上的基础, 这里来讨论如何写具体的目标.

4.1 应用驱动的项目

  • 例 8 (硬杠系统指标). 本项目拟基于多时序、多模态的游客数据、旅游景点数据、餐饮数据、住宿数据, 开发针对都江堰市及其周边的一套智慧旅游系统, 具有如下功能: 对用户偏好的预测, 准确率不低于 85%; 以家庭或个人为单位的个性化旅游线路推荐, 满意度不低于 90%, 综合考虑游客满意度与负载均衡的团体旅游线路推荐, 满意度不低于 90%; 支持 100,000 个用户的并发访问, 服务器延迟不超过 0.5s.
    分析:
    a) 描述了系统的一些具体功能, 以及相应的指标;
    b) 这是最“正宗”的研究目标, 与研究内容的味道严格区分;
    c) 与例 4 相比, 系统更大, 功能更加细化;
    d) 作为“研究目标”, 并没有“研究”的味道, 感觉是为了某公司而开发的一个实际系统, 充满了金钱的味道.

  • 例 9 (兼顾不同层面). 本项目拟针对智慧旅游所涉及的多时序、多模态数据, 提出实时准确的时序预测算法、交互式的推荐算法, 构建智慧旅游的通用框架, 并开发一套具有川西特色的智慧旅游系统.
    分析:
    a) 把算法 (小)、模型 (中)、系统 (大) 三个层面的目标都写上了;
    b) 每个目标都具有相应的考评指标 (实时准确、通用、具有特色);
    c) 希望这种模式能与研究内容 (也讨论 what)、技术路线 (讨论 how) 的味道区别开来;
    d) 张老板觉得这个味道和摘要的差不多.

  • 例 10 (描述系统特点). 本项目拟针对游客、旅游景点、餐饮、住宿等多时序、多模态数据, 构建一套智慧旅游系统, 预期特点包括: 具有良好的预测能力, 对常游客的偏好提供准确预测; 具有良好的个性化旅游线路推荐能力, 满足家庭或个人的需求; 具有良好的多元化团体旅游线路推荐能力, 拉动旅游点均衡发展.
    分析:
    a) 与例 8 相比, 不写太具体的区域, 避免搞成一个商业项目, 失去“研究”的味道;
    b) 不写可量化的指标, 因为研究之前无法保证它们能达到.

  • 例 11 (高屋建瓴). 以xxx的需求为牵引,突破xxx理论与方法的瓶颈;解决xxx等导致的xxx等核心科学问题,促进xxx融合;促使xxx的应用,以获得xxx的结果。
    分析: 这个版本就不透露细节了, 至少要用红包来换.

4.2 模型开发的项目

  • 例 12 (只谈模型). 本项目为推进旅游业的发展, 开发具有可扩展性的智慧旅游框架, 一方面提供助游客数据、景点数据、餐饮数据等的接口; 另一方面能将这些数据有机融合提供统一的数据挖掘平台, 以支持区域智慧旅游项目的快速搭建.

4.3 算法研究的项目

从实际应用的角度, 研究的目标是获得一个可用的系统 (产品、蛋), 其评价指标包括: 完整性 (不依赖其它系统), 精度 (仅考虑某一种数据).
从计算机专业的角度, 研究的目标是获得算法 (母鸡), 其评价指标包括: 通用性 (是否适应于各类数据), 效率 (时间、空间复杂度), 精度 (或泛化能力,需要在尽可能多类别上的数据进行测试).
因此, 这种研究目标更难写.

  • 例 13 (只谈算法). 本项目拟针对多时序分析问题, 开发一套适用于结构化数据、图片数据、视频数据、时序数据的在线主动学习算法, 时间复杂度不超过 O ( n 2 m ) O(n^2m) O(n2m), 空间复杂度不超过 O ( m n ) O(mn) O(mn), 其中 n n n 为样本数, m m m 为特征数; 在相同查询的比例下, 预测准确率不低于流行的算法.

5. 小结

总觉得还没写到位. 什么套路才是最简洁、最清晰的呢?
继续努力!

猜你喜欢

转载自blog.csdn.net/minfanphd/article/details/128276454