第一章 人工智能的研究和发展《2022年斯坦福AI指数报告》中文全解读

    斯坦福大学的人工智能机构 Stanford Institute for Human-Centered Artificial Intelligence (HAI)发布的这第五版《AI指数报告》(2022)英文版一共230页。为了方便阅读,我将他翻译成中文记录下来,本文仅摘取重要且有趣的部分,且有部分自己的阅读感受和见解,需要阅读原文的请至链接2022年斯坦福AI指数报告-深度学习文档类资源-CSDN下载。

    人工智能指数报告跟踪、整理、提炼和可视化与人工智能相关的数据。这份报告的使命是为政策制定者、研究人员、企业高管、媒体记者提供公正、经过严格审查的全球数据,使得公众对复杂的人工智能领域有更透彻、更细致入微的理解。它旨在成为世界上最可信、最权威的人工智能数据和见解来源。

第一章. 人工智能的研究和发展

    研发是推动人工智能(AI)快速进步不可或缺的力量。每年,广泛的学术、行业、政府和民间社会专家和组织为人工智能通过研发大量论文、期刊文章和其他与人工智能相关的出版物做出贡献,人工智能、图像识别、自然语言处理等特定子主题的会议,跨境国际合作以及开源软件库的开发。这些研发进展的重点不同、地理分散。

    人工智能研发的另一个关键特征,使其与其他STEM 研究领域有所不同的核心,是它的开放性。每年,成千上万的人工智能出版物以开源形式发布,无论是在会议上或在文件共享网站上。研究人员将公开在会议上分享他们的发现;政府机构资助AI研究,最终用在开源软件上;开发人员使用开源软件库,免费提供给公众,以生产最先进的人工智能应用程序。这种开放性也有助于现代人工智能研发在全球相互依存和关联的性质。
    第一章利用多个数据集来分析2021年AI研发的空间。先看AI刊物,包括会议论文、期刊文章、专利和知识库。然后,分析 AI 会议出席情况。最后,它检查研发过程中使用的人工智能开源软件库。

概要:

  • 尽管地缘政治紧张局势加剧,但自2010年至2021年的11年间,中美合作的跨国人工智能出版物最多,且自 2010 年以来增加了五倍。中美合作的出版物数量是该项排名第二的中英合作出版物数量的 2.7 倍。
  • 2021年,中国在人工智能期刊、会议和知识库的出版物贡献数量方面继续领先世界——所有三种出版物类型的总和比美国高 63.2%。同时,美国在人工智能会议和知识库的引用数量上在主要人工智能强国中占据主导地位。这可以理解为中国出版了很多研究结果,但并不能在研究领域形成主要影响力,毕竟这是靠能力而非靠数量取胜的环节。
  • 从 2010 年到 2021 年的11年间,教育机构和非营利组织之间的合作产生了最多的人工智能出版物数量,其次是私营公司和教育机构之间的合作、教育机构和政府机构之间的合作。
  • 2021年AI专利申请量是2015年的30多倍,复合型年增长率为76.9%。

1.1 出版物

从2010到2021年的11年间,AI出版物的总数翻番,从162,444到334,497。

    2021 年,51.5% 发表的 AI出版物是期刊,21.5% 是会议论文,17.0% 来自知识库,书籍、书籍章节、论文和未知文件类型占其余 10.1%。期刊和知识库出版物的数量在过去的 12 年中分别增长了 2.5 倍和 30 倍。自 2018 年以来,会议论文数量有所下降。

    自2015年以来,模式识别和机器学习领域的出版物翻番。其他的领域被深度学习强烈影响着,如机器视觉、数据挖掘和自然语言处理,都有小幅增加。

    Citation, in my opinion, reflects everything.  中国在AI期刊方面的被引用率远大于欧洲和美国,这三个区域贡献了全世界66%的被引用量。

    而在会议论文方面,美国的被引用量仍然排在第一位。有趣的是,中国每年论文的被引用量和全球论文发表数量有着惊人相似的规律,以至于使我怀疑在论文的引用和被引用之间还有一层关系未被挖掘。

     在类似于arXiv.org这些知识库收录一些还未在期刊或会议上发表的论文稿件,这些论文的实验真实性无法求证。美国在这一方面被引用论文数量的贡献明显远高于世界其他地区。

    2021年一整年AI专利的数量已经是2015年的30倍了。年复合增长率是76.9%。在被收录的专利中,北美最高,奖金57%的专利出自北美,其中美国占近40%,非常重视知识产权。东亚和太平洋地区则占31%,其他地区相对较少。当然,中国的专利申请量最多,87,343占51.69%,但是申请成功数量只有1,407,与美国相比还相差甚远(34%)。

1.2 学术会议

    近几年顶会(NeurlPS、CVPR、ICLR、ICCV、AAAI、EMNLP、IROS)的出席人数没有明显增长,除了ICML大会(2021年近3万人参加)。也许是受疫情影响了。

1.3 AI开源软件库

    Well, TensorFlow框架无疑是目前应用最广泛的框架,没有之一。TensorFlow + Keras + TensforFlow-Examples 的关注度依然遥遥领先,尽管OpenCV在传统图像领域也有一定量的粉丝,而PyTorch也不甘示弱在AI框架类开源库中排第二。Scikit-learn得益于它在机器学习领域的大量代码库和与OpenCV在教育界近乎同等的地位,也非常出众。

猜你喜欢

转载自blog.csdn.net/Mango_Holi/article/details/123601041