【GPT-4 译】深入探讨：中国生成式AI格局及与美国的比较

前言

随着硅谷投资者和创始人对生成式人工智能的兴趣日益浓厚，中国的同行们也热衷于这一领域。有关ChatGPT、DALLE-2和Stable Diffusion的消息几乎在与西方科技界同时抵达北京。

然而，西方鲜有人知晓，中国正在构建自己的生成式人工智能领域。中国的科技巨头正在打造与OpenAI的ChatGPT和DeepMind的AlphaFold相类似的模型，同时中国的初创公司社区也意识到了这项新技术所带来的巨大机遇。

尽管美国科技人员通常对硅谷以外的事情一无所知，但政治评论员们很快就声称中国在人工智能的实施方面“领先于美国”，并认为将出现美国和中国之间的“生成式人工智能竞赛”。

那么，中国的生成式人工智能领域究竟发生了什么？这对世界其他地区有何影响？

生成式AI的炒作与焦虑

ChatGPT发布后的一周内，中国科技界就充斥着关于这款新聊天机器人的消息。科学家们开始讨论人工智能何时能通过图灵测试，科技界人士开始询问ChatGPT是否能挑战谷歌，投资者则对生成式AI成为下一个万亿美元级别的产业感到兴奋。

半年前，在2022年百度世界年度论坛上，百度创始人兼首席执行官李彦宏强调了一个新的市场概念：“人工智能生成内容”（AIGC）。他在主题演讲中强调，在未来十年，“AIGC将颠覆所有现有的内容生产模式”。他认为，AIGC有潜力将原创内容生产的成本降低到目前的十分之一，并将生产速度提高数百至数千倍。

然而，西方实验室发布的强大人工智能模型也给中国科技界敲响了警钟。针对OpenAI的ChatGPT发布，中国的观察者们表示担忧，担心这个国家正被西方的技术飞跃所“抛在后面”。API受到少数西方公司的控制，这进一步加剧了中国新兴初创公司的焦虑。

中国的AI模型

随着ChatGPT和Stable Diffusion风靡全球，中国实验室发布的生成式AI模型却鲜有关注。然而，中国的科技巨头和最杰出的AI科学家们正在不懈努力构建相同的模型。实际上，中国似乎是美国-英国垄断之外唯一一个发展自己模型基础设施的国家。

在生成式AI领域，除了谷歌、OpenAI和Meta等知名参与者外，按模型数量排名前十的开发者中有四家来自中国[1]。其中包括百度和阿里巴巴等科技巨头，清华等顶级大学，以及北京人工智能研究院（BAAI）等政府资助的实验室。

尽管以色列的AI21实验室和加拿大初创公司Cohere也在构建大规模模型，但除了美国和英国外，中国是唯一一个拥有多个实验室构建和发布这些模型的参与者。中国还构建了自己的AI框架，包括华为的Mindspore和百度的PaddlePaddle。这些框架与主导地位的西方框架（如PyTorch和TensorFlow）不兼容，但像Ivy这样的转换工具可能在这些框架之间架起桥梁。

除了模型训练基础设施外，中国开发者在硬件层面也越来越独立。为应对美国制裁的威胁，中国企业越来越多地转向国产GPU，如华为的Ascend 910，它帮助训练了生成式AI模型，如PanGu-α和ERNIE 3.0 Titan。这些努力为发展蓬勃的生成式AI生态系统奠定了基础。

扫描二维码关注公众号，回复： 15010858 查看本文章

在模型参数数量方面（这是衡量模型性能的一个粗略指标），中国的模型大约落后于顶级西方同行一年左右。与“中国的AI更大、更强、更快”的说法相反，中国在模型规模和性能方面落后于西方。而且，由于顶尖AI人才的差距，中国在短期内很难超越美国。中国实验室非常擅长学习西方顶级实验室的先进成果，但在提出原创模型和推动研究边界方面较为欠缺。因此，在一段时间内，中国在生成式AI模型领域可能仍会紧随其后，位居第二。

西方发布的开源模型也使中国开发者能够绕过昂贵的开发过程，迅速将现有模型适应到中文语言。在Stable Diffusion发布几个月后，中国研究团队IDEA-CCNL迅速训练并发布了Stable Diffusion的中文版本（称为太一-Stable Diffusion）。这个模型在捕捉中华文化背景方面做得更好。

Art generated by Taiyi-Stable Diffusion. “Iron horses running on a frozen river appearing in my dream, 3D painting” (line from Song Dynasty poet Lu You).

“Water flying down three thousand feet, oil painting” (line from Tang Dynasty poet Li Bai

中国生成式AI市场图谱

在应用层面，中国也落后于硅谷的初创企业生态系统。这再次挑战了中国AI实施领先于美国的说法。如果你将我们的中国市场图谱与我们之前的硅谷市场图谱进行比较，你会发现许多垂直领域在中国尚未开发。例如，中国很少有生成式AI公司致力于开发者工具的构建和提供编码协助。这可能是一个完全由西方公司主导的领域，因为在开发者工具市场上，文化、语言和政策障碍较少。

即使在现有的垂直领域，中国的参与者也往往比西方少。中国的文本、图像和音频生成初创企业在成熟到达西方水平之前还需要时间，而且可能很难找到足够大的市场。这是因为大多数西方文本和图像生成初创企业都是B2B公司，但中国的B2B市场规模要小得多。

这意味着中国的生成式AI格局更像是一片蓝海，竞争者较少，市场动态快速演变，对初创企业和投资者来说可能有更多的机会。难怪中国的科技巨头和顶级风险投资基金都在密切关注国内的生成式AI领域。

然而，中国的企业市场发展程度远不及美国，企业不愿意支付软件费用，更习惯于支付服务费用。我们可能会看到中国的AI公司创建一个本质上是“前端服务、后端AI软件”的商业模式。这些公司的行为可能与传统的SaaS公司有很大不同。

与拥有强大横向SaaS市场的美国不同，中国的AI驱动公司更适合深入发展，服务于少数大型行业领域，而不是更普遍地针对SaaS。在一些领域，中国领先于美国，包括电子商务、短视频制作，甚至可能还有游戏行业。实际上，我们已经看到中国生成式AI公司进入这些领域。花样科技（Fancy Technology），一家AI视频生成平台，专门针对电子商务企业。

由于文化障碍和政策限制，西方科技初创企业越来越放弃中国市场。中国可能会出现一个并行的生成式AI格局，在这个格局中，国内公司相互竞争，相对与硅谷同行隔离。

相同的技术，不同的垂直领域

然而，与其他领域类似，简单的“照搬至中国”模式通常并不奏效。在西方，基于文本的AI写作和营销工具是最受欢迎的生成式AI公司类型，但在中国这些工具要少得多。中国公司较小的销售和营销预算给盈利带来挑战。高质量中文训练数据的稀缺性在开发高性能语言模型方面造成瓶颈。更多地使用基于视频的营销意味着基于文本的内容的用例范围更狭窄。

相反，中国正在发展自己的生成式AI应用垂直领域。在基于文本的内容创建工具的情况下，许多产品不是为销售和营销提供服务，而是提供一般和学术写作支持以及翻译。受欢迎的AI写作工具火龙果（Pitaya）专注于提供学术写作辅助和英文写作翻译服务。这是因为中国庞大的学生群体通常在英语和学术写作方面面临困难，而其面向全球的公司需要员工用英语与外国同行沟通。

此外，一些中国基于文本的产品专注于特定用例甚至更狭窄的垂直领域。另一家领先的自然语言处理（NLP）初创公司LangBoat专注于金融文本分析。它使中国的金融机构能够从数千页的会议记录、合同和市场报告中快速提取关键数据点。尽管中国的综合性AI模型仍然落后于世界领先的模型，但使用大量领域数据构建特定垂直模型通常可以弥补性能差距，并通常产生更好的实际应用结果。

在生成式AI领域，中国发展尤为迅速的一个领域是AI视频生成，尤其是数字人和电子商务视频营销。与西方AI虚拟形象和数字人初创公司不同，后者往往优先考虑性能，中国公司更注重其虚拟形象的娱乐价值。只需比较一下伦敦AI视频初创公司Synthesia创建的AI虚拟形象与中国小冰生成的AI员工崔晓磐。Synthesia的虚拟形象看起来像是日常商务人士，而小冰的虚拟形象崔晓磐看起来像是K-pop偶像。

AI avatars created by Synthesia

Xiaoice-created AI employee Cui Xiaopan was awarded “Best New Employee of the Year” by real estate firm Vanke in 2021

数字人和AI虚拟形象在中国的媒体、娱乐和电子商务行业也得到了更广泛的应用。其中一个原因是这些AI虚拟形象具有更高的娱乐价值——它们的外观更好，创作者对媒体和娱乐有更好的认识。因此，消费者更愿意接受AI浪漫伴侣、电视主持人和抖音营销者。

另一个原因是中国的电子商务领域比基于文本或图像的更注重视频。中国拥有庞大的视频营销行业，企业通过直播和短视频销售产品。（请记住，中国是广受欢迎的短视频应用抖音的诞生地。）如果中国的几家AI视频初创公司突破并在全球范围内成为主导玩家，这并不令人惊讶。

然而，中国的生成式AI初创企业面临着与西方同行相同的挑战，包括寻找适用场景的问题以及长期商业化和盈利问题。例如，中国已经有很多AI图像生成器应用，但很少有建立可行业务模式的。大多数应用更像是玩具而非实用工具，一旦用户习惯了这项技术，它们可能会失去客户的关注。在中国投资者讨论生成式AI未来前景时，商业化问题经常被提及。

中国初创企业的全球雄心

谈论硅谷初创企业的全球市场计划是很正常的。但是，一提到中国公司的海外扩张，往往会引起西方观察家的警觉。然而，随着中国初创企业的成熟，“出海”是一个自然的步骤。随着中国科技格局的发展，越来越多的公司将从一开始就具备全球视野。

许多中国初创企业进入西方公司服务不足的市场。AI语音助手初创公司AI Rudder主要服务于东南亚市场，并提供近20种不同的语言和地方方言产品。公司最初在上海成立，很快在新加坡设立了办事处，服务东南亚市场。

AI时尚初创公司ZMO.ai也是在中国成立的，并获得了来自顶级中国风投基金如高瓴资本和纪源资本的投资。此后，该公司在美国和加拿大设立了办事处，并进入了北美市场。该公司为全球时尚品牌创建AI模型。

这些例子表明，中国的初创企业正逐渐实现全球化，进入新的市场，并在某些领域与西方竞争对手展开竞争。虽然在海外扩张的过程中可能会遇到文化差异、政策限制等挑战，但随着中国科技产业的不断发展和进步，我们可以预期更多的中国初创企业在全球市场上崭露头角。

AI model images generated by ZMO.ai

一方面，中国生成式AI公司希望扩展到全球市场，因为中国的B2B业务面临挑战。这在很大程度上是因为中国企业较少愿意为软件付费，因为中国的人力成本仍然较低。另一方面，拥有中国背景的创始人可能希望在中国保留他们的工程团队，以利用该国丰富且具有成本效益的工程人才，就像Zoom和字节跳动所做的那样。

监管即将到来

中国政府在监管生成式AI方面领先于西方同行。2022年11月，中国国家互联网信息办公室发布了《互联网信息服务深度合成内容管理规定》，一套针对合成内容的政策，包括AI生成的文本、图像和视频。这些规定已于2023年1月生效，包括风险评估、实名用户注册和标记AI生成内容的要求。

然而，随着生成式AI产品越来越受欢迎，其他道德和政策问题可能会出现。目前，AI生成的内容处于法律灰色地带，版权和知识产权归属尚不清楚。随着OpenAI的代码生成模型Codex因窃取GitHub开发者代码而面临诉讼，中西方的AI公司对知识产权问题变得更加谨慎。中国AI艺术生成初创公司TIAMAT确保其模型使用没有知识产权的数据进行训练。美国知名艺术生成器应用Midjourney也采取了这种措施。

美国制裁怎么办？

在分析中国生成式AI格局时，不能忽略美国日益收紧制裁的影响。2022年9月，美国政府禁止顶级芯片制造商英伟达（Nvidia）和AMD向中国出售其最先进的GPU。许多西方观察家认为，这一举措可能会大大阻碍中国开发大规模生成式AI模型，这些模型通常需要大量计算进行训练。

尽管如此，这种制裁对应用层初创公司的影响相对有限，因为很少有公司使用先进的GPU来训练和部署他们的AI模型。即使是中国科技巨头如百度的AI云业务也受到的影响很小，它们很少在业务中使用受制裁的GPU，长期来看，它们的目标是开发自己的GPU来替代进口产品。英伟达还为中国市场专门创建了GPU以避免制裁。

受到影响的将是依赖尖端GPU进行训练和扩展模型的中国基础研究机构。事实上，中国绝大多数大规模生成式AI模型都是在英伟达GPU上训练的，包括北京智源人工智能研究院（BAAI）的悟道1.0和悟道2.0模型、清华大学的多模态CogView模型以及百度的大规模语言模型ERNIE 3.0。

最近，拜登政府正在考虑对美国对华出口投资实施新的控制措施。这种限制的影响将取决于其范围和条件。早在美国政府开始考虑投资控制之前，北京已经对美元基金的投资活动实施了限制。尽管这些基金大部分位于中国，但由于其资金来源于国外，它们在很大程度上被排除在中国深度科技领域之外。美国对出口投资的额外限制将进一步加强美国和中国科技生态系统之间的隔阂。

总结思考

中国的生成式AI格局正在迅速发展，除了硅谷的生成式AI领域之外，它可能是最有趣的领域。中国是美国和英国之外唯一一个开发完整的“生成式AI技术栈”的国家——从基础模型到应用。由于中国市场在许多方面与西方截然不同，难怪中国的生成式AI领域与西方看起来大相径庭。与此同时，中国的创始人和投资者面临着与西方同行相同的生成式AI挑战，即创建可持续的商业模式和将炫酷技术商业化。中国开发者还面临着美国制裁和国内政策限制的额外挑战。

我们仍处于见证中国生成式AI生态系统崛起的初期阶段。或许与移动时代类似，在两个生态系统中，未来标志性的AI优先公司将呈现出非常不同的面貌。在美国，这些公司可能会迎合传统的企业用例，因为美国成熟的B2B软件市场；而在中国，一个拥有庞大的电子商务、供应链和消费领域的国家，我们预计将看到创业者从这些市场出发，打造具有竞争力的AI优先公司 。

即使考虑到基础研究能力的技术滞后和美中紧张关系不断加剧的压力，我们仍预计中国的市场和人才将继续为其社会及其他领域产生令人兴奋的公司。

Footnotes

[1] Admittedly, the model count for Chinese developers might be inflated because they tend to work together in model development and releases. This means that a single Chinese model might have multiple developers from different institutions.

原文出处：
Deep Dive： China’s Generative AI Landscape and How It Compares to the U.S.