ASF 生成式工具指南（版本1.0）

对 ASF 项目的贡献能否包括人工智能生成的内容？

Apache-2.0 许可协议和 Apache 个人贡献许可协议（ICLA）都提醒贡献者，他们有责任披露所提交贡献中任何非其本人原创且受版权保护的材料。在使用生成式人工智能工具时，以及在使用来自公共网站的资料或其他开源项目的代码时，这一点同样适用。

在披露这些材料时，投稿人还应说明这些材料的许可协议情况。ASF 制定了《第三方许可政策》[1]，就可接受的许可协议提供指导意见，并说明如何处理第三方作品[2]。

虽然一般来说，非人类（如机器或猴子^[3])生成的内容不具有版权，但如果内容由人工智能生成的部分和人类撰写的其他部分组成，则人类撰写的部分可能具有版权。

正如以下美国版权局注册指南^[4](3/16/2023）所解释的那样：

“例如，人类可以选择或安排人工智能生成的材料，使其具有足够的创造性，“由此产生的作品整体上构成原创作品。” 或者，艺术家可以对人工智能技术最初生成的材料进行修改，使修改达到版权保护的标准。在这些情况下，版权将只保护作品中人类创作的部分，这些部分‘独立于’人工智能生成的材料本身，并且‘不影响’其版权地位。”

这些由人类撰写的部分可能仅仅来自人类提供的提示或随后做出的修改。不过，生成式人工智能的一个突出问题是有可能复制其所训练的材料的部分内容，其中一些可能是受版权保护的主题。因此，在使用生成式人工智能工具时，建议使用具有以下功能的工具：识别任何与工具训练数据相似的内容，以及该内容的许可证。

鉴于以上所述，如果贡献者能确保全部或部分使用人工智能生成的代码可以被用于贡献：

1、生成式人工智能工具的条款和条件没有对输出结果的使用施加任何与开源定义（OSI - Open Source Definition）不一致的限制（例如，ChatGPT 的条款就不一致）。

2、至少满足以下条件之一：

① 输出不受版权保护的主题（即使由人制作也不属于可受版权保护的主题）；

② 输出结果中不包括第三方材料；

③ 输出结果中包含的任何第三方材料都是在第三方版权持有者的许可下（例如，在兼容的开源许可协议下）使用的，并遵守了适用的许可条款。

3、如果人工智能工具本身提供了关于可能已被复制的材料的足够信息，或从代码扫描结果中获得了足够的信息，那么贡献者就可以合理地确定条件 2.2 或 2.3 已经满足。

例如，AWS CodeWhisperer 最近增加了一项功能，提供通知和归属。

在提供使用生成式人工智能工具撰写的贡献时，推荐的做法是贡献者注明创建贡献时使用的工具。这应作为一个标记包含在源代码控制提交信息中，例如包含 "Generated-by: " 短语。这样就可以考虑在未来发布工具时，将这些内容提取到一个机器可解析的工具证明文件中。

最后，请注意，尽管上述内容在2023年6月看来是一套合理的指导方针，但这是一个快速发展的领域。无论我们今天向项目管理委员会（PMC）建议什么，相关政策都需要适时重新评估和更新，以适应以下情况：

法律的变化
人工智能技术和相关工具的变化（例如，随着人工智能模型的发展，(1) 能够在复制其训练所依据的部分资料时发出通知，或 (2) 能够根据指示复制经过许可（或以其他方式兼容 Apache 许可协议 2.0）的授权源材料
开源软件使用者对风险和模糊性容忍度的变化

我们将继续与项目管理委员会（PMC）和 ASF 成员沟通，讨论以及更新常见问题（FAQ）的内容。

文档如何处理？

上述内容同样适用于文档。不过，最流行的文档工具 ChatGPT 有限制性许可，因此应谨慎使用。

图像如何处理？

与文档一样，上述原则仍然适用。尽管图像是一种非文本形式，但其细节很快就会变得复杂。我们预计这将继续是一个快速发展的领域。

如果贡献中包含人工智能生成的内容，而该内容被识别出抄袭或复制的材料，我们该怎么办？

与其他任何贡献一样，请参考第三方许可政策^[5]。

参考资料：

[1]https://www.apache.org/legal/resolved.html

[2]https://www.apache.org/legal/src-headers.html#3party

[3]https://zh.wikipedia.org/zh-hans/%E7%8C%B4%E5%AD%90%E8%87%AA%E6%8B%8D%E7%85%A7%E8%91%97%E4%BD%9C%E6%AC%8A%E7%88%AD%E8%AD%B0

[4]https://www.federalregister.gov/documents/2023/03/16/2023-05321/copyright-registration-guidance-works-containing-material-generated-by-artificial-intelligence

[5]https://www.apache.org/legal/resolved.html

转载自 | 开源雨林

作者｜Apache 软件基金会
翻译｜刘天栋 Ted

编辑 | 谢丹琪

相关阅读 | Related Reading

探索 AI+开源的未来：Open Source Congress@日内瓦

一场深刻的开源聚会：KCC@北京 9.2 活动回顾

开源社简介

开源社（英文名称为“KAIYUANSHE”）成立于 2014 年，是由志愿贡献于开源事业的个人志愿者，依 “贡献、共识、共治” 原则所组成的开源社区。开源社始终维持 “厂商中立、公益、非营利” 的理念，以 “立足中国、贡献全球，推动开源成为新时代的生活方式” 为愿景，以 “开源治理、国际接轨、社区发展、项目孵化” 为使命，旨在共创健康可持续发展的开源生态体系。

开源社积极与支持开源的社区、高校、企业以及政府相关单位紧密合作，同时也是全球开源协议认证组织 - OSI 在中国的首个成员。

自2016年起连续举办中国开源年会（COSCon），持续发布《中国开源年度报告》，联合发起了“中国开源先锋榜”、“中国开源码力榜”等，在海内外产生了广泛的影响力。

ASF 生成式工具指南（版本1.0）

猜你喜欢