OpenAI推出新产品GPTBot：可爬取网络数据，为GPT-5做准备 - 代码天地

OpenAI推出新产品GPTBot：可爬取网络数据，为GPT-5做准备

业界资讯 2023-08-15 21:00:06 阅读次数: 0

昨天发的《量子论公众号是如何半年做到10000粉的？》，好像没人感兴趣，那以后不发此类话题了。

今天的内容也是翻看Hacker News上的帖子里发现的。

近期，OpenAI官网介绍了一款新产品GPTBot。可是，这款产品对我们没什么用，它是给OpenAI自己使用的。

官网上挂个说明，可能是为了宣布有这么个事，如果你感到权益受损，可以按文档中的操作进行阻止。

GPTBot其实是一个网络爬虫。

网络爬虫，有时称为网络蜘蛛，是一种为互联网上的网站内容编制索引的机器人。

像谷歌百度这样的搜索引擎会使用它们，以便网站显示在搜索结果中。

OpenAI表示，网络爬虫将从互联网上收集公开可用的数据，但会过滤掉需要付费内容的来源，或者已知收集个人身份信息的来源，或者包含违反其政策的文本。

GPTBot可用来抓取海量数据训练和优化未来的AI模型。不少国外科技媒体八卦认为，这个未来的AI模型剑指GPT-5。

上个月，OpenAI提交了GPT-5商标申请，此时又放出这个网络爬虫，确实可以联想出，GPT-5离我们越来越近了。

OpenAI已公开GPTBot的IP地址，网站所有者除了可以通过向服务器上的标准文件添加“disallow”命令来拒绝GPTBot访问外，还能以IP地址为单位阻止GPTBot的访问。

此前，OpenAI抓取公开数据来训练专利AI模型的行为备受争议。

Reddit和Twitter等网站已经采取措施拒绝AI公司免费使用其网站内容的行为，还有一些作者和其他创作者也因为AI公司涉嫌未经授权使用其作品而提起了诉讼。

ChatGPT今日宣布推出6大新功能，体验效果更佳

AI在抢饭碗！澳洲最大报业集团启用AI每周自动生成新闻3000篇

香港岭南大学已为全校购买ChatGPT许可证，并对师生提供培训

GPTBot文档链接：

https://platform.openai.com/docs/gptbot

猜你喜欢

转载自blog.csdn.net/wy17910/article/details/132294208

OpenAI推出新产品GPTBot：可爬取网络数据，为GPT-5做准备

为开发GPT-5，OpenAI向微软寻求新融资

GPT-5出世？OpenAI GPT-5商标已注册

华为即将推出新产品Wi-Fi 6

GPT-5暂时来不了 OpenAI悄然布局移动端

OpenAI 已提交 GPT-5 商标申请

OpenAI 已为 GPT-5 申请商标，GPT-4 发布不到半年，GPT-5 就要来了吗？

Hazel游戏引擎（096）为鼠标拾取帧缓冲的数据做准备

Samtec与Neoconix达成合作并和II-VI推出新产品

为毕业做准备

ChatGPT遭多国调查，OpenAI凌晨就安全问题发文，GPT-5要暂缓？

OpenAI公布「官方爬虫」：GPT-5靠它训练，有需要可以屏蔽

GPT-5、开源、更强的ChatGPT！OpenAI公布2024年计划

IBM为智能仪表推出新软件产品

GPT-5年底上线？初创公司Runway CEO再爆料：OpenAI员工相信GPT-5有望成AGI

为程序大赛做准备

为压力面做准备

leaflet为页面做准备:

GPT-5不能停！吴恩达、LeCun反对千人联名！OpenAI CEO也发声了...

OpenAI CEO：安全对我们很重要但我们没有训练GPT-5

ChatGPT 之父承认 GPT-5 并不存在，为什么 OpenAI 总是这么实诚？｜万字详述

GPT-5来了？OpenAI被曝加急训练多模态大模型Gobi，一举狙杀谷歌Gemini！

爆！！！GPT-5今年Q4推出，实现通用AI，世界将天翻地覆巨变！

OpenAI公布GPT4的爬虫工具-GPTBot，遵守爬虫协议，可用于模型训练

GPT-5、开源、更强的ChatGPT！

GPT-5，奥特曼最新剧透

Mozilla正式为Firefox系列产品及服务推出新Logo与视觉设计

为面试做准备（七）

为面试做准备（四）

为面试做准备（五）

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)