时刻

Reddit 可能会禁止人工智能企业使用该网站收集数据

根据最近的一些信息,Reddit 可能会阻止人工智能初创公司的数据访问。据报道,该公司不希望第三方应用程序在未经批准的情况下训练其机器学习模型。通常,人工智能初创公司依赖网络内容进行聊天机器人训练。无需花费任何金钱,聊天机器人就可以接受训练来生成独家内容。

据《华盛顿邮报》报道,约有 535 家新闻机构对此表示反对。他们希望人工智能企业为用于训练人工智能模型的内容付费。因此,Reddit 等公司决定阻止这些初创公司从网络内容中抓取数据。

好吧,这一决定可能会影响 Google 和 Bing 爬虫,因为 Reddit 的内容不会出现在 Google 和 Bing 的搜索结果中。报道称,如果该公司未能与人工智能初创公司达成协议,它可能会废弃谷歌和必应的搜索爬虫。

除此之外,该报告还声称该公司希望用户登录其网站访问内容并放弃谷歌帐户。不过,该平台后来驳斥了这一说法。看来与谷歌唯一不一致的问题是搜索爬虫。一位不愿透露姓名的消息人士告诉《华盛顿邮报》,“Reddit 可以在没有搜索的情况下生存。”

所有这些信息都表明,该公司正在尽一切努力阻止谷歌搜索爬虫,以防它无法迫使谷歌为内容付费。 Reddit 发言人 Tim Rathschmidt 表示,目前还没有关于爬虫的信息。

另一方面,新闻机构非常关心免费使用其内容来训练人工智能模型。过去,新闻机构曾抗议谷歌和 Meta。他们要求分享。作为回应,科技巨头向他们施压,称新闻内容将在加拿大等某些市场被屏蔽。虽然这些组织仍有获得补偿的希望,但加州的 AB 886 法案可能会给加州新闻带来一些补偿。

X(Twitter)的所有者埃隆·马斯克(Elon Musk)此前曾攻击人工智能公司的数据抓取行为。后来,为了阻止数据抓取,他设置了读取限制,并向开发者收取访问平台 API 的费用。

分享此文章

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注