苹果、Anthropic等公司利用YouTube视频进行人工智能训练

可嘉小姐姐 • 2025年05月11日 06:14 • 百科栏目 • 阅读 15

　　 Proof News与《连线》(Wired)联合发表的一项调查显示，超过17万个YouTube视频是一个庞大数据集的一部分，该数据集被用于为一些最大的科技公司训练人...

Proof News与《连线》(Wired)联合发表的一项调查显示，超过17万个YouTube视频是一个庞大数据集的一部分，该数据集被用于为一些最大的科技公司训练人工智能系统。苹果、Anthropic、英伟达和Salesforce等科技公司都使用了未经许可从视频平台上窃取的“YouTube字幕”数据。训练数据集是取自YouTube超过48,000个频道的视频字幕的集合——它不包括视频中的图像。

来自比斯特和马奎斯·布朗利(Marques Brownlee)等热门创作者的视频，以及来自ABC新闻、BBC和《纽约时报》等新闻媒体的剪辑，都会出现在数据集中。来自The Verge的100多个视频以及来自Vox的许多其他视频都出现在数据集中。

“苹果已经从几家公司获取了他们的人工智能数据，”布朗利(绰号MKBHD)在x上的一篇帖子中写道，“其中一家公司从YouTube视频中抓取了大量数据/文本，包括我的视频。”他补充说:“在很长一段时间内，这将是一个不断演变的问题。”

YouTube没有立即回应The Verge的置评请求。

作为调查的一部分，Proof News还发布了一个交互式查找工具。你可以使用它的搜索功能来查看你的内容——或者你最喜欢的youtube用户的内容——是否出现在数据集中。

字幕数据集是非营利组织EleutherAI的一个更大的数据集的一部分，该数据集名为The Pile，是一个开源的数据集，还包含书籍、维基百科文章等数据集。去年，对一个名为book3的数据集的分析揭示了哪些作者的作品被用于训练人工智能系统，该数据集已被作者引用，用于起诉使用该数据集训练人工智能的公司。

人工智能公司很少愿意对进入其人工智能系统的数据透明;最近几个月，YouTube的内容究竟是如何被使用的一直是一个关键问题。今年3月，当OpenAI推出其强大的视频生成工具Sora时，首席技术官米拉·穆拉蒂(Mira Murati)一再回避有关该系统是否接受过YouTube视频训练的问题。

她当时对《华尔街日报》(the Wall Street Journal)表示:“我不打算详细说明所使用的数据，但这些数据是公开可用的或获得许可的数据。”当《华尔街日报》追问有关YouTube内容的具体问题时，穆拉蒂表示，她“对此不确定”。

在之前的采访中，YouTube首席执行官尼尔·莫汉(Neal Mohan)曾表示，使用视频内容来训练人工智能——包括成绩单——将违反该平台的条款。今年5月，在一期《解码器》节目中，谷歌首席执行官桑达尔·皮查伊同意莫汉的评估，即如果OpenAI真的训练了苍井空学习YouTube内容，就会违反YouTube的条款。

“我们有条款和条件，我们希望人们在开发产品时遵守这些条款和条件，这就是我的感受，”皮查伊说。

本文来自作者[可嘉小姐姐]投稿，不代表立金云立场，如若转载，请注明出处：https://wak.lijinyun.cn/wiki/202505-42.html

15 4

本文作者

可嘉小姐姐签约作者

0 文章

1 粉丝

我是立金云的签约作者[可嘉小姐姐],本篇文章《苹果、Anthropic等公司利用YouTube视频进行人工智能训练》主要讲述了:　　 Proof News与《连线》(Wired)联合发表的一项调查显示，超过17万个YouTube视频是一个庞大数据集的一部分，该数据集被用于为一些最大的科技公司训练人...

百科栏目

玩家必备“麻将双向无声振动器怎么使用”其实确实有挂

您好：麻将双向无声振动器怎么使用这款游戏是可以开挂的，软件加微信【添加图中微信】确实是有挂的，很多玩家在这款游戏中打牌都会发现很多用户的牌特别好，总是好牌，而且好像能看到其他人的牌一样。所以很多小伙伴就怀疑这款游戏是不是有挂，实际上这款游戏确实是有挂的，添加客服微信【添加图中微信】安装软件.1

一条小荷紫
2025年05月23日
0
百科栏目

法伦每周四晚播出

　　深夜电视观众逐渐减少，这类招牌节目每周的集数也在减少。美国全国广播公司的《吉米·法伦今夜秀》将在本月秋季开播，每周播出四期，而不是之前的五期。整个夏季，法伦的节目每周播出四个晚上，与其他深夜节目如NBC的《塞思·迈耶斯深夜秀》、CBS的《

一条小泽铭
2025年05月23日
0
百科栏目

教程解析“多乐升级透视软件下载”了解开挂过程

您好：多乐升级透视软件下载这款游戏是可以开挂的，软件加微信【添加图中微信】确实是有挂的，很多玩家在这款游戏中打牌都会发现很多用户的牌特别好，总是好牌，而且好像能看到其他人的牌一样。所以很多小伙伴就怀疑这款游戏是不是有挂，实际上这款游戏确实是有挂的，添加客服微信【添加图中微信】安装软件.1.多乐

一条小荷紫
2025年05月23日
0
作者专栏

教程解析“阿当比鸡辅助器”教你开挂详细

您好：阿当比鸡辅助器这款游戏是可以开挂的，软件加微信【添加图中微信】确实是有挂的，很多玩家在这款游戏中打牌都会发现很多用户的牌特别好，总是好牌，而且好像能看到其他人的牌一样。所以很多小伙伴就怀疑这款游戏是不是有挂，实际上这款游戏确实是有挂的，添加客服微信【添加图中微信】安装软件.1.阿当比鸡辅

一条小荷紫
2025年05月23日
0
百科栏目

玩家必备“桂林字牌透视软件演示版”(原来真的有挂)

您好：桂林字牌透视软件演示版这款游戏是可以开挂的，软件加微信【添加图中微信】确实是有挂的，很多玩家在这款游戏中打牌都会发现很多用户的牌特别好，总是好牌，而且好像能看到其他人的牌一样。所以很多小伙伴就怀疑这款游戏是不是有挂，实际上这款游戏确实是有挂的，添加客服微信【添加图中微信】安装软件.1.桂

一条小荷紫
2025年05月23日
0
知识分享

玩家实测“手机捕鱼输了10万报警有用吗”爆光开挂猫腻

您好：手机捕鱼输了10万报警有用吗这款游戏是可以开挂的，软件加微信【添加图中微信】确实是有挂的，很多玩家在这款游戏中打牌都会发现很多用户的牌特别好，总是好牌，而且好像能看到其他人的牌一样。所以很多小伙伴就怀疑这款游戏是不是有挂，实际上这款游戏确实是有挂的，添加客服微信【添加图中微信】安装软件.

一条小荷紫
2025年05月23日
0
科技世界

纽约市商界领袖积极应对社会主义者日益增强的城市管理影响

在联邦大陪审团对埃里克·亚当斯(EricAdams)提出重磅指控后，纽约市强大的商界正争先恐后地想办法应对一个社会主义者接管市政厅的真正可能性。据说，如果亚当斯因腐败丑闻而被迫辞职，或者被州长凯西·霍赫尔(KathyHochul)罢免，那么反对警察的左翼公共倡

一条小浩气
2025年05月23日
0
生活经验

科学直击“牵手跑胡子开挂神器”(必胜开挂神器)

您好：牵手跑胡子开挂神器这款游戏是可以开挂的，软件加微信【添加图中微信】确实是有挂的，很多玩家在这款游戏中打牌都会发现很多用户的牌特别好，总是好牌，而且好像能看到其他人的牌一样。所以很多小伙伴就怀疑这款游戏是不是有挂，实际上这款游戏确实是有挂的，添加客服微信【添加图中微信】安装软件.1.牵手跑

一条小荷紫
2025年05月23日
0
作者专栏

科普一下“4个人炸金花闷牌规律”(其实是有挂)

您好：4个人炸金花闷牌规律这款游戏是可以开挂的，软件加微信【添加图中微信】确实是有挂的，很多玩家在这款游戏中打牌都会发现很多用户的牌特别好，总是好牌，而且好像能看到其他人的牌一样。所以很多小伙伴就怀疑这款游戏是不是有挂，实际上这款游戏确实是有挂的，添加客服微信【添加图中微信】安装软件.1.4个

一条小荷紫
2025年05月23日
0
常识科普

专家警告：特朗普与金正恩的“情书”可能对海湖庄园事件造成不利影响

在一个充满奇奇怪怪的总统任期里，它几乎排在首位。这是唐纳德·特朗普与朝鲜领导人金正恩的关系，特朗普曾用“炮火和怒火”威胁金正恩，但后来他与金正恩建立了一种关系，并轻松地将其比作“爱情”。但专家表示，越来越多的证据表明，特朗普对与金正恩通信的骄傲可能会让他付出法律代

一条小新槐
2025年05月23日
1

发表回复

本站作者后才能评论

评论列表（4条）

可嘉小姐姐 2025年05月11日

我是立金云的签约作者“可嘉小姐姐”！

回复
可嘉小姐姐 2025年05月11日

希望本篇文章《苹果、Anthropic等公司利用YouTube视频进行人工智能训练》能对你有所帮助！

回复
可嘉小姐姐 2025年05月11日

本站[立金云]内容主要涵盖：国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

回复
可嘉小姐姐 2025年05月11日

本文概览：　　 Proof News与《连线》(Wired)联合发表的一项调查显示，超过17万个YouTube视频是一个庞大数据集的一部分，该数据集被用于为一些最大的科技公司训练人...

回复

苹果、Anthropic等公司利用YouTube视频进行人工智能训练

本文作者

文章推荐

发表回复

评论列表（4条）

联系我们