苹果、Anthropic等公司利用YouTube视频进行人工智能训练

   Proof News与《连线》(Wired)联合发表的一项调查显示,超过17万个YouTube视频是一个庞大数据集的一部分,该数据集被用于为一些最大的科技公司训练人...

  

Proof News与《连线》(Wired)联合发表的一项调查显示,超过17万个YouTube视频是一个庞大数据集的一部分,该数据集被用于为一些最大的科技公司训练人工智能系统。苹果、Anthropic、英伟达和Salesforce等科技公司都使用了未经许可从视频平台上窃取的“YouTube字幕”数据。训练数据集是取自YouTube超过48,000个频道的视频字幕的集合——它不包括视频中的图像。

来自比斯特和马奎斯·布朗利(Marques Brownlee)等热门创作者的视频,以及来自ABC新闻、BBC和《纽约时报》等新闻媒体的剪辑,都会出现在数据集中。来自The Verge的100多个视频以及来自Vox的许多其他视频都出现在数据集中。

“苹果已经从几家公司获取了他们的人工智能数据,”布朗利(绰号MKBHD)在x上的一篇帖子中写道,“其中一家公司从YouTube视频中抓取了大量数据/文本,包括我的视频。”他补充说:“在很长一段时间内,这将是一个不断演变的问题。”

YouTube没有立即回应The Verge的置评请求。

作为调查的一部分,Proof News还发布了一个交互式查找工具。你可以使用它的搜索功能来查看你的内容——或者你最喜欢的youtube用户的内容——是否出现在数据集中。

字幕数据集是非营利组织EleutherAI的一个更大的数据集的一部分,该数据集名为The Pile,是一个开源的数据集,还包含书籍、维基百科文章等数据集。去年,对一个名为book3的数据集的分析揭示了哪些作者的作品被用于训练人工智能系统,该数据集已被作者引用,用于起诉使用该数据集训练人工智能的公司。

人工智能公司很少愿意对进入其人工智能系统的数据透明;最近几个月,YouTube的内容究竟是如何被使用的一直是一个关键问题。今年3月,当OpenAI推出其强大的视频生成工具Sora时,首席技术官米拉·穆拉蒂(Mira Murati)一再回避有关该系统是否接受过YouTube视频训练的问题。

她当时对《华尔街日报》(the Wall Street Journal)表示:“我不打算详细说明所使用的数据,但这些数据是公开可用的或获得许可的数据。”当《华尔街日报》追问有关YouTube内容的具体问题时,穆拉蒂表示,她“对此不确定”。

在之前的采访中,YouTube首席执行官尼尔·莫汉(Neal Mohan)曾表示,使用视频内容来训练人工智能——包括成绩单——将违反该平台的条款。今年5月,在一期《解码器》节目中,谷歌首席执行官桑达尔·皮查伊同意莫汉的评估,即如果OpenAI真的训练了苍井空学习YouTube内容,就会违反YouTube的条款。

“我们有条款和条件,我们希望人们在开发产品时遵守这些条款和条件,这就是我的感受,”皮查伊说。

本文来自作者[笑松]投稿,不代表高八度资讯立场,如若转载,请注明出处:https://wap.gaobadu.top/wiki/202504-728.html

(3)

文章推荐

  • Osel Devices今日上市:了解发行规模、价格区间、GMP及更多信息

    剧情简介OselDevices中小企业IPO开始接受认购今天申请,9月19日截止。该公司计划通过发行441万股新股筹集7.1亿卢比,每股定价为155-160卢比。所得款项将用于偿还债务、营运资金和一般公司用途。OselDevices中小

    2025年05月25日
    0
  • 前北约高层获得新职位

    盖蒂图片社/西方主导的北约组织宣布,前秘书长延斯·斯托尔滕贝格将于明年主持慕尼黑国际安全会议。MSC在周二发布的一份新闻稿中表示,在2025年2月召开的第61届会议后,这位挪威政治家将接替德国外交官克里斯托夫·豪斯根。上个星期,斯托尔滕贝格被荷兰前首相马

    2025年05月25日
    0
  • 币安交易失利,FTX加密货币投资者面临资金危机

      自1990年以来,安大略省教师养老金计划为近20万名教育工作者管理着数千亿美元的资产,持有从机场到购物中心等传统投资项目的股份。但周四,这家加拿大养老基金在一份声明中警告称,它遭受了一场更具另类的赌博的打击:该基金在去年的一轮融资中,向陷入困境的全球加密货币交

    2025年05月25日
    0
  • 比利·简·金荣获国会金质奖章,众议院进行历史性投票

    (TheHill)周二,众议院以压倒性多数投票将国会金质奖章授予网球传奇人物、平等权利倡导者比利·简·金,这是美国首次将最高平民荣誉授予女性个人运动员。去年9月,这位网球名人堂成员在1973年的“性别之战”中战胜鲍比·里格斯(BobbyRiggs)50周年之际

    2025年05月25日
    0
  • 加密货币泡沫破裂的原因解析

    亚当•拉辛斯基是《财富》杂志的前执行编辑,著有《苹果内部:美国最受尊敬、最神秘的公司是如何运作的》一书。加密货币泡沫的破裂将以其他投机热潮的方式结束:在公司、各大洲和不幸的投资者之间留下一连串的残骸。加密货币经历了可怕的一年。我们看到“稳定币”在5月份消失,FTX

    2025年05月25日
    0
  • 战场州选举官员驳斥非公民投票的谣言

      密歇根州安娜堡。——在2024年大选前,来自两党的重要州选举官员正在反驳一个普遍存在的谎言:非公民正在大量投票。来自六个摇摆州的国务卿、选举主任和县官员在一次会议上详细阐述了他们如何确保只有美国公民在总统选举中投票。这次会议旨在强调美国选举制度的完整性和有效性

    2025年05月25日
    0
  • 斐济当局计划限制游客访问拉比岛

      在斐济,一位非民选的官员要求游客在前往拉比岛之前必须获得他的批准。拉比岛的行政官IakobaKarutake发布了一项政策声明,指出非巴纳班人访问该岛时必须向当地警方登记。他表示,未获得他许可的计划与巴纳班社区进行协商

    2025年05月25日
    0
  • 乔治王子、夏洛特公主和路易王子的保姆被限制使用某个常见词汇

    威廉王子和凯特王妃去年从肯辛顿宫搬到了温莎,但这对皇室夫妇仍然保留着一些熟悉的面孔。在乔治小王子只有几个月大的时候,他们就雇了保姆MariaBorrallo,从此她就一直是这个家庭的常客。虽然Borrallo不再和这家人住在一起,他们现在住在温莎

    2025年05月25日
    0
  • Gardaí寻求协助寻找失踪少年

    Gardaí正在寻求公众的帮助,以追踪14岁的卡卢姆·卡瓦纳的下落,他自12月29日星期五凌晨在基尔代尔州阿西市失踪。据描述,这名少年身高约5英尺6英寸,身材苗条,浅棕色头发,蓝眼睛。Gardaí和Calum的家人都很关心他的

    2025年05月25日
    3
  • 德国企业在8月份士气再度下滑

      一项备受关注的调查显示,德国八月份的商业信心进一步下降,欧洲最大的经济体正在努力摆脱疲软时期。Ifo经济研究所(IfoInstitute)的信心指标从7月份的87点降至86.6点,该指标基于对约9,000家公司的调查。Ifo总裁ClemensFuest表示,"德国企业信心呈

    2025年05月25日
    3

发表回复

本站作者后才能评论

评论列表(4条)

  • 笑松
    笑松 2025年04月27日

    我是高八度资讯的签约作者“笑松”!

  • 笑松
    笑松 2025年04月27日

    希望本篇文章《苹果、Anthropic等公司利用YouTube视频进行人工智能训练》能对你有所帮助!

  • 笑松
    笑松 2025年04月27日

    本站[高八度资讯]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 笑松
    笑松 2025年04月27日

    本文概览:   Proof News与《连线》(Wired)联合发表的一项调查显示,超过17万个YouTube视频是一个庞大数据集的一部分,该数据集被用于为一些最大的科技公司训练人...

    联系我们

    邮件:高八度资讯@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们