※この記事はアフィリエイト広告を含みます
NVIDIA的AI学习脚本仅为“侵权目的”?美国法院震惊裁决
📰 新闻概述
- 诉讼进展: 作家团队对NVIDIA提起的著作权侵权诉讼中,美国联邦地方法院的约翰·蒂戈法官驳回了NVIDIA大部分的驳回请求。
- 脚本的指控: NVIDIA为下载包含“海盗版数据Books3”的“The Pile”而分发的脚本,被认定为助长侵权的“贡献侵权”行为。
- 司法标准: 与以往的判例(Sony和Cox)不同,此次脚本被严格评估为“没有其他目的,只有加速侵权”。
💡 重要要点
- 对NeMo Megatron的影响: NVIDIA的独特模型“NeMo Megatron”在训练中使用了来自海盗版网站的数据集的嫌疑加重。
- BitTorrent的处理: NVIDIA方面请求排除与BitTorrent协议相关的主张,但法官驳回了这一主张,指出“BitTorrent仅是一种工具(就像画笔一样)”。
- 部分胜诉: 关于“代位责任(Vicarious Infringement)”的诉求,NVIDIA方面的主张被认可并驳回。
🦈 鲨鱼的视角(策展人的观点)
此次裁决最震惊的地方在于,法官直言“脚本没有其他目的,只有侵权”![shout] 也就是说,NVIDIA提供的便利工具在法庭上被视作“盗取海盗版数据的撬棍”。之前常有“技术本身有正当用途(Sony判决)”的辩解,但此次脚本因“过于专注于数据集收集”而陷入困境。为了提升AI开发效率而制作的工具,反而可能成为企业的绊脚石……开发者们只能战战兢兢地入睡了鲨鱼!
🚀 接下来会怎样?
此次裁决将使诉讼进入“证据披露(Discovery)”程序。NVIDIA将如何收集数据,以及内部讨论的情况有可能被公之于众。Meta也面临类似的诉讼,但AI行业整体的“学习数据清白性”正面临前所未有的严峻考验鲨鱼!
💬 鲨鱼的看法一句话
说工具没有罪这可太天真了鲨鱼!“侵权专用工具”的认定是AI界的震撼新闻!🦈⚡️
📚 术语解读
-
Books3: 从海盗版网站“Bibliotik”提取的,包括约19万本书籍的巨大AI学习数据集。
-
贡献侵权(Contributory Infringement): 故意助长他人著作权侵权,或者提供必要手段的行为。
-
The Pile: 超过800GB的开源巨大文本数据集,其中包含Books3。
-
信息来源: Judge: Nvidia’s Shadow Library Scripts ‘Have No Other Purpose’ Than Infringement