NVIDIAのAI学習スクリプトは「侵害目的のみ」?米裁判所が衝撃の判断
📰 ニュース概要
- 訴訟の進展: 作家陣がNVIDIAを相手取った著作権侵害訴訟で、米連邦地裁のジョン・ティガー判事はNVIDIAによる却下請求の大部分を棄却した。
- スクリプトの指摘: NVIDIAが「The Pile」(海賊版データBooks3を含む)をDLするために配布したスクリプトが、侵害を助長する「寄与侵害」にあたると判断された。
- 司法の基準: 過去の判例(SonyやCox)とは異なり、今回のスクリプトは「侵害を加速させる以外の目的がない」と厳しく評価されている。
💡 重要なポイント
- NeMo Megatronへの影響: NVIDIAの独自モデル「NeMo Megatron」のトレーニングに、海賊版サイト由来のデータセットが使用された疑いが濃厚となっている。
- ビットトレントの扱い: NVIDIA側はBitTorrentプロトコルに関する主張の除外を求めたが、判事は「ビットトレントは単なる道具(ペンキの筆のようなもの)」として、この主張を退けた。
- 一部勝訴: 「代位責任(Vicarious Infringement)」に関する訴えについては、NVIDIA側の主張が認められ棄却された。
🦈 サメの眼(キュレーターの視点)
今回の判断で最も震えるのは、判事が「スクリプトには侵害以外の目的がない」と言い切った点だサメ![shout] つまり、NVIDIAが提供した便利なツールが、法廷では「海賊版データを盗むためのバール」扱いされたってことだサメ。これまでは「技術自体には正当な用途がある(Sony判決)」という理屈で逃げ切れるケースが多かったけど、今回のスクリプトは「データセット収集に特化しすぎていた」のが運の尽きだったサメね。AI開発の現場で『効率化』のために作られたツールが、逆に企業の首を絞める武器になる……開発者は震えて眠るしかないサメ!
🚀 これからどうなる?
今回の決定により、訴訟は「証拠開示(ディスカバリー)」の手続きへと進むサメ。NVIDIAがどのようにデータを収集し、社内でどのような議論が行われていたかが白日の下にさらされる可能性があるサメ。メタ(Meta)も同様の訴訟を抱えているけど、AI業界全体の「学習データの清廉性」がかつてないほど厳しく問われる時代に突入するサメ!
💬 はるサメ視点の一言
道具に罪はないなんて甘いことは言ってられないサメ!「侵害専用ツール」認定はAI界の激震ニュースだサメ!🦈⚡️
📚 用語解説
-
Books3: 海賊版サイト「Bibliotik」から抽出された、約19万冊の書籍を含む巨大なAI学習用データセット。
-
寄与侵害(Contributory Infringement): 他者の著作権侵害を、意図的に助長したり、必要な手段を提供したりする行為。
-
The Pile: 800GBを超えるオープンソースの巨大テキストデータセット。この中にBooks3が含まれている。
-
情報元: Judge: Nvidia’s Shadow Library Scripts ‘Have No Other Purpose’ Than Infringement