[新聞] 生成式AI LlaMA著作侵權案簡易判決出爐

作者: stpiknow (H)   2025-07-18 11:49:48
標題:生成式AI LlaMA著作侵權案簡易判決出爐 – 北加州法院再下一城Kadrey v. Meta
(中)
新聞來源:iknow科技產業資訊室
原文網址:https://reurl.cc/9n5p1O
原文:
七、判斷要素二:著作作品的性質
第二項要素認為,「有些作品比其他作品更接近著作權擬保護的核心,結果是當這類作品
被複製時,更難成立合理使用」。獲得較強著作權保護的作品,包括書籍和電影等具創意
性的作品;保護程度較低的則包括電腦程式碼。法院認為此要素二有利於原告,其書籍主
要為小說、回憶錄與劇本,是高度表達性的作品,屬於「著作權法所重視並欲保護的類型
」。即便其中一些作品屬於事實性內容(如自傳)而非小說,這一事實也不會改變本結論
,因為著作權仍保護作者「表達事實的方式」。
(一)功能性元素 v. 創造性表達
Meta則辯稱,這一要素無論如何都對Meta有利,因其使用原告書籍僅只是為了獲取其「功
能性元素」(functional elements),而不是為了利用其「創造性表達」(creative
expression)。Meta主要依賴第九巡迴上訴法院涉及「中介性複製」(intermediate
copying)的案件,在Sega Enterprises v. Accolade和Sony Computer v. Connectix這二
案,電玩公司複製一家電玩主機製造商受保護的程式碼,並對其進行逆向工程,以理解該
程式碼的某些功能性元素,使得該電玩公司能打造與原告產品相容的產品。在這二起案件
中,巡迴法院都認定,被告的合理使用抗辯成立,因為儘管被告複製了原告程式碼中的表
達性元素,但這樣做,只是為了存取程式碼中不受保護的功能性元素。
(二)詞彙順序、用詞選擇、文法與語法也是表達思想方式
本案法院認為,與上述案件中的使用情形不同,Meta對原告書籍的使用,確實依賴於書籍
中的創意表達。正如Meta自己所指出,LLM的訓練方式是透過學習「詞彙與概念之間的統
計關係」,並蒐集「關於詞彙順序、出現頻率(哪些詞被使用以及使用頻率)、文法與語
法」的統計資料。而這些項目正是人們表達思想的方式(即使在狹義的表達定義下,「詞
彙的排序與選擇」仍屬於一種表達)。因此,即使LLM所學的可能是「統計關係」,但這
些關係本身也是創意表達的產物,儘管Llama所「消化」而理解的這種表達的方式與人類
不同,情況仍然如此。
(三)本案不適用「中介性複製」案例
Meta為了支持其抗辯 – 即複製原告書籍是為了擷取非表達性資訊,因此主張應適用「中
介性複製」的案例,並援引Google Books案,但法院認為情況與本案不同。該案中原告是
一些作家,指控Google構成著作權侵害,因其將原告書籍製作數位化副本,並建置一個資
料庫供使用者搜尋,以查看資料庫中哪些書籍包含搜尋字詞。然而,與本案不同的,
Google案中所涉及的技術,對內容是中立的(content agnostic):即使資料庫中充滿亂碼
或以未知語言編寫的書籍,資料庫也不會運作得更好或更差。如果有人搜尋這些文字,那
些書籍就會出現在結果中。相較之下本案中,若Meta的LLM要生成高品質的文本,就必須
仰賴具連貫性且品質合理的訓練資料。換句話說,其需要高品質的表達內容。因此,「中
介性複製」的案例不適用於此。
不過,法院仍認為第二要素「在合理使用爭議的判斷中,很少扮演重要作用」。且當被複
製的作品已經發表,二次使用者無法干預創作者控制其作品首次公開作品的權利時,此要
素的適用力道將會「較弱」。因此,儘管第二要素對原告有利,但對整體分析的意義並不
大。
八、判斷要素三:使用部分相對於整體著作中的數量和實質性
此一要素評估「所使用部分的數量與實質性,對於複製之目的而言是否屬於合理範圍」。
因此,這一要素與第一要素相關,因為「可接受的複製範圍,會隨著使用目的與性質之不
同而有所差異」。法院認為,本案中複製的數量似乎不是特別相關的要素。例如,在涉及
音樂諷刺之最高法院Campbell v. Acuff-Rose Music案中,複製大量原曲內容,可能會增
加諷刺作品「替代市場的可能性」。
但就本案而言,有鑑於Meta的LLM,不會輸出原告書籍中任何有意義數量的實質內容。因
此,重點在「相關的考慮要素…不是複製者使用了多少受著作權保護的數量,而是『有多
少受著作權保護的內容公開給大眾』」。法院認為,即使複製原告書籍的全部內容,有鑑
於已構成轉化性之目的,複製數量是合理的,而二造都同意LLM訓練資料的品質越高,性
能越好,因此,為了訓練LLM,餵進(複製)整本書比半本書更有價值。在此背景下,使
用作品全部內容是「合理必要的」(reasonably necessary),故本要素對Meta有利。
九、判斷要素四:使用對著作權作品之潛在市場或價值的影響
本要素關注的是:「被指控侵權者之特定行為,對市場造成的損害程度」,以及「被告所
從事此類不受限制且廣泛進行的作為,是否會對原作的潛在市場產生實質不利影響。」。
與此要素相關的「唯一損害」,是「市場替代所造成的損害」。相對而言,如果二次創作
透過批評或諷刺而扼殺了原作需求,則此類損害並不被著作權法所認可。而與此要素相關
的,還包括「複製可能產生的公共利益」。
(一)第四項要素是合理使用分析中最重要的要素
法院認為,第四項要素「無疑是合理使用分析中最重要的單一要件」。因此,Meta所主張
「因第一項要素對其極為有利,因此分析應止於此」的說法是錯誤的。相反的,基於第四
項要素的重要性,可以很容易地想像一種情況:即便某項二次使用具有高度轉化性,但若
允許大眾從事該使用,會對原作市場造成過大的影響時,仍可能導致合理使用抗辯失敗。
同樣的,在某些第一要素明顯有利於被告的案件中,原告若欲擊敗合理使用主張,則僅有
掌握第四要素來取得逆轉勝的機會。
(二)生成式AI對原告作品市場造成損害之三種方式
法院先設定,在涉及使用受著作權保護的作品,來訓練生成式AI模型的案件中,權利人即
原告可能會提出至少三種方式,主張被告的複製行為對其作品市場造成損害(或者如果此
類複製行為廣泛傳播,將對市場造成損害):
首先,權利人可能主張,該模型會「吐出」其作品(重現與其實質相似的輸出內容),因
此讓使用者可透過模型,免費取得這些原作或其替代品。
其次,權利人可能指出,其作品授權用於AI訓練的市場,並主張未經授權的複製行為損害
了該市場(或阻礙該市場的發展)。
第三,權利人可能進一步主張,即使該模型無法重現其原作或產出實質相似的內容,它仍
能生成在題材或類型上足夠相近的作品,進而與原作競爭而構成「間接替代」
(indirectly substitute)。
在本案中,前兩項主張皆不成立;第三種主張雖然相對較具潛力,但原告的論述過於薄弱
,以致於既無法改變整體分析結果,甚至連提出足以反駁簡易判決的事實爭點都做不到,
法院茲就此三點展開討論。
1. Llama不會「吐出」重現原告實質相似的內容
如果Llama能用來生成原告書籍的大量內容,或是產出與其書籍高度相似、以至於構成侵
權的文本,那這將會威脅到原告書籍的市場,因為人們可能會轉而閱讀這些輸出內容。但
本案中,此種損害理論並不成立,如上所述,Llama並不會讓使用者從原告書籍中,生成
任何有意義的段落。雙方的專家證人都不認為,Llama能從任何一本原告書籍中,重現超
過50個字的內容,即便是在使用刻意設計來試圖讓LLM「吐出」原文的「對抗性提示」情
況下也是如此。
相較在Google Books案中,第二巡迴上訴法院裁定,儘管該服務讓使用者看到總計高達一
本書16%的片段,但該二次使用「並未對著作權人之著作價值,造成任何實質性的損害威
脅,也未削弱其從著作權中獲得的收益」。本案由於原告的專家證人也承認,Llama不會
生成其中「任何顯著比例」的書籍內容。特別是Llama即使在「對抗性提示」刻意操控下
,Llama也只能重現原告書中極少部分的內容,這並不足以對原告書籍的「潛在市場或價
值」產生「重大或顯著的影響」。
2. Meta複製行為損害原告之授權市場
原告關於市場損害的主要理論是,Meta未經授權使用其書籍進行LLM訓練,損害了將其書
籍用於該目的之授權市場。原告幾乎將其對第四項要素的全部討論,都集中在這個理論上
。因此,雙方就關於「是否存在一個可供通常交易書籍之授權市場,或該市場是否有可能
發展」一事,展開冗長的辯論。
但法院認為,該市場是否存在或是否可能發展,其實都不重要,因為原告法律上並無權壟
斷這樣的市場。在每宗合理使用案件中,如果將潛在市場定義為,作為所涉及授權使用理
論上的市場,那麼「原告都會遭受潛在市場之損害」。因此,為避免第四項要素的分析陷
入循環論證,並在每個案件中都偏向權利人,針對轉化性使用目的而導致授權費損失的傷
害,不應被視為可認定的損害。
3. Meta生成相近作品進而與原作競爭構成「間接替代」
使用受著作權保護的書籍來訓練LLM,對這些作品之市場可能造成損害的方式,是這種訓
練可能促成大量作品的快速生成,即使這些作品本身雖不構成侵權,卻會與原作競爭。人
們可能利用LLM來創作書籍並販售,與由人類作者創作的書籍在銷售和讀者注意力上競爭
。因本案法院最重視此點,遂進而就此展開「市場稀釋」與「間接替代」之法律論述。
(三)「市場稀釋」與「間接替代」所造成損害
1. 「市場稀釋」之損害係「間接替代」造成
由於透過提示讓LLM生成書籍可能非常容易,人們甚至會將這些書籍免費釋出。這類競爭
所造成的損害,即為「市場稀釋」(market dilution)所導致之損害。而此種損害是「間
接替代」所造成,而非「直接替代」[1](後者即前述第一種損害形式)。當然,並非所
有受著作權保護的作品,在面對AI生成內容競爭時,都會受到相同程度的「市場稀釋」。
例如AI所生成的書籍,似乎不太可能有效地搶走知名作者的銷售量,因為讀者購買這些書
主要是為了該特定作者的作品。但可輕易想見的,AI生成的書籍很可能會成功擠壓不太知
名、或新銳作者的作品市場。
對於某些特定類型的作品,這種市場影響似乎更為明顯。例如,一個能隨意產生高品質圖
像的AI模型,可能會極大程度地影響此類圖像的市場,從而大幅削弱人類創作這些圖像的
動力;而一個能產生有關時事之準確資訊的LLM,則可能對紙本新聞市場造成嚴重打擊;
某些非小說的作品(例如,關於如何照顧園藝的書籍)的市場,也可能因LLM能輕易生成
該主題的書籍而大幅萎縮。至於小說作品的影響,則可能取決於作者或作者創作的體裁。
2. 應注意作品本身差異性所帶來不同之市場影響
以上這些差異,可能部分是源自於某些作品本身相對偏重「功能性」,而較不依賴「作者
的創意」。例如,在選擇新聞文章時,讀者所期望的是清晰、準確、簡潔地傳達一則當前
或過去事件的內容。相較之下,讀者在選擇小說時,往往更重視多層面的特質,例如主題
深度、寫作風格、情節設計與角色發展等,或更偏好情節曲折、富有變化,或能細膩描繪
人物發展的作品,而這些元素在很大程度上有賴於作者的創造力。
雖然新聞文章同樣體現了作者的創意(特別是在結構與措辭方面),但一般而言,普通小
說比新聞文章包含更多創意,而這些創意選擇對普通小說的品質更加重要。與此相關可以
想像的,人們也許更在意一部小說是否為AI生成(非人類創造力的產物),而不是新聞文
章是否由AI撰寫。
3. 評估「市場稀釋」時應比較之對象
應注意的是,在評估「市場稀釋」時,應該比較的對象並非「沒有LLM的世界」,而是「
未接受過以著作權保護書籍作為訓練資料的LLM世界」。根據現有證據,書籍作為訓練資
料,確實能大幅提升LLM的創造力和生成長篇文本的能力,由於LLM所受訓練的文本越多,
其表現通常越好。因此,若模型僅以公有領域作品訓練,其能力在一般條件相同的情況下
,預料會遠落後於同時接受著作權保護書籍訓練的模型。因此,如LLM以受保護書籍進行
訓練,在大多數情況下似乎更能使LLM創作更好作品,從而對其訓練資料中的書籍產
生「市場稀釋」。
4. AI輸出相似度較低內容仍可能導致市場替代
反之,Meta則認為「市場稀釋」不應列入第四要素考量。其認為只有當LLM的輸出本身構
成侵權,也就是LLM「重製著作權作品」或「產出與其實質相似的內容」時,其結果造成
的這種損害才具有相關性。但法院認為這種說法並不正確,如果LLM能重現那些受保護作
品,或生成實質相似的文本,複製書籍的市場將受到損害當然較為明確。但是,即使是相
似度較低的輸出內容,例如同一主題或類型相近的書籍,也仍然能在市場上與訓練資料中
的原著書籍競爭,透過分散搶走原書的銷售額,或是讓大量類似書籍充斥實體與線上書店
,導致原書無法被人注意和購買,這些結果都會削弱創作者創作的誘因

Links booklink

Contact Us: admin [ a t ] ucptt.com