中文字幕成线人熟女,成人夜趣福利视频第一导航,国产成人综合久久二区

OpenAI微軟被訴侵權(quán)!大模型時代下的版權(quán)問題該如何處理？

2023-12-25 16:06

作者：小巖

編輯：彩云

最近，OpenAI在自己的產(chǎn)品研發(fā)上開足馬力，與Google的大模型之戰(zhàn)進(jìn)行得如火如荼。不過，令人頗感意外的是，此時的OpenAI竟然成為了被告，被投訴侵權(quán)，并且還連帶著它背后的大股東微軟一起。

多名普利策獎得主起訴 OpenAI與微軟：濫用自己作品訓(xùn)練大模型。

根據(jù)路透社消息，當(dāng)?shù)貢r間12月21日，共計11位非虛構(gòu)類書籍的作者在曼哈頓聯(lián)邦法院提起訴訟，指控OpenAI 和微軟濫用自己所著的書籍來訓(xùn)練ChatGPT以及其他AI 軟件背后的大模型。

圖片16.png

值得一提的是，這些作家包括普利策獎獲得者凱.伯德；泰勒.布蘭奇；史黛西.希夫。他們曾共同撰寫奧本海默傳記《美國的普羅米修斯》,這部作品在今年被改編成了大熱電影《奧本海默》。

這些作家們聲稱，OpenAI和微軟未經(jīng)允許使用他們的作品來訓(xùn)練OpenAI的GPT大型語言模型（LLMs），這樣的行為無疑是在“刮取”作家們的作品和其他受版權(quán)保護(hù)的材料。這種未經(jīng)授權(quán)使用他人作品的行為構(gòu)成了版權(quán)侵權(quán)。他們希望獲得經(jīng)濟(jì)賠償，并要求這些公司停止侵犯作家們的版權(quán)。

此次作家在曼哈頓聯(lián)邦法院提起的訴訟可以看作是先前訟事件的延續(xù)和進(jìn)展。早在11月份，作家和編輯朱利安·�？祟D就曾提起訴訟，也正因此，微軟首次被列為OpenAI訴訟的被告。我們知道，微軟已經(jīng)向OpenAI投資了數(shù)十億美元，并將微軟系統(tǒng)整合到OpenAI的產(chǎn)品中去。在作家們的眼中，這意味著微軟已經(jīng)深度參與了訓(xùn)練和開發(fā)人工智能模型的研發(fā)，對于自己版權(quán)被侵權(quán)的行為是有責(zé)任的。而在今年早些的6月和7月，包括喜劇演員莎拉.西爾弗曼在內(nèi)的3個人也分別針對ChatGPT的訓(xùn)練數(shù)據(jù)問題發(fā)起了類似的集體訴訟，起訴OpenAI和Meta侵權(quán)。

圖片17.png

顯然，OpenAI被控訴侵權(quán)的事件，并非個例。

這些作家普遍持有一種觀點，認(rèn)為ChatGPT不可能具有總結(jié)和分析這些作者內(nèi)容的能力。所以，所謂“ChatGPT的輸出”，實際上是對原作品侵權(quán)而產(chǎn)生的衍生作品。通過非法使用這些作品訓(xùn)練其GPT語言模型，OpenAI獲得了利益和利潤，這樣是不合法的。此外，訴訟中提及，OpenAI明知訓(xùn)練數(shù)據(jù)中包含受版權(quán)保護(hù)內(nèi)容，其行為有違使用條款，屬于故意侵權(quán)。訴訟要求法院禁止OpenAI進(jìn)行這種“非法商業(yè)行為”，同時判決OpenAI須就侵權(quán)行為支付相關(guān)賠償和處罰。

目前，OpenAI和微軟還沒有對于這些訴訟給出回應(yīng)。

AI大模型時代開啟，但背后潛藏的版權(quán)問題卻懸而未決。

OpenAI是否要為侵權(quán)負(fù)責(zé)，這一點我們還不得而知，仍舊需要等待法院的判決。但有一點需要引起我們的注意和警惕：AI大模型時代已然來臨，但其中可能涉及到的版權(quán)問題卻懸而未決。

AIGC大模型的快速崛起，的確在重塑內(nèi)容行業(yè)創(chuàng)作邏輯，賦能人們工作生活的方面起到了極大的影響，可與此同時，也在版權(quán)制度層面引發(fā)了一系列新的挑戰(zhàn)。大模型訓(xùn)練階段究竟涉及哪些版權(quán)利用行為？這一過程可能存在哪些侵權(quán)風(fēng)險？又該如何從產(chǎn)業(yè)發(fā)展的角度搭建科學(xué)的大模型訓(xùn)練和豁免機？這些都是應(yīng)該被提上日程的重要議題。這些問題如果不能得到有效的解決，那么大模型產(chǎn)業(yè)的發(fā)展和技術(shù)的進(jìn)步都會面臨很大的不確定性。

目前各類生成式人工智能利用海量內(nèi)容數(shù)據(jù)進(jìn)行模型訓(xùn)練的方法大致可以分為“兩步走”：第一步是通過購買數(shù)據(jù)庫，公開爬取等方式獲得海量內(nèi)容數(shù)據(jù)，進(jìn)行一定形式的轉(zhuǎn)換之后，存儲在相關(guān)服務(wù)器之中。第二步是對內(nèi)容數(shù)據(jù)進(jìn)行分析處理，以發(fā)現(xiàn)一定的模式，趨勢以及相關(guān)性并轉(zhuǎn)變?yōu)榇竽Ｐ蛥?shù)，供后續(xù)內(nèi)容生成時調(diào)取使用。而“調(diào)取內(nèi)容”的過程，勢必會涉及到版權(quán)問題。

圖片18.png

需要說明的是，當(dāng)我們談及版權(quán)問題時，只會單純的考慮AI公司是侵權(quán)了，還是沒有侵權(quán)。但如果我們把這個問題拆解開，會發(fā)現(xiàn)這其中涉及到的，是3個行為：即作品獲取，作品存儲和作品分析。目前，整體來看，只有“作品存儲”行為可以納入版權(quán)法“復(fù)制權(quán)”規(guī)制范疇，而更為核心的“作品分析”行為能否受到版權(quán)法規(guī)制仍值得探討。據(jù)不完全統(tǒng)計，自2022年11月至2023年10月，僅美國加州北區(qū)法院就已經(jīng)受理了10起侵權(quán)案件，版權(quán)人所起訴的AI機構(gòu)包括Stability AI，OpenAI，Meta，Alphabet等公司。

版權(quán)問題尚未解決，其實是“傳統(tǒng)版權(quán)模式”在AI時代的失靈，乃至失效。

版權(quán)問題歷來是我們關(guān)注的重心，盡管各式各樣的侵權(quán)事件時有發(fā)生，但在傳統(tǒng)版權(quán)模式控制之下，版權(quán)保護(hù)的問題始終有跡可循。但如今，AI時代來臨，傳統(tǒng)的“授權(quán)許可模式”似乎在失靈，乃至失效。

圖片19.png

因為大模型領(lǐng)域的授權(quán)基礎(chǔ)并不明確，它究竟要被授予版權(quán)法上的哪一種權(quán)利，這值得商榷。按照表面來理解，大模型訓(xùn)練行為是對作品的“思考吸收再創(chuàng)作”，但這顯然無法和版權(quán)的專有權(quán)利對應(yīng)。換句話說，版權(quán)人想要發(fā)現(xiàn)和舉證模型侵權(quán)的問題，也十分困難。

其次，大模型訓(xùn)練涉及的作品數(shù)量眾多，來源各異，權(quán)屬不同。如果這些作品都按照傳統(tǒng)授權(quán)的“實現(xiàn)許可”的方式尋求授權(quán)，工作量顯然是巨大的。一方面，需要精準(zhǔn)地將受保護(hù)的作品從海量數(shù)據(jù)中進(jìn)行分離和提��；另一方面，還要找到每一部版權(quán)作品對應(yīng)的權(quán)利人與之協(xié)商授權(quán)，并支付價格不一的授權(quán)費用。這一過程極其漫長復(fù)雜，且極難落地操作。

AI版權(quán)問題懸而未決，但不意味著大家對此沒有任何的討論和建議，只不過這討論所呈現(xiàn)出來的觀點也是多種多樣的。有人認(rèn)為，我們應(yīng)該為信息技術(shù)和商業(yè)模式的演進(jìn)，預(yù)留出一定的“復(fù)制自由”。但也有人認(rèn)為，高科技產(chǎn)業(yè)不能成為“法外之地”，“避風(fēng)港制度”不應(yīng)該出現(xiàn)。

版權(quán)問題要如何適配全新崛起的AI大模型賽道？或許，只有實際中出現(xiàn)的問題能推進(jìn)解決方案的出現(xiàn)。當(dāng)AI發(fā)展的體量足夠大，所產(chǎn)生的版權(quán)問題足夠多時，相應(yīng)的答案就會應(yīng)運而生了。

原文標(biāo)題 : 新火種AI|OpenAI微軟被訴侵權(quán)!大模型時代下的版權(quán)問題該如何處理？