訂閱
糾錯
加入自媒體

OpenAI微軟被訴侵權(quán)!大模型時代下的版權(quán)問題該如何處理?

2023-12-25 16:06
新火種
關(guān)注

作者:小巖

編輯:彩云

最近,OpenAI在自己的產(chǎn)品研發(fā)上開足馬力,與Google的大模型之戰(zhàn)進(jìn)行得如火如荼。不過,令人頗感意外的是,此時的OpenAI竟然成為了被告,被投訴侵權(quán),并且還連帶著它背后的大股東微軟一起。

多名普利策獎得主起訴 OpenAI與微軟:濫用自己作品訓(xùn)練大模型。

根據(jù)路透社消息,當(dāng)?shù)貢r間12月21日,共計11位非虛構(gòu)類書籍的作者在曼哈頓聯(lián)邦法院提起訴訟,指控OpenAI 和微軟濫用自己所著的書籍來訓(xùn)練ChatGPT以及其他AI 軟件背后的大模型。

圖片16.png

值得一提的是,這些作家包括普利策獎獲得者凱.伯德;泰勒.布蘭奇;史黛西.希夫。他們曾共同撰寫奧本海默傳記《美國的普羅米修斯》,這部作品在今年被改編成了大熱電影《奧本海默》。

這些作家們聲稱,OpenAI和微軟未經(jīng)允許使用他們的作品來訓(xùn)練OpenAI的GPT大型語言模型(LLMs) ,這樣的行為無疑是在“刮取”作家們的作品和其他受版權(quán)保護(hù)的材料。這種未經(jīng)授權(quán)使用他人作品的行為構(gòu)成了版權(quán)侵權(quán)。他們希望獲得經(jīng)濟(jì)賠償,并要求這些公司停止侵犯作家們的版權(quán)。

此次作家在曼哈頓聯(lián)邦法院提起的訴訟可以看作是先前訟事件的延續(xù)和進(jìn)展。早在11月份,作家和編輯朱利安·?祟D就曾提起訴訟,也正因此,微軟首次被列為OpenAI訴訟的被告。我們知道,微軟已經(jīng)向OpenAI投資了數(shù)十億美元,并將微軟系統(tǒng)整合到OpenAI的產(chǎn)品中去。在作家們的眼中,這意味著微軟已經(jīng)深度參與了訓(xùn)練和開發(fā)人工智能模型的研發(fā),對于自己版權(quán)被侵權(quán)的行為是有責(zé)任的。而在今年早些的6月和7月,包括喜劇演員莎拉.西爾弗曼在內(nèi)的3個人也分別針對ChatGPT的訓(xùn)練數(shù)據(jù)問題發(fā)起了類似的集體訴訟,起訴OpenAI和Meta侵權(quán)。

圖片17.png

顯然,OpenAI被控訴侵權(quán)的事件,并非個例。

這些作家普遍持有一種觀點,認(rèn)為ChatGPT不可能具有總結(jié)和分析這些作者內(nèi)容的能力。所以,所謂“ChatGPT的輸出”,實際上是對原作品侵權(quán)而產(chǎn)生的衍生作品。通過非法使用這些作品訓(xùn)練其GPT語言模型,OpenAI獲得了利益和利潤,這樣是不合法的。此外,訴訟中提及,OpenAI明知訓(xùn)練數(shù)據(jù)中包含受版權(quán)保護(hù)內(nèi)容,其行為有違使用條款,屬于故意侵權(quán)。訴訟要求法院禁止OpenAI進(jìn)行這種“非法商業(yè)行為”,同時判決OpenAI須就侵權(quán)行為支付相關(guān)賠償和處罰。

目前,OpenAI和微軟還沒有對于這些訴訟給出回應(yīng)。

AI大模型時代開啟,但背后潛藏的版權(quán)問題卻懸而未決。

OpenAI是否要為侵權(quán)負(fù)責(zé),這一點我們還不得而知,仍舊需要等待法院的判決。但有一點需要引起我們的注意和警惕:AI大模型時代已然來臨,但其中可能涉及到的版權(quán)問題卻懸而未決。

AIGC大模型的快速崛起,的確在重塑內(nèi)容行業(yè)創(chuàng)作邏輯,賦能人們工作生活的方面起到了極大的影響,可與此同時,也在版權(quán)制度層面引發(fā)了一系列新的挑戰(zhàn)。大模型訓(xùn)練階段究竟涉及哪些版權(quán)利用行為?這一過程可能存在哪些侵權(quán)風(fēng)險?又該如何從產(chǎn)業(yè)發(fā)展的角度搭建科學(xué)的大模型訓(xùn)練和豁免機?這些都是應(yīng)該被提上日程的重要議題。這些問題如果不能得到有效的解決,那么大模型產(chǎn)業(yè)的發(fā)展和技術(shù)的進(jìn)步都會面臨很大的不確定性。

目前各類生成式人工智能利用海量內(nèi)容數(shù)據(jù)進(jìn)行模型訓(xùn)練的方法大致可以分為“兩步走”:第一步是通過購買數(shù)據(jù)庫,公開爬取等方式獲得海量內(nèi)容數(shù)據(jù),進(jìn)行一定形式的轉(zhuǎn)換之后,存儲在相關(guān)服務(wù)器之中。第二步是對內(nèi)容數(shù)據(jù)進(jìn)行分析處理,以發(fā)現(xiàn)一定的模式,趨勢以及相關(guān)性并轉(zhuǎn)變?yōu)榇竽P蛥?shù),供后續(xù)內(nèi)容生成時調(diào)取使用。而“調(diào)取內(nèi)容”的過程,勢必會涉及到版權(quán)問題。

圖片18.png

需要說明的是,當(dāng)我們談及版權(quán)問題時,只會單純的考慮AI公司是侵權(quán)了,還是沒有侵權(quán)。但如果我們把這個問題拆解開,會發(fā)現(xiàn)這其中涉及到的,是3個行為:即作品獲取,作品存儲和作品分析。目前,整體來看,只有“作品存儲”行為可以納入版權(quán)法“復(fù)制權(quán)”規(guī)制范疇,而更為核心的“作品分析”行為能否受到版權(quán)法規(guī)制仍值得探討。據(jù)不完全統(tǒng)計,自2022年11月至2023年10月,僅美國加州北區(qū)法院就已經(jīng)受理了10起侵權(quán)案件,版權(quán)人所起訴的AI機構(gòu)包括Stability AI,OpenAI,Meta,Alphabet等公司。

版權(quán)問題尚未解決,其實是“傳統(tǒng)版權(quán)模式”在AI時代的失靈,乃至失效。

版權(quán)問題歷來是我們關(guān)注的重心,盡管各式各樣的侵權(quán)事件時有發(fā)生,但在傳統(tǒng)版權(quán)模式控制之下,版權(quán)保護(hù)的問題始終有跡可循。但如今,AI時代來臨,傳統(tǒng)的“授權(quán)許可模式”似乎在失靈,乃至失效。

圖片19.png

因為大模型領(lǐng)域的授權(quán)基礎(chǔ)并不明確,它究竟要被授予版權(quán)法上的哪一種權(quán)利,這值得商榷。按照表面來理解,大模型訓(xùn)練行為是對作品的“思考吸收再創(chuàng)作”,但這顯然無法和版權(quán)的專有權(quán)利對應(yīng)。換句話說,版權(quán)人想要發(fā)現(xiàn)和舉證模型侵權(quán)的問題,也十分困難。

其次,大模型訓(xùn)練涉及的作品數(shù)量眾多,來源各異,權(quán)屬不同。如果這些作品都按照傳統(tǒng)授權(quán)的“實現(xiàn)許可”的方式尋求授權(quán),工作量顯然是巨大的。一方面,需要精準(zhǔn)地將受保護(hù)的作品從海量數(shù)據(jù)中進(jìn)行分離和提;另一方面,還要找到每一部版權(quán)作品對應(yīng)的權(quán)利人與之協(xié)商授權(quán),并支付價格不一的授權(quán)費用。這一過程極其漫長復(fù)雜,且極難落地操作。

AI版權(quán)問題懸而未決,但不意味著大家對此沒有任何的討論和建議,只不過這討論所呈現(xiàn)出來的觀點也是多種多樣的。有人認(rèn)為,我們應(yīng)該為信息技術(shù)和商業(yè)模式的演進(jìn),預(yù)留出一定的“復(fù)制自由”。但也有人認(rèn)為,高科技產(chǎn)業(yè)不能成為“法外之地”,“避風(fēng)港制度”不應(yīng)該出現(xiàn)。

版權(quán)問題要如何適配全新崛起的AI大模型賽道?或許,只有實際中出現(xiàn)的問題能推進(jìn)解決方案的出現(xiàn)。當(dāng)AI發(fā)展的體量足夠大,所產(chǎn)生的版權(quán)問題足夠多時,相應(yīng)的答案就會應(yīng)運而生了。

       原文標(biāo)題 : 新火種AI|OpenAI微軟被訴侵權(quán)!大模型時代下的版權(quán)問題該如何處理?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號