FOREXBNB注意到,早在2024年5月,OpenAI 就表示正在開發一款工具,讓創作者可以指定他們希望自己的作品如何納入或排除在其 AI 訓練資料中。但 7 個月過去了,這項功能仍未面世。

OpenAI 當時表示,該工具名為媒體管理器(Media Manager),可以“識別受版權保護的文本、影像、音訊和視訊”,以反映創作者“跨多個來源”的偏好。它旨在避免公司一些最激烈的批評者,並可能保護 OpenAI 免受與智慧財產權相關的法律挑戰。

但知情人士透露,該工具在內部很少被視為重要發布。“我不認為這是一個優先事項,”一位前 OpenAI 員工說。“說實話,我不記得有人在開發它。”

一位負責協調公司工作的非員工去年 12 月透露,他們過去曾與 OpenAI 討論過這款工具,但最近沒有任何進展。

而 OpenAI 法律團隊中一位曾擔任媒體經理的 Fred von Lohmann 則於 10 月轉任兼職顧問。

OpenAI 尚未公佈媒體管理器的進度,該公司錯過了自己設定的“2025 年之前”推出該工具的最後期限。

智慧財產權問題

OpenAI等人工智慧模型會學習資料集中的模式。ChatGPT可以寫出令人信服的電子郵件和文章,而 OpenAI 的視訊產生器Sora可以製作相對逼真的鏡頭。

能夠借鏡寫作、電影等範例創作新作品,讓人工智慧變得異常強大。但它也有反芻性。以某種方式提示時,模型(其中大多數是在無數網頁、在影片和影像上進行訓練的)會產生這些數據的近似副本,儘管這些數據是“公開的”,但並不適合以這種方式使用。

這自然會讓那些作品未經許可就被納入人工智慧訓練的創作者感到不安。許多人已經聘請了律師。

OpenAI 正在應對藝術家、作家、 YouTube 使用者、電腦科學家和新聞機構提起的集體訴訟,所有這些人都聲稱這家新創公司非法訓練他們的作品。原告包括作家 Sarah Silverman 和 Ta Nehisi-Coates、視覺藝術家以及《紐約時報》和加拿大廣播公司等媒體集團。

OpenAI 已與精選合作夥伴達成許可 協定 ,但並非所有創造者都認為這些條款具有吸引力。

媒體管理器

OpenAI 為創作者提供了幾種“退出”其 AI 訓練的臨時方式。去年 9 月,該公司推出了一個提交表單,允許藝術家標記他們的作品,以便從其未來的訓練集中刪除。而且 OpenAI 長期以來一直允許網站管理員阻止其網路爬蟲程式在其網域中抓取數據。

但創作者批評這些方法雜亂無章,不夠充分。對於書面作品、視訊或錄音,沒有具體的退出機制。而對於圖像的退出表格則要求提交每張要刪除的圖像的副本以及說明,這是一個繁瑣的過程。

今天,媒體管理器被宣傳為 OpenAI 退出解決方案的徹底改進和擴展。

OpenAI 在 5 月的公告中表示,媒體管理器將使用“尖端機器學習研究”,使創作者和內容所有者能夠“告訴 [OpenAI] 他們擁有什麼”。OpenAI 聲稱在開發該工具時正在與監管機構合作,並表示希望媒體管理器能夠“為整個 AI 業界樹立標準”。

從那以後,OpenAI 再也沒有公開提及媒體管理器。

清算

在沒有媒體管理器的情況下,OpenAI 實作了過濾器(儘管並不完善),以防止其模型重複訓練範例。在它所面臨的訴訟中,該公司繼續聲稱享有合理使用保護,聲稱其模型創造的是變革性作品,而不是抄襲作品。

OpenAI 很有可能在版權糾紛中獲勝。

法院可能會判定該公司的人工智慧具有“變革性目的”,這是 大約十年前出版業起訴Google的先例 。在那起案件中,法院裁定谷歌複製數百萬本圖書用於谷歌圖書(一種數位檔案)是允許的。

OpenAI 曾公開表示,如果不使用受版權保護的資料(無論是否授權),訓練具有競爭力的人工智慧模型是“不可能的”。該公司在 1 月提交給英國上議院的文件中寫道:“將訓練資料限制在一個多世紀前創作的公共領域書籍和圖畫上可能會產生一個有趣的實驗,但不會提供滿足當今公民需求的人工智慧系統。”

如果法院最終宣布 OpenAI 勝訴,那麼媒體管理器就沒有什麼法律意義了。OpenAI 似乎願意下這個賭注——或重新考慮其退出策略。