如果人工智能不遵守規則,媒體是否應該嘗試?

如果您從事在互聯網上發佈內容的業務,那麼很難知道如何處理人工智能。顯然,你不能忽視它;大型語言模型 (LLM) 和人工智能搜索引擎就在這裡,它們會攝取您的內容並為用戶進行總結,從而扼殺您網站的寶貴流量。大量數據支持這一點。創建考慮到這種不斷變化的現實的內容策略一開始就很複雜。您需要決定向人工智能係統公開哪些內容、阻止哪些內容,以及這兩項活動如何為您的業務服務。即使每個人都遵循明確的操作規則,這也會很困難。但這遠非人工智能世界的既定事實。我不止一次回顧過的一個話題是科技和媒體如何以不同的方式看待生態系統的某些方面(最明顯的是用戶代理),從而導致新的行業聯盟、無數的訴訟和一些憤怒的博客文章。但即使考慮到這一點,最近的兩份報告表明雙方的分歧甚至比你想像的還要大。想更多地了解人工智能如何改變媒體嗎?註冊 Media CoPilot,決不會錯過 Pete Pachal 的更新。要了解更多信息,請訪問 mediacopilot.substack.comCommon Crawl 和版權衝突 Common Crawl 是許多人工智能係統用於訓練的大量互聯網數據。它是 GPT-3.5 的基本組成部分,該模型在 2022 年向全世界發佈時為 ChatGPT 提供了動力,許多其他法學碩士也基於它。然而,在過去的三年裡,版權和訓練數據問題已成為爭議的主要來源,一些出版商要求 Common Crawl 從其存檔中刪除其內容,以防止人工智能模型對其進行訓練。 《大西洋月刊》的一份報告表明,Common Crawl 並未遵守規定,將內容保留在存檔中,同時使其對其在線搜索工具不可見,這意味著任何抽查都將是空的。 Common Crawl 的執行董事 Rich Skrenta 告訴該刊物,它遵守了刪除請求,但他也明確支持這樣的觀點,即任何在線內容都應該是培訓法學碩士的公平遊戲,他說:“如果你不希望內容出現在互聯網上,就不應該把內容放到互聯網上。”另外,《哥倫比亞新聞評論》(CJR) 還研究了新的人工智能瀏覽器 Perplexity Comet 和 ChatGPT Atlas 如何處理訪問付費牆的請求。內容。報告指出,當被要求檢索《麻省理工科技評論》上一篇僅限訂閱者閱讀的文章時,兩種瀏覽器都遵守了要求,儘管這些公司的網絡聊天機器人會因為文章被付費而拒絕獲取該文章。這兩個案例的細節都很重要,但都強調了媒體和科技行業的觀點有多麼不同。技術方面總是傾向於更多的訪問——如果信息是數字化的並且可以在互聯網上找到,人工智能係統將始終默認以任何必要的方式獲取它。出版商聲稱,無論在何處以及如何發布,他們的內容仍然屬於他們,他們應該保留對誰可以訪問它以及他們可以用它做什麼的控制權。不過,這裡發生的事情不僅僅是兩個辯手互相爭論。 Common Crawl 的案例暴露了技術方面的一個關鍵話題的矛盾,即法學碩士培訓數據中的任何特定內容或來源都不是那麼相關,而且他們可以輕鬆地不需要它。但很難將這一點與 Common Crawl 明顯的行為相協調,冒著昂貴的訴訟風險,不從要求刪除的出版物中刪除數據,這些出版物包括《紐約時報》、路透社和《華盛頓郵報》。當談到訓練數據時,某些來源顯然比其他來源更有價值。規避付費牆的瀏覽器揭示了人工智能方面的另一個錯誤假設:由於某些行為在個人基礎上是允許的,因此應該大規模允許它們。依賴這種邏輯的最常見的論點是,當人們說當人工智能從它攝取的所有信息中“學習”時,它只是在做人類所做的事情。但是規模的變化也可以造成類別的轉變。想想付費牆通常是如何運作的:許多付費牆都是故意漏洞百出的,每天、每週或每月只允許有限數量的免費文章。一旦這些都用盡了,就可以使用隱身窗口的老把戲了。此外,正如 CJR 文章中所述,一些付費牆的工作原理是加載頁面上的所有文本,然後拉下窗簾,使讀者看不到它。有時,如果您足夠快地單擊“停止加載”按鈕,您可以在帷幕落下之前暴露文本。再上一層是使用瀏覽器的簡單開發者工具來禁用和刪除文章頁面上的付費專區元素。精明的互聯網用戶多年來一直了解所有這些內容,但它只佔所有用戶的一小部分 – 我打賭不到 5%。但猜猜誰知道所有這些技巧,甚至可能還有更多技巧?人工智慧.像 Comet 和 Atlas 這樣的瀏覽器代理實際上是最精明的互聯網用戶,他們將這些權力授予任何僅僅請求信息的人。現在,曾經的利基活動已被大規模應用,付費牆對於任何使用人工智能瀏覽器的人來說都變得不可見。這裡的一種防禦措施可能是服務器端付費牆,它僅在讀者登錄後才授予對文本的訪問權限。無論如何,瀏覽器在人工智能攝取數據後如何處理數據又是另一個訪問問題。 OpenAI 表示,它不會在 Atlas 代理可能訪問的任何頁面上進行訓練,實際上這就是用戶代理應該如何工作的方式,儘管該公司確實表示它將保留單個用戶記憶的頁面。這聽起來很良性,但考慮到 Common Crawl 的表現,我們應該相信任何人工智能公司的話嗎?化衝突為戰略那麼,除了投資服務器端付費牆之外,媒體還能得到什麼?好消息是您的內容比您被告知的更有價值。如果不是,就不會花那麼多精力去尋找它、吸收它並聲稱它是“免費的”。但壞消息是,保持對這些內容的控制將比您想像的要困難得多。了解和管理人工智能如何使用您的內容進行培訓、摘要或代理是一項複雜的業務,需要的不僅僅是技術和代碼。你需要考慮對方的心態。將所有這些轉化為真正的策略意味著決定何時阻止訪問、何時允許訪問以及何時要求補償。考慮到人工智能是一個移動目標,這絕非易事,但如果人工智能公司積極、持續、全面地推動更多訪問權的努力表明了什麼,那就是他們深深重視媒體行業的內容。被需要固然很好,但成功取決於將這種需求轉化為影響力。訂閱 Media CoPilot。想更多地了解人工智能如何改變媒體嗎?註冊 Media CoPilot,決不會錯過 Pete Pachal 的更新。要了解更多信息,請訪問 mediacopilot.substack.com Fast Company 改變世界創意獎的早期截止日期是太平洋時間 11 月 14 日星期五晚上 11:59。今天申請。
已发布: 2025-11-13 09:30:00










