DeepSeek的新模型能否克服阻礙LLM的“長期背景”瓶頸？| mtgamer.com

22 10 月 2025

173

DeepSeek的新模型能否克服阻礙LLM的“長期背景”瓶頸？

人工智能專家表示，DeepSeek 的新 AI 模型可將圖像轉換為文本，它不僅僅是一個文檔分析工具，而且是下一代大型語言模型 (LLM) 的潛在預覽。週一發布的 DeepSeek-OCR 從技術上講是一種光學字符識別 (OCR) 模型，這是一種使用計算機視覺將圖像轉換為機器可讀文本的人工智能係統。常見應用包括智能車輛和文檔掃描儀。這家總部位於杭州的初創公司引用了 OmniDocBench 上業界領先的模型分數，OmniDocBench 是評估人工智能模型文檔分析能力的流行基準。但 OCR 標籤“幾乎可以被忽略”，德國特里爾大學研究生、開源模型專家弗洛里安·布蘭德 (Florian Brand) 說。相反，他認為該模型隨附的研究論文暗示了其真正目的，即提高法學碩士旗艦 DeepSeek 系列的性能。 “這篇論文主要是關於壓縮的，”布蘭德說。近年來，從 OpenAI 的 ChatGPT 到 DeepSeek 的 R1，法學碩士一直是生成式 AI 熱潮的主要推動力。法學碩士通過將文本轉換為標記（代表單詞的一部分）來處理輸入數據。 2025 年 1 月 28 日，北京，智能手機屏幕上顯示 DeepSeek 應用程序歡迎頁面。照片：AP然而，法學碩士在“長上下文”或長數據輸入方面遇到困難，因為隨著令牌數量的增長，他們用於“注意”（或查看）每個令牌的機制在計算上變得更加昂貴。

已发布: 2025-10-22 14:00:00

来源: www.scmp.com

一	二	三	四	五	六	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

DeepSeek的新模型能否克服阻礙LLM的“長期背景”瓶頸？| mtgamer.com

DeepSeek的新模型能否克服阻礙LLM的“長期背景”瓶頸？

近期文章

PLG桃園璞園領航猿與手機遊戲合作聯合舉辦「橙市玩家」活動邀橙客一起享受吃雞樂趣

動視暴雪遊戲迎龍年推出特別限時活動《魔獸世界》台港澳獨家「吉祥木龍坐騎」

Xbox计划于下周揭示未来愿景！传闻独占游戏即将登陆竞争对手PS5平台

《疯狂出租车》新作传为3A级即时服务游戏！将推出100人生存模式

Steam Deck上最受歡迎的遊戲清單充滿了令人驚嘆的時間消耗者

2024年遊戲開發者選擇獎得獎名單公布

《哈羅德哈利布特》4月16日於PS5、Xbox Series和PC發售，稍後登陸PS4和Xbox One

類別