DeepSeek的新模型能否克服阻礙LLM的“長期背景”瓶頸?

人工智能專家表示,DeepSeek 的新 AI 模型可將圖像轉換為文本,它不僅僅是一個文檔分析工具,而且是下一代大型語言模型 (LLM) 的潛在預覽。週一發布的 DeepSeek-OCR 從技術上講是一種光學字符識別 (OCR) 模型,這是一種使用計算機視覺將圖像轉換為機器可讀文本的人工智能係統。常見應用包括智能車輛和文檔掃描儀。這家總部位於杭州的初創公司引用了 OmniDocBench 上業界領先的模型分數,OmniDocBench 是評估人工智能模型文檔分析能力的流行基準。但 OCR 標籤“幾乎可以被忽略”,德國特里爾大學研究生、開源模型專家弗洛里安·布蘭德 (Florian Brand) 說。相反,他認為該模型隨附的研究論文暗示了其真正目的,即提高法學碩士旗艦 DeepSeek 系列的性能。 “這篇論文主要是關於壓縮的,”布蘭德說。近年來,從 OpenAI 的 ChatGPT 到 DeepSeek 的 R1,法學碩士一直是生成式 AI 熱潮的主要推動力。法學碩士通過將文本轉換為標記(代表單詞的一部分)來處理輸入數據。 2025 年 1 月 28 日,北京,智能手機屏幕上顯示 DeepSeek 應用程序歡迎頁面。照片:AP然而,法學碩士在“長上下文”或長數據輸入方面遇到困難,因為隨著令牌數量的增長,他們用於“注意”(或查看)每個令牌的機制在計算上變得更加昂貴。
已发布: 2025-10-22 14:00:00
来源: www.scmp.com










