當前位置: 華文天下 > 辟謠

月之暗面Kimi支持200萬字長文輸入,預計今年釋出多模態產品

2024-03-20辟謠

界面新聞記者 | 於浩

界面新聞編輯 | 文姝琪

3月18日,月之暗面宣布其對話式AI助手產品Kimi智能助手現已支持200萬字的無失真上下文輸入。在去年10月釋出時,Kimi可支持的無失真上下文輸入長度為20萬字。

與此同時,月之暗面還為Kimi智能助手提供了更多資料來源。據月之暗面工程副總裁許欣然介紹,當面對一個問題時,Kimi智能助手會嘗試不同的方向搜尋並據此做出回答;在回答速度上也有提升,許欣然表示,基於infra層的最佳化,Kimi智能助手生成速度較去年10月份提升了三倍。

目前,Kimi智能助手已上線了網頁版、安卓、iOS、小程式套用。據SimilarWeb數據顯示,Kimi智能助手網頁版於今年2月的存取量為291.9萬,同比上月增長104.99%。

上下文視窗一直是各家大模型公司技術角逐的重點。

在長文件問答、長文本摘要等多種套用場景中,上下文視窗尤為重要。在接受騰訊科技專訪時,月之暗面CEO楊植麟曾將大模型形容作電腦,long context(長上下文)形容作電腦的記憶體。在他看來,這是將新計算範式變成更通用的基礎。

提升上下文長度也存在一些技術路線。如基於檢索增強的RAG(retrieval augmented generation)方法、滑動視窗方式,但是這些方法在提升上下文長度的同時往往也會帶來諸如智能水平下降、成本提升等負面效果。

至於月之暗面的解決辦法,楊植麟此前曾表示主要在兩方面,一是創新網絡結構,二是進行工程最佳化。許欣然在溝通會現場進一步稱,上下文長度的無失真提升需要在數據、Infra、模型訓練、產品等層面協同合作才能實作,此次團隊從模型預訓練到對齊、推理環節均進行了原生的重新設計和開發。

隨著上下文長度提升,Kimi智能助手的使用場景也被擴充套件。在讀論文、分析財報等傳統使用場景中,可以更精準地滿足使用者需求,此外,還擴充套件出桌上角色扮演遊戲(TRPG)主持人等全新使用場景。

值得一提的是,上下文長度提升後也為模型評測帶來難題。以往測評某一大模型產品的上下文長度時會采用「大海撈針」的方式,即將一個與文本無關的句子隱藏在大量的文本中,然後透過自然語言提問的方式(Prompt),觀察AI能否準確提取出這個隱藏的句子。

但隨著業內都按照特定指標進行專項訓練之後,大海撈針式的測評方法逐漸失去了原先的參考意義。當大模型上下文長度進一步提升後,評測的維度也會變得更加豐富。許欣然直言,目前在學術界這仍是一個有待探討的開放式問題。

盡管月之暗面科技有限公司在長文本處理方面取得了進展,但其他AI企業在自然語言理解、多模態互動等技術領域的發展也不容忽視。Sora所展現出的影片生成能力使得Diffusion Transformer架構(DiT)初步成為業內共識,如生數科技、愛詩科技都表態稱要在今年內追趕Sora。

對於多模態方面的進展,此次溝通會上月之暗面並未對外披露。月之暗面聯合創始人周昕宇表示,在Sora釋出之前月之暗面就已經有多模態方面的研發,目前正在按照固有節奏推進,預計在今年將會有相關產品釋出。

在成立不到一年的時間裏,月之暗面已完成兩筆大額融資,今年年初完成超10億美元融資之後,公司估值更是來到了25億美元,但其公司規模仍在80人左右。對此周昕宇回應稱,人才密度比人數更重要,未來會按照需求進行人員擴張,「招的每一個人都要提高團隊平均水平。」