當前位置: 華文天下 > 辟謠

釘釘 AI 功能多模態升級 能根據圖片識人、轉譯、創作、多輪問答

2024-04-01辟謠

來源:環球網

【環球網報道 記者 李文瑤】3月28日,釘釘 AI 助理宣布升級,上線圖片理解、文件速讀、工作流等產品能力,探索多模態、長文本與 RPA 技術在 AI 套用的落地。基於阿裏通義千問大模型,升級後的釘釘 AI 助理擁有更強的視覺推理能力和長文本速讀能力。目前,使用者在釘釘 IM 訊息方塊或點選魔法棒按鈕進入 AI 助理對話方塊,發送長檔、線上文件、網頁連結、影片內容,即可根據內容識人、識地點、分析、答題、轉譯、摘要、提取文字,甚至可以透過多輪互動進一步做智能問答。

具體來看,基於通義千問 Qwen-VL-Max 視覺理解模型,釘釘 AI 助理能夠準確描述和辨識圖片資訊,並根據圖片進行資訊推理、擴充套件創作、文字提取、轉譯等,相當於一個全能的「圖片小百科」。

同時,通義千問 Qwen-VL-Max 擁有更強的視覺推理和中文理解能力。此外,AI 助理也支持影片內容的速讀。發送給 AI 助理的短影片、直播切片或培訓影片可以被快速「觀看」, AI 助理會根據影片內容生成字幕,提取關鍵詞,並生成一份智能摘要,對於最高 2GB 的影片內容,僅需 3 分鐘即可完成智能解讀。

基於通義千問大模型,釘釘 AI 助理可以快速閱讀本地檔如 Word、PDF、PPT、Excel 等、釘釘文件、網頁連結等多種格式檔,輕松解析各類學術論文、產品手冊、使用教程、數據表格、新聞報道、多國語言的圖書等。

目前,隨著 OpenAI 帶火 Agent(智能體),大模型融入自動化技術成為當前最具共識的方向之一。今年1月,釘釘 AI 助理正式上線,企業和個人 AI 助理已進入到工作和生產力場景中。為讓 AI 助理可以完成一系列更復雜的任務,釘釘 AI 助理上線了工作流能力。

工作流是 AI Agent 的一種進階玩法,不僅可以在建立時對 AI 執行任務的流程進行拆解和編排,使得 AI 助理可以主動接管完成相應操作,還能夠打通外部的系統數據和 API 能力,進一步擴充套件了它的行動能力,比如搭建能自動寫指令碼並生成影片的創作 AI 助理。

為降低使用者的使用門檻,釘釘官方還提供了多種工作流樣版。已有企業使用工作流建立了門店資訊收集助理,將使用者反饋自動化整理,並儲存到一張釘釘多維表中,幫助員工節約瑣碎的時間;個人使用者也透過連線微博 API,建立了自動追蹤熱點並撰寫文章的助理,一個指令就能批次執行,大幅提升內容生產的效率。

目前,使用者可在釘釘 APP 或 PC 客戶端直接使用 AI 助理的各項功能,包括多模態、長文本和工作流。