輝達 (NVDA.US) (NVIDIA)週二(28 日)宣布推出名為「Nemotron-3 Nano Omni」的開放式多模態模型。這款新模型的核心優勢在於將視訊、音訊、圖像及文字等多種功能整合進單一系統中,賦予 AI 智能體更為卓越的高級推理能力,進而能夠在多元應用場景下提供更快速且精準的智慧回應。
針對企業與開發者的需求,輝達強調該模型提供了一條高效且精準的多模態 AI 智能體生產路徑,賦予開發團隊在部署上極大的靈活性與掌控力。
Nemotron-3 Nano Omni 在效率表現上尤其令人驚豔,憑藉著領先的準確性與低建置成本,該模型已在複雜文檔智能、視頻理解及音頻理解等六大權威排行榜中榮登榜首,成功為開放式多模態模型樹立了新的效率典範。
在技術架構方面,Nemotron-3 Nano Omni 採用了先進的 30B-A3B 混合專家(MoE)架構,並將視覺與音訊編碼器直接整合於系統內部。這種設計消除了對單獨感知模型的依賴,大幅優化了大規模推理的執行效率。
輝達指出,該系統的吞吐量相較於其他具備相同互動性的開放式全向模型,提升了高達 9 倍之多。這意味著企業可以在不犧牲響應速度或輸出品質的前提下,實現更低的營運成本與更強大的擴展性。
目前已有多家企業率先導入此模型並取得顯著成果。H Company 執行長 Gautier Cloix 表示,透過該模型,旗下的 AI 智能體現在能快速解讀全高清(Full HD)螢幕錄影內容,這在過往的技術框架下是難以實現的突破。
Cloix 進一步補充,這不僅是單純的速度提升,更代表了 AI 智能體在實時感知與數位環境交互方式上的根本性轉變。
此外,輝達也說明了 Nemotron-3 Nano Omni 在代理工作流程中的協作潛力。該模型能與輝達自家的專有雲模型、其他 Nemotron 系列模型,甚至是第三方的專有模型協同運作,為複雜的子代理(Sub-agent)系統提供強而有力的支援。
隨著 Nemotron-3 系列模型(涵蓋 Nano、Super 及 Ultra 等型號)在過去一年內創下超過 5,000 萬次的下載量,輝達正持續擴大其在開放式 AI 生態系的影響力。
(美股為即時串流報價; OTC市場股票除外,資料延遲最少15分鐘。)新聞來源 (不包括新聞圖片): 鉅亨網