工研院IEK:多模態AI將驅動人形機器人理解現實環境 創造嶄新人機互動模式
【記者李宜儒/台北報導】工研院產科國際所分析師林研詩表示,隨著AI技術向多模態方向演進,垂直應用範圍也持續擴展,AI代理的發展成為新的趨勢。多模態AI模仿人類對世界的感知方式,讓機器人能更細緻地理解現實環境,並創造出嶄新的AI人機互動模式。
林研詩指出,隨著大量資金湧入,人形機器人技術正迅速崛起,背後的驅動力來自於AI大模型、軟體、以及資料驅動生成與學習。這些技術為機器人賦予了前所未有的具身智慧(Embodied Intelligence),讓人機協作變得更加高效,並逐步走向執行複雜任務的未來。
同時,面對全球勞動力短缺的現象,各國紛紛啟動人形機器人的發展計畫,為產業帶來了強勁推力。根據高盛預測,2035年人形機器人的市場規模將達到380億美元。
近期,科技巨頭紛紛開發AI人形機器人的訓練平台,利用多模態神經網路進行端到端的運行,同時建立多模態資料的共同嵌入空間,以實現全局的數據分析。AI領域的獨角獸公司則正朝著通用機器腦的目標前進,讓人形機器人能夠適應非結構化環境,並透過大世界模型賦予其重要的空間推理能力,這一能力成為通用機器人的智慧基石。
林研詩指出,我國正面臨少子化與高齡化對勞動市場的衝擊,中高齡者的勞動參與率低於OECD平均,國內製造業產線目前依賴技術人力和技術經驗傳承。除了透過自動化來解決產業缺工的問題,融合人的五感與機械協作,能更好地傳承老師傅的經驗,並有效應對製造業面臨的挑戰。
廣告
林研詩表示,這標誌著新「智械時代」的來臨,尤其是在多模態AI機器人即服務(Multimodal AI Robot-as-a-Service, RaaS)領域的應用。未來商業化的關鍵在於機器人能否有效解讀物理空間並做出決策,實現手眼協調技術,從而推動工業5.0的實現,並將數位轉型與永續發展相結合。