ChatGPT連3D都不懂? 楊立昆:AI模型距人類智慧仍遙遠
【編譯黃惠瑜/綜合外電】Meta首席人工智慧(AI)科學家楊立昆最近表示,目前的AI模型都無法真正像人類的大腦一樣記憶、思考、計畫甚至理解事情。他認為,AI若要達到人類智慧的程度,可能還要十年或更久,但不是透過現在訓練AI的方法,而是透過一種稱為「世界模型」(world model)的方法。
科技新聞網站TechCrunch週三(10/16)報導,ChatGPT的開發商OpenAI今年推出了一項名為「記憶」的新功能,使ChatGPT能夠「記住」人的對話,其最新一代模型o1在生成輸出時還會顯示「思考」這個詞彙,OpenAI表示這些模型具備「複雜推理」的能力。這一切聽起來似乎顯示通用AI(AGI)快出現了,甚至連馬斯克(Elon Musk)和谷歌(Google)旗下AI公司DeepMind共同創始人雷格(Shane Legg)都認為具有人類水平的AI已經近在眼前了。
然而,在最近的「哈德遜論壇」(Hudson Forum)演講中,楊立昆(Yann LeCun)對這些AI樂觀主義者潑了冷水。楊立昆表示,「我們需要能夠理解世界的機器,能記住事情、具有直覺、常識,能像人類一樣推理和計畫的機器……儘管你可能聽到一些最充滿熱情的人說出來的話,但當前的AI系統並無法做到這一切」。
楊立昆指出,目前的大型語言模型(LLMs),如支撐ChatGPT和Meta AI的語言模型,離「人類水平的AI」還很遠。他後來表示,人類實現這一目標可能需要「數年到數十年」。
目前的LLMs無法理解三度空間
原因是,這些大型語言模型需要透過預測下一個標記來運作,標記通常是幾個字母或一個短的詞彙,因此語言模型是一度空間或線的預測器;而今天的AI圖片或影片模型會預測下一個畫素,因此是二度空間或平面預測器。這些模型在各自維度上的預測能力越來越出色,但它們並沒有真正理解三度空間,即立體空間。
因此,現在的AI系統無法完成大多數人類能夠輕鬆達成的簡單任務。楊立昆指出,人類在10歲時就能學會收拾餐桌,17歲時能駕駛汽車,而且通常只需幾個小時就學會。反觀當今世上最先進的AI系統,是建立在成千上萬小時的數據上,但並無法可靠的在物質世界中操作。
改用「世界模型」建構
為了能夠讓AI達成執行更複雜的任務,楊立昆建議,需要建構能夠感知周圍世界的三度空間模型,並且需要以世界模型為中心來建構。
他說,「世界模型是你認為世界該如何運作的心理模型……你可以想像自己可能採取的一系列行動,你的世界模型會幫助你預測這些行動對世界造成的影響」。
相關新聞: