巨大AI模型失寵？　科技巨擘推小型AI省成本

國際熱搜話題

2024/07/07 17:43

【編譯黃惠瑜／綜合外電】人工智慧（AI）模型剛推出時，各大科技公司利用巨大的資料訓練大型AI模型，試圖讓AI達到人類般的智慧。然而，發展大型AI模型的結果卻發現需要耗費巨額成本、巨大能源，甚至某些任務根本無需使用大型AI處理。因此，美國科技巨擘和新創公司正調整研發路線，縮小AI規模，希望讓AI更便宜、更快、更專業。

美國《華爾街日報》週六（7/6）報導，科技巨擘與新創公司正在使用小型或中型的語言模型來訓練AI，希望精簡AI軟體，讓AI變得更便宜、更快、更專攻特定任務。

目前最大的AI模型如OpenAI的GPT-4，其開發過程加上需要使用超過一兆個參數，總成本逾1億美元（約32億元台幣）。較小的模型通常使用較小的資料集訓練，比如僅針對法律問題的資料集，使用的參數不到100億個，訓練的成本可能不到1千萬美元（約3億2433萬元台幣）。較小的模型需要的運算力也較小，因此成本較低。

微軟（Microsoft）近期剛發布小型語言模型Phi系列，執行長納德拉（Satya Nadella）表示，Phi模型的大小只有ChatGPT免費模型的百分之一，許多任務的執行能力幾乎一模一樣。

微軟消費者行銷長梅迪（Yusuf Mehdi）表示，微軟是首批投入數以十億美元在生成式AI的大型科技公司之一，但公司很快發現營運的成本比最原先的預期還高。

谷歌（Google）以及AI新創公司如Mistral、Anthropic和Cohere今年也發布較小的模型。蘋果（Apple）6月公佈AI規劃，預計使用小型模型，如此便可完全在手機上操作該軟體，帶來更快更安全的體驗。

OpenAI近期也發布旗艦模型版本，據稱操作成本更低。

面對許多任務，例如總結文件或生成圖像，使用大型模型處理就像駕駛坦克車去買生活雜貨一樣，大材小用。

位於以色列特拉維夫（Tel Aviv）的AI公司AI21 Labs創辦人肖漢姆（Yoav Shoham）表示，小型模型使用的運算力較少，因此常常可以僅使用相當於大型語言模型六分之一的成本來回答問題。肖漢姆提到，如果使用者需要的結果是數以十萬或數以百萬個答案，那麽使用大型模型做這件事「是不經濟的」。

不過，科技公司也沒有放棄大型AI模型。蘋果宣布將把ChatGPT整併到數位助理Siri中，讓Siri可以執行如撰寫電子郵件等更複雜的任務。微軟也表示，最新版本的Windows將會包含OpenAI的最新AI模型。