廣告

快訊 KNEWS

⚡

直播｜藍「罷前之夜」3萬人集結

獨家｜兒虐名醫吐艱難　資源不足「救回命卻給不了家庭溫暖」

才說要回家！北市水電工意外陳屍校園水塔　檢警相驗死因出爐

快對獎！5~6月期統一發票中獎號碼出爐　千萬特別獎「47406327」

有片｜勇消吳恩碩今告別禮拜　侯友宜代頒褒揚令！覆蓋國旗表彰貢獻

台股早盤衝高百點後下殺翻黑

兒虐氣喘名醫愛出診間「做傻人的事」

三颱鼎立海警機率曝！明帶傘投票

獨家｜「AI對齊」避免人工智慧出餿主意　專家：永遠做不完！要持續精進

生活

2024/05/31 19:30

✎ 六百文章

【記者王良博／台北報導】ChatGPT等人工智慧（AI）大型語言模型正夯，卻也衍生AI對齊問題（alignment problem）。陽明交大資訊工程學系特聘教授吳毅成解釋，當AI回答問題時，能不造成危害、符合期待，「不出餿主意」，即是「對齊」。他也指出，「對齊一定做不完」，就像資安、防毒技術，不可能做到100％擋下病毒或攻擊，AI對齊技術也要持續精進。

ChatGPT等AI大型語言模型，衍生AI對齊問題（alignment problem）。取自Pixabay

zoomin — ChatGPT等AI大型語言模型，衍生AI對齊問題（alignment problem）。取自Pixabay

對於何謂AI對齊問題，吳毅成表示，ChatGPT等大型語言模型，在回答使用者問題時，符合使用者的期待、價值觀，避免造成危害，就是符合「對齊」。

他舉例，假設使用者詢問AI如何快速減肥，AI應該要回覆快速減重對身體有害，必須參考醫生意見，而非隨意拼湊各種資訊，否則可能讓使用者健康受影響，「不能出餿主意」。

另外，像是詢問AI如何侵入別人的Wi-Fi，若AI一五一十回答，也會造成社會問題，應該回答這是違法的行為。

吳毅成表示，AI對齊即是避免AI造成危害。取自陽明交大資工系網站

zoomin — 吳毅成表示，AI對齊即是避免AI造成危害。取自陽明交大資工系網站

值得注意的是，ChatGPT的開發商OpenAI，旗下風險控制團隊「超智慧對齊」（Superalignment）日前宣告解散。

針對「超智慧對齊」與一般AI對齊議題有何不同，吳毅成說，AI圍棋軟體AlphaGo已經能打敗人類棋手，未來AI會逐漸超越人類的智慧，因此需要讓AI對齊的手段，來限制這些超強AI的行為，使其表現，符合人類社會的規範與價值觀。

他強調，假設有一個人絕頂聰明，但心術不正，對社會來說並不好，而超智慧對齊，就是預防AI比人類更聰明、更厲害時，可能做出有害決定，或者有心人士利用AI做不好的事。

吳毅成舉例，利用AI監控街道，有助於快速抓到罪犯，但極權國家也可能用來監控人民隱私。

OpenAI旗下「超智慧對齊」團隊日前宣告解散，圖為OpenAI的標誌示意圖。取自Pixabay

zoomin — OpenAI旗下「超智慧對齊」團隊日前宣告解散，圖為OpenAI的標誌示意圖。取自Pixabay

「對齊的東西一定做不完」，至於AI對齊或超智慧對齊有哪些具體作法，吳毅成強調，對齊就像資安、防毒軟體一樣，不可能有任何一個防毒軟體或資安技術，能保證100％擋下病毒或資安攻擊，AI對齊也必須不斷精進。

他也提到，目前常見的作法，包含拒絕詳實回答，像是不回答如何製作槍砲彈藥，再者則是發展符合在地文化的大型語言模型，例如國科會推動的大型語言模型TAIDE，特色即是具有「台灣價值」，在提供的資訊、使用的表達方式上，符合台灣的風土民情。

另外，吳毅成也說，AI對齊技術上可以持續精進，像是RLHF（Reinforcement Learning from Human Feedback，人類意見回饋強化學習）技術，利用人類的回饋，來完善大型語言模型，也是常見的作法。

下載知新聞APP

⭐️ 即刻下載《知新聞》App！免費！

# AI # 對齊問題 # 超智慧對齊 # AI對齊 # 吳毅成

知更多

川普推動AI計畫！黃仁勳：美國擁有的獨特優勢就是他　稱能源不該被妖魔化

川普推動AI計畫！黃仁勳：美國擁有的獨特優勢就是他　稱能源不該被妖魔化

【限量500杯】成為小知族立即喝拿鐵｜免費兌換進行中！

【限量500杯】成為小知族立即喝拿鐵｜免費兌換進行中！

今年輝達Blackwell出貨逾80%　研調點名富士康、美超微及廣達受惠

今年輝達Blackwell出貨逾80%　研調點名富士康、美超微及廣達受惠

川普連「AI」名詞也有意見！　基於這原因想改名為「GI」

川普連「AI」名詞也有意見！　基於這原因想改名為「GI」

AI改變矽谷招聘文化　年輕人不再吃香

AI改變矽谷招聘文化　年輕人不再吃香

顛覆AI常識！Anthropic研究：模型思考越久恐越蠢　企業應用應更謹慎

顛覆AI常識！Anthropic研究：模型思考越久恐越蠢　企業應用應更謹慎

OpenAI執行長阿特曼：AI將讓某些職業類別消失　這行業衝擊最大

OpenAI執行長阿特曼：AI將讓某些職業類別消失　這行業衝擊最大

馬斯克揭露xAI願景　5年內實現效能等同5千萬張輝達H100算力

馬斯克揭露xAI願景　5年內實現效能等同5千萬張輝達H100算力