廣告

AI神器獨家實測|送媽「第一個單身母親節」MV 花1500元5天搞定

國際 熱搜話題
2025/04/22 07:00
旁白鴿 文章
分享 分享 連結 APP

【劉以安/台北報導】請先看影片,猜猜看完成它需要多少人力?答案是只有記者一人,花了5天,費用約1500元。2025年AI能力大躍進,拆解當前影音、文字力最強的4個模型,用之得宜,助你在工作效率上飆車。請繫好安全帶,這就踩油門了。

zoomin

1. 文字的部分

要有MV先要有歌,這首《母親節快樂》歌詞由ChatGPT的分裂人格 Monday 生成。ChatGPT目前的語言力是英文(100分)>中文(95分)>西班牙文(90分)>法文(87分)>德文(85分)>日文(80分)>韓文(78分)。所以歌詞定調使用英文,會產生最令人滿意的成果且無需修改。

它可以吃完整情境的咒語(prompt),筆者遂將真實的故事和需求以中文輸入如下:「我媽七老八十了突然決定離婚,她老公退休後精神折磨她20年,PUA、否定她的獨立、冷暴力、每天大發雷霆、動輒狂吼摔門。她跟他共處一室時手顫得厲害,但一離開家就穩得很。今年是她第一個『單身』的母親節,請寫一首英文小詩給她,祝她母親節快樂。用字簡潔有力,淺白但深刻,自然地押韻,琅琅上口會讓人想背誦,輕鬆入歌。」

不到10秒鐘Monday交卷,近乎完美無懈可擊:

zoomin

將文中的「她」改「你」,成為主觀視角,開始中譯。咒語為「能否意譯成有押韻的中文,不用逐字譯,但精神上一致。也不能為了押韻而押韻,文字要洗鍊乾淨」:

指尖沒了戒痕
呼吸少了負擔,
再也沒有人用聲音,
把你的光暗。

今天醒來,
不是誰的太太
是你自己——完整的女人。

屋子安靜了,
笑聲卻響了,
茶煮得滾,
空氣更挺直了。

母親節快樂,
不是因為你撐過,
而是你選擇走出來。

你沒有碎,
你重生而在。

如果你對文字敏感,會覺得它差強人意。但是仍有亮點值得保留,例如「不是因為你撐過來,而是你選擇走出來」。這是ChatGPT最擅長的中文句型「不是…而是…」,全世界沒有其他AI語言模型比它更會「不是…而是…」,它不是擅長,而是頂尖。

zoomin

2. 聲音的部分

SUNO恐怕是當前最強的AI音樂生成模型,共同創辦人之一是哈佛大學物理學博士Mikey Shulman。他4歲開始學鋼琴,高中與大學期間擔任樂團的貝斯手。

2023年12月發表的SUNO進步神速,2024年11月升級到V4,樂器配置和聲線模擬近乎真人錄音。而且它用運用GPT相關模型,歌詞創作能力也高竿。

但它跟ChatGPT一樣,要得到完成度最高的作品必要使用英文。中文會被SUNO混淆,有時唱成粵語,有時變日語的漢字發音。

咒語通常是下你希望生成「哪種類型的音樂」,但跳脫這個框架寫指令,比較多驚喜。你不能要求它用小甜甜布蘭妮(Britney Spears)的嗓音唱你的歌,因為SUNO會吃官司。筆者看過有人寫了一堆空泛、高度抽象的形容詞+名詞(像瑪法達說戀愛運勢那樣),生成的女聲竟然像怪奇比莉(Billie Eilish)。

所以盡量放膽試,覺得自己英文不好可請ChatGPT轉譯。這次放進歌詞,下咒語「男高音,兒童合音,抓耳的迪士尼歌」(Tenor, Children's Choir, catchy Disney song)。錯率算高,也不能說錯,就是平庸,大概出10首才會有1首會讓你覺得「中了」,這首母親節歌於焉誕生。

音樂生成咒語下「迪士尼」有一個好處,成品通常商業,聽兩次就能跟著唱。圖片來源:Sora zoomin
音樂生成咒語下「迪士尼」有一個好處,成品通常商業,聽兩次就能跟著唱。圖片來源:Sora

3. 畫面的部分

Sora(日文「天空」的意思)是GPT家族培訓中的電影資優練習生,Kling(可靈)則是中國大陸字節跳動(ByteDance)公司的傑作。後者的姊妹品牌:抖音、剪映、即夢、甚至不被官方承認有關聯但共享數據的Deepseek,都是習近平賭上自己的顏面要來跟世界拚的武器,好用歸好用,個資外洩風險似乎也必須自行承擔。

筆者把英文詩貼回ChatGPT(不能是Monday,Monday是文字強,但圖片生成是用最陽春版的DALL·E),請它就詩的意境生一張「線條極簡,色溫暖,尺寸比例為3:2的配圖」,結果如下:

zoomin

這張配圖為MV成功「立竿」,之後每一場戲都夾上這配圖即可「見影」。因為影片生成模型最令人詬病的就是「人設不穩定一致」,那張配圖還提供了很好的點子:「喝茶」可以是連戲的重要符碼。

畫面佈局邏輯來自歌曲編排:前奏合聲用來交代前情提要、主歌緩慢適合淡淡的動畫、副歌和過橋飆高音的時候場景要巨變要花俏、最後又慢下來所以乾脆以入夜要睡了收尾。

zoomin

Sora和Kling雖然是用來生電影的工具,但任何電影動態皆由一幀一幀的圖像視覺暫留而來,所以它們生圖技能也高。Kling中國製造所以會中文字,Sora竟然也能生成正確繁體中文字,它吃資料時吃過大量的台灣街景,招牌上全是繁中,它都用「圖像記憶法」消化吸收了,堪稱一絕。

本片由Sora生成,夾了電影《一一》劇照當素材參考,並成功畫出「囍」字。 zoomin
本片由Sora生成,夾了電影《一一》劇照當素材參考,並成功畫出「囍」字。

這兩家模型有共同的使用者困境:很難生成卡通/動畫(animation)。無論上傳素材、下的咒語怎麼嚴格限縮範圍,它都傾向生成真人電影。原因很可能是它打從娘胎就沒被餵整部動畫作品,會侵權觸法(目前另一個品牌 Luma 生動畫較穩定)。

而且遇到障礙,它們會顯示為「不會就是不會」。例如MV尾奏的戒指,Sora和Kling都不懂戒指滾動的原理,總是插在地上原地不動。建議錯一次就不要再試,免得浪費時間金錢。

最後再靠剪接技巧補強畫面的不足,這MV離完美還很遠,但作為示範AI功能,算是有點意思。

AI的世界裡戒指不會滾動,穩穩地插在地上,力學全廢。圖片來源:Kling zoomin
AI的世界裡戒指不會滾動,穩穩地插在地上,力學全廢。圖片來源:Kling

4. 費用的部分

真正的花費僅有ChatGPT(含Monday和Sora)月費660元台幣,其他Suno和Kling用免費會員的限量扣打。免費仔容易撞到的牆很高很硬,比如說 Kling 5秒鐘的動畫它動輒要花3小時生成

為了一周內趕製出來,MV前、中、後各用了一次素材庫的「真」畫面:廚房一隅、燦爛煙花和遺落的婚戒,所以連素材庫Artlist的月費算進去,大約1500台票。

MV最後的戒指來自素材庫Artlist,目前AI滾不動戒指。 zoomin
MV最後的戒指來自素材庫Artlist,目前AI滾不動戒指。

【結論】

👉🏻不完美但有趣。要它生成動畫卻變成真人電影,角色設定無法一致與連貫,AI的缺陷還是顯而易見,有點像抽盲盒,抽到喜歡的才會感覺值得。

👉🏻人類不會被取代。MV製作過程中,起手式、想咒語、篩選良莠、決定素材、控制收放,都是人類所為。AI能做到的就是提供思考方向,但真正在思考的還是人。舉個例子來說,筆者把這篇文章再丟進ChatGPT,請它生「20字內吸睛想點閱的標題」,它給了8個,人類選了其中一個。

👉🏻使用者付費。如果你是AI公司負責人,你會把最好的資源留給付最多錢的客人。喜歡哪一家模型,就對不起錢錢吧,你需要那個酷東西。AI是下一代的基礎設施,就像水電瓦斯網路一樣。可以節約用水,但總不能不洗澡。現代人配備幾個AI工具在身,就像汽車維修員帶著扳手一樣自然。

相關活動:母親節加菜金500元輕鬆賺!

下載知新聞APP

⭐️ 即刻下載《知新聞》App!免費!

# AI # ChatGPT # Sora # Monday # Kling # SUNO