廣告

外媒分析DeepSeek崛起最大關鍵 「沒外界想像那麼神、沒有奇蹟」

財經 科技新知
2025/02/03 11:45
CC 文章

【財經中心/台北報導】DeepSeek上周造成美國矽谷恐慌,輝達等AI族群一度重挫,今天台股經過春節休市後恢復交易,相關AI族群也全面重挫。

分享 連結 下載App
DeepSeek效應讓台股AI族群今天重挫。法新社 zoomin
DeepSeek效應讓台股AI族群今天重挫。法新社

DeepSeek沒有外界想像那麼具顛覆性

根據國外科技網站Tomshardware報導,DeepSeek可能沒有外界想像的那麼具有顛覆性,在AI領域不存在奇蹟。

Tomshardware報導,中國新創公司DeepSeek最近因其先進的AI模型R1的計算資源使用量驚人地低,而成為科技界焦點。該公司聲稱DeepSeek的訓練成本僅不到600萬美元及2048個GPU,其最新的R1模型可以與Open AI的o1相媲美。

但行業分析公司SemiAnalysis指出,DeepSeek背後的公司花費16億美元的伺服器成本,並擁有50000個NVIDIA Hopper GPU。報告稱,DeepSeek營運一個擁有約50000個Hopper GPU的龐大計算基礎設施。根據SemiAnalysis的數據,包括10000個H800和10000個H100,另外還購買H20晶片。

DeepSeek在伺服器總投資成本約16億美元

這些資源分布在多個位置,用於AI訓練、研究和財務建模等。SemiAnalysis的數據顯示,該公司在伺服器上的總投資約16億美元,估計營運成本為9.44億美元。

DeepSeek 起源於High-Flyer(幻方),這是一家中國對沖基金,很早就採用AI,並在GPU投入大量資金。2023年High-Flyer成立DeepSeek,作為專注AI的獨立企業,與許多對手不同同,DeepSeek 仍是自籌資金,這使其在決策方面具有速度和靈活性。

DeepSeek的一個主要優勢在於它能夠運行自己的數據中心,而大多數其他AI新創公司則依賴外部雲端提供商。這種獨立性允許其完全控制測試和AI模型優化。此外,它能夠快速迭代而不受外部瓶頸的影響,使得DeepSeek與業內傳統參與者相比效率極高。

快科技引述報導指出,根據SemiAnalysis的數據,DeepSeek只在中國境內招聘,注重員工的技能和解決問題的能力,而非資歷。DeepSeek針對北京大學、浙江大學等知名高校招聘人才,並提供極具競爭力的薪水。

廣告

想在AI領域有競爭力就要大舉投資

根據研究,DeepSeek的一些AI研究人員的薪酬超過130萬美元(約4290萬台幣),超過Moonshot(月之暗面)等其他領先的中國AI公司的薪酬。SemiAnalysis報告稱,由於人才的湧入,DeepSeek率先推出了MLA等創新技術。DeepSeek 強調效率和算法改進,而不是蠻力擴展,重塑人們對AI模型開發的期望

基於多種原因,這也讓大家相信,技術的快速進步可能會減少對高階GPU的需求,進而對輝達等公司帶來利空。最近有消息稱,DeepSeek 僅花費600萬美元訓練其最新模型,但這個數字僅指總訓練成本的一部分—不包括研究、模型改進、數據處理或整體基礎設施費用。

事實上,自成立以來,DeepSeek在AI開發花費逾5億美元。SemiAnalysis認為,與受官僚主義困擾的大型公司不同,DeepSeek 的結構使其能夠積極推動AI創新。

DeepSeek的崛起凸顯一家資金雄厚的獨立AI公司如何挑戰行業領導者,但現實情況要複雜得多:SemiAnalysis 認為DeepSeek的成功建立在數十億美元的戰略投資、技術突破和有競爭力的員工之上。這意味著沒有什麼奇蹟,正如馬斯克1年前指出的那樣,如果你想在AI領域具有競爭力,你就必須每年投入數十億美元。

下載知新聞APP

⭐️ 即刻下載《知新聞》App!免費!

廣告
知新聞年度報導
# AI # deepseek # 大語言模型