廣告

DeepSeek讓AI股一夕間崩跌 創辦人梁文鋒曝光

財經 科技新知
2025/01/28 09:35
CC 文章

【財經中心/台北報導】中國的神秘AI公司、被稱為「AI界拼多多」的AI新創公司深度求索(DeepSeek)成為全球矚目焦點,其最新發表的R1模型不僅在性能上媲美OpenAI的o1,更以極低的成本實現這一突破。

分享 連結 下載App
左為DeepSeek創辦人梁文鋒。照片來源:快科技 zoomin
左為DeepSeek創辦人梁文鋒。照片來源:快科技

DeepSeek訓練成本遠低於其他大模型

根據陸媒快科技報導,1月20日,極少露面的DeepSeek老闆梁文鋒首次亮相,受邀參加座談會並發言。同一天,DeepSeek在官方微博發表DeepSeek-R1,性能對比OpenAI o1正式版,並同步開源模型權重。

按照官方說法,DeepSeek-R1在後訓練階段大規模使用強化學習技術,在僅有極少標註數據的情況下,極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上,可媲美OpenAI o1正式版。

DeepSeek-V3在僅使用2048個H800 GPU下,完成6710億參數模型的訓練,成本僅557.6萬美元,遠低於其他頂級模型的訓練成本(如GPT-4的10億美元)。因此,一些人認為,DeepSeek可能會顛覆輝達在AI硬體領域的主導地位。

DeepSeek對AI股帶來威脅

DeepSeek的誕生,讓低成本、高性能AI成為了可能。大模型對算力投入的需求可能會從訓練端向推理端傾斜,即未來對推理算力的需求將成為主要驅動力。而輝達等硬體廠商的傳統優勢更多集中在訓練端,這可能會對其市場地位和策略布局產生影響。

不少人也將DeepSeek稱為美股最大的威脅,DeepSeek崛起造成美股周一AI股出現血洗,輝達重挫近17%,台積電也跌逾13%,由於DeepSeek來自中國一家名不見經傳的「小公司」,更引起美國科技圈的重視。

廣告

指中國公司習慣跟隨而不是創新

梁文鋒在座談會上表示,「在美國每天發生的大量創新,這是非常普通的一個。他們之所以驚訝,是因為這是一個中國公司,在以創新貢獻者的身份,加入到他們遊戲裡去。畢竟大部分中國公司習慣follow(跟隨),而不是創新。」

他認為,「中國AI不可能永遠處在跟隨的位置。我們經常說中國AI和美國有1、2年差距,但真實的差距是原創和模仿之差。如果這個不改變,中國永遠只能是追隨者,所以有些探索也是逃不掉的。」

梁文鋒指出,輝達的領先不只是一個公司的努力,而是整個西方技術社區和產業共同努力的結果。他們能看到下一代的技術趨勢,手裡有路線圖;中國AI的發展,同樣需要這樣的生態。 很多國產晶片發展不起來,也是因為缺乏配套的技術社區,只有第二手消息,所以中國必然需要有人站到技術的前沿。

下載知新聞APP

⭐️ 即刻下載《知新聞》App!免費!

廣告
知新聞年度報導
# DeepSeek # AI # 梁文鋒