DeepSeek讓AI股一夕間崩跌 創辦人梁文鋒曝光
【財經中心/台北報導】中國的神秘AI公司、被稱為「AI界拼多多」的AI新創公司深度求索(DeepSeek)成為全球矚目焦點,其最新發表的R1模型不僅在性能上媲美OpenAI的o1,更以極低的成本實現這一突破。
DeepSeek訓練成本遠低於其他大模型
根據陸媒快科技報導,1月20日,極少露面的DeepSeek老闆梁文鋒首次亮相,受邀參加座談會並發言。同一天,DeepSeek在官方微博發表DeepSeek-R1,性能對比OpenAI o1正式版,並同步開源模型權重。
按照官方說法,DeepSeek-R1在後訓練階段大規模使用強化學習技術,在僅有極少標註數據的情況下,極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上,可媲美OpenAI o1正式版。
DeepSeek-V3在僅使用2048個H800 GPU下,完成6710億參數模型的訓練,成本僅557.6萬美元,遠低於其他頂級模型的訓練成本(如GPT-4的10億美元)。因此,一些人認為,DeepSeek可能會顛覆輝達在AI硬體領域的主導地位。
DeepSeek對AI股帶來威脅
DeepSeek的誕生,讓低成本、高性能AI成為了可能。大模型對算力投入的需求可能會從訓練端向推理端傾斜,即未來對推理算力的需求將成為主要驅動力。而輝達等硬體廠商的傳統優勢更多集中在訓練端,這可能會對其市場地位和策略布局產生影響。
不少人也將DeepSeek稱為美股最大的威脅,DeepSeek崛起造成美股周一AI股出現血洗,輝達重挫近17%,台積電也跌逾13%,由於DeepSeek來自中國一家名不見經傳的「小公司」,更引起美國科技圈的重視。
指中國公司習慣跟隨而不是創新
梁文鋒在座談會上表示,「在美國每天發生的大量創新,這是非常普通的一個。他們之所以驚訝,是因為這是一個中國公司,在以創新貢獻者的身份,加入到他們遊戲裡去。畢竟大部分中國公司習慣follow(跟隨),而不是創新。」
他認為,「中國AI不可能永遠處在跟隨的位置。我們經常說中國AI和美國有1、2年差距,但真實的差距是原創和模仿之差。如果這個不改變,中國永遠只能是追隨者,所以有些探索也是逃不掉的。」
梁文鋒指出,輝達的領先不只是一個公司的努力,而是整個西方技術社區和產業共同努力的結果。他們能看到下一代的技術趨勢,手裡有路線圖;中國AI的發展,同樣需要這樣的生態。 很多國產晶片發展不起來,也是因為缺乏配套的技術社區,只有第二手消息,所以中國必然需要有人站到技術的前沿。