中國DeepSeek 在人工智能領域掀起風暴 梁文鋒成焦點

中國新創公司「深度求索」(DeepSeek)近期發布的低成本生成式人工智慧(AI)模型,在市場上引起了巨大的反響。隨著該公司迅速崛起,其創辦人梁文鋒的過往也受到媒體的廣泛關注。美國總統川普表示,這對美國企業來說無疑是敲響「一記警鐘」。

DeepSeek創始人梁文鋒(前右)1月20日出席中國國務院總理李強主持召開的專家、企業家和教科文衛體等領域代表座談會並提出建言,受到關注。(圖取自央視網頁cctv.com)

就在一週前,梁文鋒參加了由中國國務院總理李強主持的專家座談會。根據央視新聞報導,李強於20日召集了來自各行各業的專家和企業家,共同討論「政府工作報告(徵求意見稿)」。在會議中,梁文鋒作為9位發言者之一,提出了建議。李強強調,科技創新將是推動新舊動能轉換的關鍵,並呼籲加快科技成果的產業化,以培育更多經濟增長點。

綜合多家媒體的報導,梁文鋒1985年出生於廣東省湛江市,17歲考入浙江大學,並於2010年獲得信息與通信工程碩士學位。他被業內人士稱為「一位極致的80後技術理想主義者」,日常工作包括「看論文,寫代碼,參與小組討論」。

在校期間,梁文鋒對金融市場產生了濃厚的興趣。2013年,他與同學徐進共同創立杭州雅克比投資管理有限公司,並在2015年成立杭州幻方科技有限公司,專注於利用數學和人工智慧進行量化投資。2016年,幻方量化推出了首個AI模型,並於2017年宣稱實現了投資策略的全面AI化,確立了以AI為公司的主要發展方向。

為了解決計算資源不足的問題,梁文鋒於2019年帶領團隊研發了「螢火一號」訓練平台,總投資近2億元人民幣,搭載1100塊GPU。兩年後,投資增加至10億元,搭載約1萬張輝達A100顯卡,顯示了公司雄厚的財力。

疫情期間,幻方量化曾公告其2022年度向慈善機構捐贈2.2138億元,公司的員工「一隻平凡的小豬」也向慈善機構捐贈1.38億元,外界猜測這隻「小豬」即是梁文鋒本人。

到了2021年,幻方的資產管理規模突破千億元大關,而在2023年,梁文鋒宣布進軍通用AI領域,成立了深度求索DeepSeek。他在接受媒體訪問時表示,「中國也要逐步成為貢獻者,而不是一直搭便車。」

DeepSeek於去年12月推出的DeepSeek-V3,因其極低的訓練成本而引起業界廣泛關注,聲稱性能媲美GPT-4o等頂尖模型。隨著新模型DeepSeek-R1的推出,1月27日,DeepSeek應用在蘋果中國及美國地區的應用商店免費下載排行榜中登頂,並在美區下載榜上超越了ChatGPT,顯示出其強大的市場競爭力。

美科技類股慘遭血洗

華爾街日報指出,以科技類股為主的那斯達克綜合指數(Nasdaq Composite)下跌3.1%;標普500指數(S&P 500)上週締造歷史新高後下跌1.5%。許多公司損失達雙位數。甲骨文(Oracle)股價下跌14%,美超微(Super Micro Computer)下跌13%,晶片製造商博通(Broadcom)重挫17%。

道瓊斯市場數據(Dow Jones Market Data)顯示,27日的市場大浴血讓美國股市蒸發約1兆美元。美股今天的跌勢堪稱突如其來的逆風,因為自川普當選以來美股即處於歷史高位,投資人押寶新政府親商政策,同時享受AI類股漲勢的紅利。

DeepSeek何以如此震撼

DeepSeek去年12月26日推出DeepSeek-V3這款大型語言模型,性能已可與OpenAI和Google等美企旗下優秀的聊天機器人媲美,單這點已讓外界驚艷。然而DeepSeek在一份說明技術構建的研究論文裡稱他們訓練AI所用晶片數量遠少於其他美企後,猶如引發地震。

全球一些頂尖企業用超級電腦訓練聊天機器人時動輒得用上至少1.6萬片晶片,然而DeepSeek工程師們說他們僅使用約2000片輝達(Nvidia)晶片。

此外,自從2022年底OpenAI掀起旋風以來,「不動輒重砸數十億美元沒法訓練出強大AI系統」始終是主流觀點,也予人唯有像微軟、Google、Meta等科技巨擘才玩得起先進AI、輝達這類AI晶片廠將一片光明的印象。

然而DeepSeek稱他們僅花費約560萬美元和相對原始的運算能力訓練自家系統,這比Meta建構旗下最新AI所花資金便宜約10倍,引來AI產業反思是否真有必要砸天文數字的資金、AI產業是否將泡沫化等。

DeepSeek是什麼

紐約時報指出,DeepSeek是由中國對沖基金幻方量化(High-Flyer)創辦與經營的新創公司,目標是打造出與OpenAI的ChatGPT、Google的Gemini等相近的人工智慧(AI)科技。

DeepSeek在中國以吸引年輕AI人才著稱,提供高薪和參與尖端研究計畫機會,招攬頂尖大學的研究人員,幻方量化與DeepSeek均為中國企業家梁文鋒所經營。

對DeepSeek的質疑

華爾街日報指出,幾名晶片分析師對DeepSeek能以如此低的成本構建出與美國先進AI模型相匹敵產品的說法提出質疑。研究機構伯恩斯坦(Bernstein)分析師瑞斯岡(Stacy Rasgon)仍不認為「DeepSeek是以500萬美元打造出OpenAI」。

花旗(Citi)分析師馬里克(Atif Malik)則表示「雖然DeepSeek的成就具突破性,但我們對它能在不使用先進GPU進行優化下依然能繳出成果的說法抱持懷疑」。

此外,美國財經新聞網CNBC指與其他中國聊天機器人一樣,DeepSeek在被問及某些敏感話題時有侷限性,例如問它關於中國一些政策時,DeepSeek似乎會迴避。

DeepSeek技術真能媲美OpenAI、Google嗎

根據一些標準基準測試,DeepSeek-V3一如市場現有的同類產品,即能有效地答覆詢問、解決邏輯問題並自行做編程。

就在DeepSeek公布自身技術前,OpenAI才揭櫫一款名為OpenAI o3的新系統,效能似乎比DeepSeek-V3更強,只是還沒對外推出。OpenAI o3的設計是能對數學、科學和電腦程式等問題「推理」;一些專家認為,DeepSeek還不具備這種未來AI趨勢的推理能力。

然DeepSeek旋即在1月20日發布自家推理模型DeepSeek-R1,終於引發投資圈和其他人因意識到DeepSeek帶來的影響性而於這週末陷入恐慌。

美國的晶片禁令難道沒用嗎

為維持美國在全球AI競賽領先地位,之前拜登政府限制向中國和其他競爭對手出售高性能晶片。DeepSeek的表現引發外界質疑,會否這些限制手段反迫使中國研究人員利用網上各種免費工具發揮創意。

有些專家依然支持美國做法,稱很多限制措施是近期才上路,遏止住中國研發AI的效果會隨時間益發增強。

但DeepSeek的突破仍給川普新政府一道難題:得考慮是否不僅要維繫拜登政府後期推動的晶片禁令,甚至還要加大掐脖力道,像是連輝達降階版的H20晶片都不能賣給中國。美國一些國會議員今天已呼籲川普政府實施更嚴格的出口管制,進一步限縮中國在AI取得進展。

何謂開源AI

與許多公司一樣,DeepSeek也把自身最新的AI系統「開源」(open sourced),即把支撐AI的運算代碼公開給其他企業和研究人員,讓所有人都能使用這些技術來建構、推廣自己的產品。DeepSeek與其他中國企業能如此迅速拿出具競爭力的AI產品,部分也是受惠於他人開源。

開源於AI世界興起是在2023年,Meta免費分享名為Llama的系統。當時許多人認為只有像Meta這種擁有靠專門晶片支撐大數據庫的公司繼續分享,開源生態才能蓬勃。但DeepSeek證明,就算沒有美國科技巨擘,開源生態照樣能有聲有色。

不少專家認為美國大公司不該開源自身技術,以免被用於散播假訊息或造成其他嚴重損害;一些美國議員已在探究立法設限的可行性。

但另有專家認為,如果在美限制開源,中國反將獲益,因為若好的開源技術都來自中國,日後反變成美國的研究人員和公司靠中國的技術發展自身系統。長此以往會讓中國成為AI研發領域的核心,進一步加速北京全面構建AI,包括無人武器等軍事系統。

DeepSeek鼓舞其他國家

華爾街日報指出,並非所有人都認為DeepSeek將顛覆AI產業。分析師瑞斯岡表示,儘管DeepSeek可能找出降低AI訓練成本的方法,但隨AI需求持續飆升,科技公司仍需更多的算力,不愁晶片賣不出,「DeepSeek會是AI產業生態的末日嗎,我們不覺得」。

不過DeepSeek的成功,可能重塑AI發展的全球競爭格局,讓美國以外的國家感到振奮。

像法國政府今天就表示,DeepSeek證明只要業者靈活具備巧妙技術,縱使資金少或無法獲得頂級晶片,照樣能在AI世界逐鹿中原。法國的官員就認為,不僅中國有機會,歐洲和世界其他地區也有機會追上矽谷。

留下一個答复

請輸入你的評論!
請在這裡輸入你的名字