新華社瑞士達沃斯1月24日電 國際輿論:中國AI快速發(fā)展 美國打壓盡顯尷尬
新華社記者郭爽
近來,中國人工智能(AI)領域,特別是大型語言模型技術迅猛發(fā)展。多方評論指出,中國AI技術的快速發(fā)展,讓美國打壓政策盡顯尷尬。
世界經(jīng)濟論壇2025年年會開幕當天,中國深度求索公司發(fā)布其最新開源模型DeepSeek-R1,這一模型在技術上實現(xiàn)了重要突破——用純深度學習的方法讓AI自發(fā)涌現(xiàn)出推理能力。該模型延續(xù)了其高性價比的優(yōu)勢。據(jù)該公司介紹,DeepSeek-R1在后訓練階段大規(guī)模使用了強化學習技術,在僅有極少標注數(shù)據(jù)的情況下,極大提升了模型推理能力。在數(shù)學、代碼、自然語言推理等任務上,性能比肩美國開放人工智能研究中心(OpenAI)的o1模型正式版。
中國AI技術在瑞士達沃斯舉辦的世界經(jīng)濟論壇2025年年會的相關討論中成了熱議話題。美國麻省理工學院知名AI專家馬克斯·特格馬克教授在年會上接受新華社記者專訪時說,去年以來,中國在AI領域取得了巨大進步。特格馬克高度贊揚中國深度求索公司最新發(fā)布的大型語言模型。
他指出,如果說一年前中國在前沿大型語言模型上略顯落后的話,現(xiàn)在中國已基本趕上,這更顯示出因地緣政治而破壞科技合作這一行為的“愚蠢和錯誤”。
過去一年,中國在AI領域發(fā)展迅速。OpenAI在2024年9月發(fā)布了推理模型o1。僅隔數(shù)月,中國企業(yè)阿里巴巴的通義千問團隊在2024年11月底推出了實驗性研究模型QwQ-32B-Preview,該模型在多個測試中展現(xiàn)出了與OpenAI的o1模型相當甚至超越的推理能力。中國深度求索公司在2024年12月下旬發(fā)布混合專家模型DeepSeek-V3。測試結果顯示,它的多項評測成績超越了Llama-3.1-405B等開源模型,并在性能上和世界頂尖的閉源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲,并且DeepSeek-V3還具有成本優(yōu)勢。
OpenAI在2024年2月初發(fā)布視頻生成模型“天空”后,中國短視頻平臺快手公司在2024年6月發(fā)布視頻生成大模型“可靈”。在隨后幾個月里,包括智譜AI、字節(jié)跳動以及騰訊在內的一批中國公司也推出了類似工具。
英國《經(jīng)濟學人》雜志撰文指出,美國試圖阻止中國在AI領域的追趕,但中國最近的進展正在顛覆整個AI行業(yè),讓美國政策制定者感到“尷尬”。中國模式的成功,加上整個行業(yè)的變化,可能會重塑AI行業(yè)的經(jīng)濟模式。
美國《紐約時報》刊登的一篇文章說,與谷歌和OpenAI等美國巨頭的產(chǎn)品相比,中國公司打造了一款更便宜、更有競爭力的模型。
美國喬治·華盛頓大學專門研究新興技術和國際關系的助理教授杰弗里·?。ㄒ簦┍硎?,美國對中國芯片的限制迫使中國工程師“更有效地訓練它(模型),以使其仍然具有競爭力”。
除了大型語言模型外,物理AI也將給中國帶來良好機會。中國禾賽科技聯(lián)合創(chuàng)始人李一帆在達沃斯論壇期間指出,當把數(shù)字世界的AI和物理產(chǎn)品結合的時候,人們會發(fā)現(xiàn)無論是車、機器人,還是其他消費電子產(chǎn)品領域,中國企業(yè)在供應鏈、最終制造能力、最終完整閉環(huán)、成本控制、最終上量等的能力方面,都具有很大優(yōu)勢。