2025/02/24 18:27 慢放
AI競技場正靜靜見證著一場深刻的技術權力騰挪。
這場由DeepSeek引發的變革仍未見平息,大模型競爭進入“后暴力計算時代”,效率的重要性躍然紙上,而AI權力也面臨重構,OpenAI“一家獨大”的局面正不斷受到沖擊。
后浪兇猛進化,前浪披荊斬棘,“城頭變幻大王旗”贏家尚未有定論,如何既通過開源獲取生態的加持,又利用閉源實現商業變現,才是決勝的關鍵。
01中國AI項目乘政策風“井噴”
國產AI的發展在不聲不響間悄然醞釀。2023年被業內人士視為人工智能發展的分水嶺。
人工智能科學家李飛飛曾說:“在歷史上,2023 年有望因技術的深刻變化和公眾覺醒而被人們銘記。”
而在此之前,關于人工智能的技術探索和創新早已不勝枚舉。
1956年約翰·麥卡錫在達特茅斯會議上首次提出“人工智能”(Artificial Intelligence)概念,AI作為一門學科正式誕生。
但到了1973年,由于AI研究遭遇瓶頸,對AI的資金投入大幅縮水,發展進入 “寒冬”。
1986年,直到“AI教父”杰弗里·辛頓(Geoffrey Hinton)提出了反向傳播(Backpropagation)算法,神經網絡的復興讓AI發展再迎曙光,再到2017年Google提出基于自注意力機制(Self-Attention),取代RNN/LSTM,成為后續大語言模型(LLM)的核心架構……
回望國內的AI發展歷程,2023年同樣是“國產AI時代開啟元年”。
據天眼查,僅2023年上半年與大模型直接相關的融資事件超20起,國內已發布的各類大模型數量超過100個,而到了2024年7月時完成備案并上線的生成式AI大模型數量接近200個。
直到今天,有機會沖進決賽圈的依然只有十幾家。咨詢機構弗若斯特沙利文指出,我們目前在通用基礎大模型領域的競爭者已縮減至20余家,主要由互聯網企業、云計算巨頭及人工智能創業公司主導。
大家都是這場沒有硝煙的“戰爭”的親歷者,站在2025年的開年回望,或許是經歷了2024年 “百模大戰”的大浪淘沙,DeepSeek才得以在2025年開年在全球科技行業投擲下“驚雷”,推動國產AI實現了"關鍵一躍",站穩腳跟。
擁有持續創新能力的企業逐漸占據市場主導,從圖文轉視頻到多語言廣告生成,人工智能的應用范圍正在迅速拓展。
與此同時,大模型和智能體技術也進入了加速發展階段。無論是C端的用戶體驗優化,還是B端的企業解決方案,智能體和大模型正在重新定義技術與社會的連接方式。
決賽圈里目前有三股力量:一是阿里巴巴、字節跳動代表的互聯網大廠、云服務商,介入大模型;二是科大訊飛代表的人工智能國家隊,以G/B/C聯動的方式,既做解決方案又做硬件產品;三是智譜、DeepSeek等AI創業公司,少數還在堅持基礎模型創新。
產業鏈上下游處境分化,模型廠商發展路徑分野。即便“AI六小虎”,也面臨道路分化。例如,百川智能已轉向醫療等行業大模型;零一萬物將超級大模型訓練交給阿里;月之暗面和MiniMax專注做C端應用和產品。
業內人士普遍認為,與產業鏈上下游相比,處于中游的模型廠商普遍面臨盈利困境。2025年,大模型決賽圈的選手,還能在基礎大模型層創新的企業,會進一步減少。
02從“燒錢信仰”到“效率革命”
如果說“成本、AI Agent、多模態”是當下AI產業的三個關鍵詞,代表著2024年大模型的進化方向,那么它們或許也代表著大模型邁向產業落地的關鍵節點。
首先,成本無疑是決定企業生死的關鍵,訓練和部署大規模 AI模型對計算資源的龐大需求不容忽視,這也使得企業必須背負高昂的計算成本和運維成本。
DeepSeek-R1也正是抓了企業在效率和成本控制上的痛點,實現了在相對較低的算力投入下,可媲美甚至超越頭部模型的性能表現。
傳統人工智能發展模式往往依賴于“規模至上”的邏輯,追求超大規模模型和超大規模算力集群。DeepSeek R1的輕量化模型和開源策略,降低了人工智能應用的門檻,促進了中端算力設施和分布式數據中心的普及。
產業鏈上游的英偉達,因DeepSeek的出現開始面臨一定需求結構調整的壓力。
ASIC芯片廠商則迎來了新的發展機遇。由于ASIC芯片能夠針對特定人工智能應用進行硬件加速,在能效比和成本控制上具有明顯優勢,更適應分布式算力發展的趨勢。
對于算力服務端來說,區域性數據中心憑借低時延和貼近應用場景的優勢,開始承接制造業智能質檢、金融風控等對延遲敏感的應用需求。
AWS、阿里云等云計算巨頭調整部分大型數據中心的建設策略,加大在邊緣計算和分布式算力布局方面的投入。
而應用端則將受益于算力成本的下降,驅動人工智能在制造業、金融、醫療等領域的滲透加速。
在代碼托管平臺GitHub上,已涌現出大量基于DeepSeek模型的集成應用案例(awesome deepseek integration),形成“需求牽引供給”的正向循環,實現“算力+行業”的雙向賦能。
人工智能技術將加速滲透到各行各業,成為推動產業升級和經濟發展的重要引擎。
但值得關注的是,DeepSeek R1的技術突破,在降低人工智能應用門檻的同時,也可能引發“杰文斯悖論”。
杰文斯悖論由19世紀經濟學家 William Stanley Jevons提出,他發現,隨著煤炭使用效率的提高,煤炭的消耗總量反而增加。這一悖論揭示了一個深刻的經濟規律:效率的提升并不必然導致資源消耗的減少,反而可能因為成本降低和應用范圍擴大,刺激需求增長,最終導致資源消耗總量增加。
微軟 CEO 薩提亞·納德拉引用杰文斯悖論來解釋DeepSeek R1可能帶來的影響,可謂一針見血。
納德拉認為,更實惠、更易于訪問的人工智能技術,將通過更快的普及和更廣泛的應用,導致需求的激增。隨著人工智能技術的門檻降低,過去由于成本限制而無法應用人工智能的領域,例如中小企業、邊緣計算場景等,將涌現出大量新的應用需求,從而導致算力調用密度指數級上升。
新興應用場景的爆發,也將加速算力需求的裂變。智能駕駛、具身機器人等前沿領域對實時算力的需求極為龐大,遠超DeepSeek技術優化的速度。即使單任務效率提升數倍,百萬級智能終端的并發需求,仍將形成巨大的算力吞噬黑洞。
03“開源”與“閉源”的協同
隨著開源大模型DeepSeek的“爆火”,“開源”和“免費”等關鍵詞頻現。
如果說,在DeepSeek之前,國內大模型企業關于“開源”和“閉源”的路徑仍多有分歧,現在“開源”、“開放生態”、擴大朋友圈的呼聲似乎成了主流。
在DeepSeek這條鯰魚的沖擊之下,國內大模型企業展示出更“開放”的姿態,希望加快建立自己的開發者生態和應用生態。
而開源模型和閉源模型的關鍵差異,則可以從基礎條件、技術層面和商業化三個維度來觀察。
從基礎條件看,開源模型以公開數據集、社區貢獻數據為數據來源,以分布式的、開發者自有的GPU集群為算力支撐,為開發者、研究者、企業等提供了平等的接入機會,促進了技術的創新和共享。
閉源模型則是由公司或團隊開發,以專有數據如用戶行為日志、私有數據庫、清洗后公開數據為數據來源,用戶只能根據公司提供的接口或平臺使用這些模型。
從盈利場景看,開源模型本身并不直接帶來收益,但它們通常通過附加服務(如云計算、技術支持、培訓、定制化開發等)來實現營利。公司可以通過商業化的方式提供增值服務,依托開源模型形成可持續的收入來源。
閉源模型的商業化路徑相對直接,企業通過授權許可、訂閱服務、平臺收費等方式實現營利。閉源模型能為公司帶來高利潤,因為客戶需要為其使用權限和服務支付費用。
開源與閉源并非“水火不融”,未來很可能會形成開源與閉源相互作用的形式,開源加速了AI技術的普及和創新,而閉源則確保技術能夠在商業上獲得長足發展并維持穩定性。
未來的贏家將是能同時掌握開源和閉源能力的多面手,,既通過開源獲取生態勢能,也利用閉源實現價值捕獲。
正如納德拉所說,“超大規模AI不會出現贏者通吃的局面,開源模式將制衡閉源。”
尾聲
DeepSeek 在當下的AI時代將扮演重要角色,就像 Android 之于移動互聯網革命。
重構產業生態,引發鏈式反應,加速上層應用發展與下層系統統一。這將調動起跨越軟硬件和上下游的生態力量,促使各方加大 “模型 - 芯片 - 系統” 協同優化與垂直打通的投入,進一步削弱 CUDA 生態優勢,為國產 AI 產業發展創造機遇。
DeepSeek 通過技術創新,在 AI 模型訓練過程中實現了對高端進口芯片依賴的降低,這為國內企業展示了一條可行的技術路徑,極大地增強了國內企業自主研發算力芯片的信心。
博弈,不僅僅是開源以及閉源的技術選擇,更是涉及 AI 發展的話語權、市場主導權以及算力的分配的角逐。而這場AI權利爭奪戰已然開始。
榜單收錄、高管收錄、融資收錄、活動收錄可發送郵件至news#citmt.cn(把#換成@)。