機構指出,隨著AI應用進入爆發期,企業級部署需求呼之欲出,醫療、政務、Manus等應用落地都成為了市場關注的焦點,科技大廠也在加速AI投入,實現向下個時代的布局。雖然大模型推理成本在下降,但是由此帶來的應用爆發有望帶來更多的應用需求,成為下一階段拉動算力增長的主要驅動力。
核心邏輯
1.3月9日,國家超算互聯網平臺正式上線通義千問QwQ-32B API服務,向用戶提供免費100萬tokens的試用額度。該模型以320億參數量實現性能突破,在數學、代碼及通用能力的多項權威評測中,表現與參數規模更大的DeepSeek-R1模型相當。除了國家超算互聯網平臺,國產算力平臺紛紛接入阿里千問QwQ。算能科技官方公眾號顯示,算能SophNet平臺火速上線了QwQ-32B大模型,開發者僅需創建服務時選擇QwQ-32B模型,即可完成API配置;硅基流動SiliconCloud也在第一時間上線了推理加速版QwQ-32B,免去開發者部署門檻;同期,壁仞科技推出QwQ-32B大模型一體機,通過軟硬件協同優化實現75TPS(每秒處理75萬條請求)的推理速度;青云科技AI算力云平臺亦上線該模型,進一步降低企業部署門檻。
2.AI領域軟硬件共振。軟件方面,谷歌Research、谷歌Search、谷歌DeepMind三大團隊發布論文《Communication-Efficient Language Model Training Scales Reliably and Robustly: Scaling Laws for DiLoCo》,論文中重點分析了算法因素如何影響訓練過程,并證明這些影響可通過Scaling Law準確預測。結果表明,DiLoCo在模型規模增長時,表現出穩定且可預測的擴展性,這表明Scaling Law繼續有效。此外,近期AI領域仍持續發布新型軟硬件產品,如近期開源的Open-Sora 2.0,再次推進了視頻生成領域的進展。硬件方面,英偉達在GTC大會上有望提出新產品的相關更新。
3.DeepSeek的技術突破雖然短期內引發市場對高端AI芯片需求的擔憂,但通過降低大模型訓練準入門檻擴大了整體市場規模。首先受益的是國產算力芯片廠商,特別是華為昇騰等已經在推理性能上接近國際水平的企業,將借助性價比優勢在企業級部署市場獲得突破。隨著企業級部署需求增長,算力租賃商將迎來增長,大量中小企業會選擇更靈活的租賃方案來降低初始投入。當大模型部署成本降低到一定水平后,終端設備推理算力需求將顯著提升,驅動端側AI芯片市場擴容。
利好個股:
信達證券建議關注:工業富聯、滬電股份、生益科技、深南電路、藍思科技等。
本文內容精選自以下研報:
《平安證券:國產算力平臺加速適配通義千問,強勁推理能力領跑開源生態》
《國泰君安計算機行業專題研究:DeepSeek重構算力基建長期價值的認知》
《中原證券計算機行業月報:國內算力投入明顯加快,平臺企業借勢積極入局》
《信達證券:英偉達GTC大會在即,建議關注算力產業鏈》
校對:劉榕枝