應用

技術

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點新聞
企業(yè)注冊個人注冊登錄

云天勵飛公布大算力芯片戰(zhàn)略,誓將推理成本“狂砍”100倍

2026-02-05 09:09 視覺物聯(lián)
關鍵詞:云天勵飛

導讀:云天勵飛以一場“大算力芯片戰(zhàn)略前瞻會”向行業(yè)投下重磅炸彈:未來三年聚焦大模型落地成本攻堅,劍指百萬Tokens推理成本降低100倍!

  當AI大模型從實驗室走向千行百業(yè),成本與效率的博弈正成為行業(yè)破局的關鍵。

  近日,云天勵飛以一場“大算力芯片戰(zhàn)略前瞻會”向行業(yè)投下重磅炸彈:未來三年聚焦大模型落地成本攻堅,劍指百萬Tokens推理成本降低100倍!

  與此同時,公司2025年業(yè)績預告釋放積極信號——營收最高預增52.61%,虧損大幅收窄。

  這場“技術+商業(yè)”的雙輪驅動,能否為行業(yè)撕開一條普惠AI的新賽道?

  芯片戰(zhàn)略:從“算力競賽”到“成本革命”

  近年來,全球AI產業(yè)格局正經歷深刻重塑,其發(fā)展重心從“重訓練”逐步轉向“重推理”。

  根據(jù)IDC預測,推理算力占比將持續(xù)攀升,2024年占比40%,2027年將達70%。而這一轉變的背后,是AI應用場景的加速落地與使用頻次的爆發(fā)式增長,推動算力需求結構發(fā)生根本性變化。

  然而,在AI大模型狂飆突進的同時,一個關鍵瓶頸日益凸顯:高昂的推理成本正成為AI規(guī)?;涞氐摹鞍⒖α鹚怪唷?,嚴重制約了技術從示范走向普及。

  面對這一行業(yè)性挑戰(zhàn),云天勵飛選擇將戰(zhàn)略重心聚焦于攻克大模型落地的“成本壁壘”,通過底層架構創(chuàng)新開啟“成本革命”。公司提出“百萬Tokens推理成本降低100倍以上”的突破性目標,旨在推動AI技術從實驗室走向普惠化應用,真正成為賦能千行百業(yè)的生產力工具。

  為實現(xiàn)這一目標,云天勵飛確立了GPNPU技術路線,構建起“GPNPU=GPGPU+NPU+3D堆疊存儲”的核心技術框架。該架構創(chuàng)造性地兼顧通用計算的“通用性”與NPU的“高效性”,在工程層面同步解決可遷移性、可部署性和持續(xù)降本三大難題,為推理時代提供系統(tǒng)級解決方案。

  在生態(tài)兼容性方面,針對CUDA作為全球主流加速計算平臺的現(xiàn)實,云天勵飛的GPNPU架構實現(xiàn)了“一行代碼完成CUDA程序兼容”,這種生態(tài)適配能力,顯著降低了技術遷移門檻。

  針對推理場景的能效優(yōu)化,云天勵飛通過引入針對大模型推理高度優(yōu)化的NPU單元,并結合3D堆疊存儲等先進技術來突破“內存墻”限制,從而在系統(tǒng)級提升帶寬、降低時延,將能效優(yōu)勢切實轉化為真實的成本優(yōu)勢。

  在架構工程創(chuàng)新層面,云天勵飛強調了兩大務實策略:

  ①“算力積木”架構:基于Chiplet擴展與互連技術,將標準計算單元進行模塊化封裝,支持算力像搭積木般靈活擴展。這種設計使產品形態(tài)能夠覆蓋從邊緣計算到大規(guī)模推理的全場景需求。

  ②系統(tǒng)級優(yōu)化導向:拒絕單純的“芯片參數(shù)競賽”,將“如何讓模型運行更高效”的核心問題融入架構設計。通過圍繞真實業(yè)務負載持續(xù)迭代,系統(tǒng)性地破解推理鏈路中的成本與時延瓶頸。

  業(yè)績表現(xiàn):營收增長,虧損進一步收窄

  日前,云天勵飛發(fā)布2025年年度業(yè)績預告,公司主營業(yè)務經營保持穩(wěn)健增長勢頭,預計2025年公司營業(yè)收入、毛利率較上年同期均提升顯著,公司虧損進一步收窄。

  根據(jù)業(yè)績預告顯示,預計云天勵飛2025年營業(yè)收入為11.3億元至14億元,同比增長23.18%至52.61%;預計實現(xiàn)歸屬于母公司所有者的凈利潤為-4.71億元至-3.51億元,虧損同比收窄18.64%至39.36%。

  關于本期公司業(yè)績虧損變化的原因,云天勵飛表示,公司企業(yè)級和消費級場景業(yè)務的銷售收入大幅增長,綜合毛利潤較上年顯著提升,促使公司虧損收窄。

  同時,為把握行業(yè)發(fā)展機遇,鞏固公司核心技術競爭優(yōu)勢,云天勵飛在高端人才、底層技術方面繼續(xù)加大投入。報告期內,公司研發(fā)投入仍保持較高水平,故公司經營毛利未覆蓋研發(fā)等方面投入,呈現(xiàn)虧損狀態(tài)。

  展望未來,云天勵飛將繼續(xù)深耕核心業(yè)務,持續(xù)推進技術創(chuàng)新與市場落地,進一步提升盈利能力與經營效益。

  行業(yè)視角:AI普惠時代加速到來?

  當前,全球AI行業(yè)正邁入從“模型構建”向“價值創(chuàng)造”的關鍵轉折期,產業(yè)邏輯也正經歷多維度重構。

  技術層面,單純追求參數(shù)規(guī)模的“軍備競賽”已顯疲態(tài),增長曲線趨于平緩。行業(yè)焦點正從“把模型做得更大”轉向“讓應用跑得更穩(wěn)、更省”。技術創(chuàng)新重點不再局限于提升理論性能峰值,而是更加聚焦于優(yōu)化工程落地與部署效率。

  商業(yè)層面,企業(yè)客戶對AI投入的審視日趨理性務實,投資回報率(ROI)已成為決策的核心標尺。在規(guī)?;渴鸬倪M程中,推理成本的可控性、解決方案的穩(wěn)定性以及整體運營成本效益等,正超越單純的性能參數(shù),成為采購決策中更具分量的決定性指標。

  政策層面,國家“人工智能+”行動計劃的推進,明確提出要降低技術應用門檻、賦能廣大中小企業(yè)。這要求產業(yè)界不僅提供先進技術,更需通過架構創(chuàng)新與成本優(yōu)化,打造“用得起、用得好”的算力基礎設施,使AI紅利能廣泛滲透至實體經濟各毛細血管。

  而這一切的共同作用,清晰地指向同一個產業(yè)剛需:一場以“極致性價比”為核心的算力成本革命已勢在必行。這也正是云天勵飛提出“成本革命”戰(zhàn)略的深層背景——AI普惠并非自然結果,而是需要通過創(chuàng)新實現(xiàn)的技術經濟可行性突破。

  寫在最后

  隨著全球算力產業(yè)的風向標加速向推理側傾斜,一場圍繞“單位推理成本”的競賽已然拉開序幕。當推理成本真正降至足夠低的水平,AI才能真正走出實驗室和演示場景,成為千行百業(yè)日常可依賴、可負擔的通用生產力工具。這場圍繞成本效率的競賽,將最終決定AI普惠時代的到來時間和普及廣度。