應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊(cè)個(gè)人注冊(cè)登錄

云天勵(lì)飛公布大算力芯片戰(zhàn)略,誓將推理成本“狂砍”100倍

2026-02-05 09:09 視覺(jué)物聯(lián)
關(guān)鍵詞:云天勵(lì)飛

導(dǎo)讀:云天勵(lì)飛以一場(chǎng)“大算力芯片戰(zhàn)略前瞻會(huì)”向行業(yè)投下重磅炸彈:未來(lái)三年聚焦大模型落地成本攻堅(jiān),劍指百萬(wàn)Tokens推理成本降低100倍!

  當(dāng)AI大模型從實(shí)驗(yàn)室走向千行百業(yè),成本與效率的博弈正成為行業(yè)破局的關(guān)鍵。

  近日,云天勵(lì)飛以一場(chǎng)“大算力芯片戰(zhàn)略前瞻會(huì)”向行業(yè)投下重磅炸彈:未來(lái)三年聚焦大模型落地成本攻堅(jiān),劍指百萬(wàn)Tokens推理成本降低100倍!

  與此同時(shí),公司2025年業(yè)績(jī)預(yù)告釋放積極信號(hào)——營(yíng)收最高預(yù)增52.61%,虧損大幅收窄。

  這場(chǎng)“技術(shù)+商業(yè)”的雙輪驅(qū)動(dòng),能否為行業(yè)撕開(kāi)一條普惠AI的新賽道?

  芯片戰(zhàn)略:從“算力競(jìng)賽”到“成本革命”

  近年來(lái),全球AI產(chǎn)業(yè)格局正經(jīng)歷深刻重塑,其發(fā)展重心從“重訓(xùn)練”逐步轉(zhuǎn)向“重推理”。

  根據(jù)IDC預(yù)測(cè),推理算力占比將持續(xù)攀升,2024年占比40%,2027年將達(dá)70%。而這一轉(zhuǎn)變的背后,是AI應(yīng)用場(chǎng)景的加速落地與使用頻次的爆發(fā)式增長(zhǎng),推動(dòng)算力需求結(jié)構(gòu)發(fā)生根本性變化。

  然而,在AI大模型狂飆突進(jìn)的同時(shí),一個(gè)關(guān)鍵瓶頸日益凸顯:高昂的推理成本正成為AI規(guī)?;涞氐摹鞍⒖α鹚怪唷?,嚴(yán)重制約了技術(shù)從示范走向普及。

  面對(duì)這一行業(yè)性挑戰(zhàn),云天勵(lì)飛選擇將戰(zhàn)略重心聚焦于攻克大模型落地的“成本壁壘”,通過(guò)底層架構(gòu)創(chuàng)新開(kāi)啟“成本革命”。公司提出“百萬(wàn)Tokens推理成本降低100倍以上”的突破性目標(biāo),旨在推動(dòng)AI技術(shù)從實(shí)驗(yàn)室走向普惠化應(yīng)用,真正成為賦能千行百業(yè)的生產(chǎn)力工具。

  為實(shí)現(xiàn)這一目標(biāo),云天勵(lì)飛確立了GPNPU技術(shù)路線,構(gòu)建起“GPNPU=GPGPU+NPU+3D堆疊存儲(chǔ)”的核心技術(shù)框架。該架構(gòu)創(chuàng)造性地兼顧通用計(jì)算的“通用性”與NPU的“高效性”,在工程層面同步解決可遷移性、可部署性和持續(xù)降本三大難題,為推理時(shí)代提供系統(tǒng)級(jí)解決方案。

  在生態(tài)兼容性方面,針對(duì)CUDA作為全球主流加速計(jì)算平臺(tái)的現(xiàn)實(shí),云天勵(lì)飛的GPNPU架構(gòu)實(shí)現(xiàn)了“一行代碼完成CUDA程序兼容”,這種生態(tài)適配能力,顯著降低了技術(shù)遷移門檻。

  針對(duì)推理場(chǎng)景的能效優(yōu)化,云天勵(lì)飛通過(guò)引入針對(duì)大模型推理高度優(yōu)化的NPU單元,并結(jié)合3D堆疊存儲(chǔ)等先進(jìn)技術(shù)來(lái)突破“內(nèi)存墻”限制,從而在系統(tǒng)級(jí)提升帶寬、降低時(shí)延,將能效優(yōu)勢(shì)切實(shí)轉(zhuǎn)化為真實(shí)的成本優(yōu)勢(shì)。

  在架構(gòu)工程創(chuàng)新層面,云天勵(lì)飛強(qiáng)調(diào)了兩大務(wù)實(shí)策略:

  ①“算力積木”架構(gòu):基于Chiplet擴(kuò)展與互連技術(shù),將標(biāo)準(zhǔn)計(jì)算單元進(jìn)行模塊化封裝,支持算力像搭積木般靈活擴(kuò)展。這種設(shè)計(jì)使產(chǎn)品形態(tài)能夠覆蓋從邊緣計(jì)算到大規(guī)模推理的全場(chǎng)景需求。

  ②系統(tǒng)級(jí)優(yōu)化導(dǎo)向:拒絕單純的“芯片參數(shù)競(jìng)賽”,將“如何讓模型運(yùn)行更高效”的核心問(wèn)題融入架構(gòu)設(shè)計(jì)。通過(guò)圍繞真實(shí)業(yè)務(wù)負(fù)載持續(xù)迭代,系統(tǒng)性地破解推理鏈路中的成本與時(shí)延瓶頸。

  業(yè)績(jī)表現(xiàn):營(yíng)收增長(zhǎng),虧損進(jìn)一步收窄

  日前,云天勵(lì)飛發(fā)布2025年年度業(yè)績(jī)預(yù)告,公司主營(yíng)業(yè)務(wù)經(jīng)營(yíng)保持穩(wěn)健增長(zhǎng)勢(shì)頭,預(yù)計(jì)2025年公司營(yíng)業(yè)收入、毛利率較上年同期均提升顯著,公司虧損進(jìn)一步收窄。

  根據(jù)業(yè)績(jī)預(yù)告顯示,預(yù)計(jì)云天勵(lì)飛2025年?duì)I業(yè)收入為11.3億元至14億元,同比增長(zhǎng)23.18%至52.61%;預(yù)計(jì)實(shí)現(xiàn)歸屬于母公司所有者的凈利潤(rùn)為-4.71億元至-3.51億元,虧損同比收窄18.64%至39.36%。

  關(guān)于本期公司業(yè)績(jī)虧損變化的原因,云天勵(lì)飛表示,公司企業(yè)級(jí)和消費(fèi)級(jí)場(chǎng)景業(yè)務(wù)的銷售收入大幅增長(zhǎng),綜合毛利潤(rùn)較上年顯著提升,促使公司虧損收窄。

  同時(shí),為把握行業(yè)發(fā)展機(jī)遇,鞏固公司核心技術(shù)競(jìng)爭(zhēng)優(yōu)勢(shì),云天勵(lì)飛在高端人才、底層技術(shù)方面繼續(xù)加大投入。報(bào)告期內(nèi),公司研發(fā)投入仍保持較高水平,故公司經(jīng)營(yíng)毛利未覆蓋研發(fā)等方面投入,呈現(xiàn)虧損狀態(tài)。

  展望未來(lái),云天勵(lì)飛將繼續(xù)深耕核心業(yè)務(wù),持續(xù)推進(jìn)技術(shù)創(chuàng)新與市場(chǎng)落地,進(jìn)一步提升盈利能力與經(jīng)營(yíng)效益。

  行業(yè)視角:AI普惠時(shí)代加速到來(lái)?

  當(dāng)前,全球AI行業(yè)正邁入從“模型構(gòu)建”向“價(jià)值創(chuàng)造”的關(guān)鍵轉(zhuǎn)折期,產(chǎn)業(yè)邏輯也正經(jīng)歷多維度重構(gòu)。

  技術(shù)層面,單純追求參數(shù)規(guī)模的“軍備競(jìng)賽”已顯疲態(tài),增長(zhǎng)曲線趨于平緩。行業(yè)焦點(diǎn)正從“把模型做得更大”轉(zhuǎn)向“讓應(yīng)用跑得更穩(wěn)、更省”。技術(shù)創(chuàng)新重點(diǎn)不再局限于提升理論性能峰值,而是更加聚焦于優(yōu)化工程落地與部署效率。

  商業(yè)層面,企業(yè)客戶對(duì)AI投入的審視日趨理性務(wù)實(shí),投資回報(bào)率(ROI)已成為決策的核心標(biāo)尺。在規(guī)?;渴鸬倪M(jìn)程中,推理成本的可控性、解決方案的穩(wěn)定性以及整體運(yùn)營(yíng)成本效益等,正超越單純的性能參數(shù),成為采購(gòu)決策中更具分量的決定性指標(biāo)。

  政策層面,國(guó)家“人工智能+”行動(dòng)計(jì)劃的推進(jìn),明確提出要降低技術(shù)應(yīng)用門檻、賦能廣大中小企業(yè)。這要求產(chǎn)業(yè)界不僅提供先進(jìn)技術(shù),更需通過(guò)架構(gòu)創(chuàng)新與成本優(yōu)化,打造“用得起、用得好”的算力基礎(chǔ)設(shè)施,使AI紅利能廣泛滲透至實(shí)體經(jīng)濟(jì)各毛細(xì)血管。

  而這一切的共同作用,清晰地指向同一個(gè)產(chǎn)業(yè)剛需:一場(chǎng)以“極致性價(jià)比”為核心的算力成本革命已勢(shì)在必行。這也正是云天勵(lì)飛提出“成本革命”戰(zhàn)略的深層背景——AI普惠并非自然結(jié)果,而是需要通過(guò)創(chuàng)新實(shí)現(xiàn)的技術(shù)經(jīng)濟(jì)可行性突破。

  寫在最后

  隨著全球算力產(chǎn)業(yè)的風(fēng)向標(biāo)加速向推理側(cè)傾斜,一場(chǎng)圍繞“單位推理成本”的競(jìng)賽已然拉開(kāi)序幕。當(dāng)推理成本真正降至足夠低的水平,AI才能真正走出實(shí)驗(yàn)室和演示場(chǎng)景,成為千行百業(yè)日??梢蕾?、可負(fù)擔(dān)的通用生產(chǎn)力工具。這場(chǎng)圍繞成本效率的競(jìng)賽,將最終決定AI普惠時(shí)代的到來(lái)時(shí)間和普及廣度。