應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊(cè)個(gè)人注冊(cè)登錄

中國(guó)移動(dòng)發(fā)布 MoMA 平臺(tái):?jiǎn)挝?Token 成本壓降 30%,接入超 300 款 AI 模型

2026-05-09 09:56 IT之家

導(dǎo)讀:中國(guó)移動(dòng)發(fā)布移動(dòng)模型服務(wù)平臺(tái) MoMA,接入超 300 款業(yè)界主流 AI 模型,首創(chuàng) Token(詞元)集約化運(yùn)營(yíng)模式,基于國(guó)產(chǎn)算力部署自研推理引擎打造。

  5 月 8 日消息,中國(guó)移動(dòng)發(fā)布移動(dòng)模型服務(wù)平臺(tái) MoMA,接入超 300 款業(yè)界主流 AI 模型,首創(chuàng) Token(詞元)集約化運(yùn)營(yíng)模式,基于國(guó)產(chǎn)算力部署自研推理引擎打造。

  從官方新聞稿了解到,MoMA 可提供統(tǒng)一 API 網(wǎng)關(guān),目前已接入中國(guó)移動(dòng)自研基座大模型“九天”,以及 DeepSeek、通義千問(wèn)、豆包、Kimi、GLM 等業(yè)界優(yōu)質(zhì)模型,覆蓋文本生成、語(yǔ)音處理、多模態(tài)理解等多項(xiàng)能力,滿足政務(wù)、金融、工業(yè)、醫(yī)療等場(chǎng)景應(yīng)用需求。

  MoMA 平臺(tái)基于國(guó)產(chǎn)算力部署自研推理引擎打造,結(jié)合智能路由對(duì)長(zhǎng)尾模型資源調(diào)度,實(shí)現(xiàn)單位 Token 成本壓降約 30%、降低資源占用率 50% 以上。還能通過(guò)智能緩存、上下文復(fù)用、Token 壓縮等技術(shù)進(jìn)一步降低使用成本。

  同時(shí),該平臺(tái)還首創(chuàng)智能路由引擎技術(shù),可根據(jù)用戶需求靈活切換“成本優(yōu)先”“效果優(yōu)先”“均衡優(yōu)先”等三種策略,為用戶動(dòng)態(tài)匹配最適合的模型。當(dāng)模型出現(xiàn)超時(shí)、限流或故障時(shí),平臺(tái)可自動(dòng)實(shí)現(xiàn)秒級(jí)切換,確保業(yè)務(wù)連續(xù)不中斷。

  此外,MoMA 還帶有“機(jī)密模型”服務(wù),將模型部署在機(jī)密容器中,基于硬件隔離技術(shù)保障計(jì)算過(guò)程的數(shù)據(jù)安全,覆蓋從芯片到應(yīng)用的全鏈路機(jī)密計(jì)算,為政務(wù)、金融等數(shù)據(jù)安全要求較高的場(chǎng)景提供可靠支撐