技術(shù)
導(dǎo)讀:XMOS聚焦生成式系統(tǒng)級(jí)芯片(GenSoC)開(kāi)發(fā)模式、邊緣AI視覺(jué)處理、DNN降噪智能拾音、隱私優(yōu)先的語(yǔ)音交互方案和基于以太網(wǎng)的網(wǎng)絡(luò)音頻五大核心方向,依托其xcore.ai處理器將“AI+DSP+I/O+MCU”四項(xiàng)功能集成在一顆芯片上的架構(gòu)優(yōu)勢(shì),展現(xiàn)了邊緣智能在實(shí)時(shí)性、低時(shí)延、安全性與開(kāi)發(fā)便捷性上的顛覆性突破。
3月10日至12日,2026年嵌入式世界展(Embedded World 2026,簡(jiǎn)稱EW26)在德國(guó)紐倫堡展覽中心成功舉辦。作為領(lǐng)先的邊緣AI與智能音頻等媒體處理技術(shù)和芯片解決方案提供商,XMOS以沉浸式演示與技術(shù)交流,全面呈現(xiàn)邊緣計(jì)算、人工智能與音頻處理深度融合的前沿解決方案,為全球開(kāi)發(fā)者提供了下一代嵌入式開(kāi)發(fā)和媒體處理技術(shù)的創(chuàng)新路徑。
在本次展會(huì)上,XMOS聚焦生成式系統(tǒng)級(jí)芯片(GenSoC)開(kāi)發(fā)模式、邊緣AI視覺(jué)處理、DNN降噪智能拾音、隱私優(yōu)先的語(yǔ)音交互方案和基于以太網(wǎng)的網(wǎng)絡(luò)音頻五大核心方向,依托其xcore.ai處理器將“AI+DSP+I/O+MCU”四項(xiàng)功能集成在一顆芯片上的架構(gòu)優(yōu)勢(shì),展現(xiàn)了邊緣智能在實(shí)時(shí)性、低時(shí)延、安全性與開(kāi)發(fā)便捷性上的顛覆性突破。
·面向音頻DSP的生成式SoC
生成式SoC代表了從底層硬件實(shí)現(xiàn)差異化系統(tǒng)開(kāi)發(fā)的新范式,也是今天的人工智能技術(shù)給電子行業(yè)帶來(lái)的創(chuàng)新發(fā)展之道。XMOS在行業(yè)內(nèi)率先實(shí)現(xiàn)面向音頻DSP應(yīng)用的生成式SoC技術(shù)落地,該技術(shù)基于xcore.ai處理器靈活的高確定性硬件架構(gòu)、專用開(kāi)發(fā)工具鏈與大模型編程能力的深度耦合,開(kāi)發(fā)者利用自然語(yǔ)言描述所需DSP功能,僅需數(shù)分鐘就能完成音頻DSP的開(kāi)發(fā),從而實(shí)現(xiàn)開(kāi)發(fā)流程顛覆性簡(jiǎn)化和工程經(jīng)驗(yàn)門檻的大幅度降低。
結(jié)合軟件定義SoC、大模型和生成式工具的GenSoC是智能化時(shí)代的SoC芯片開(kāi)發(fā)模式之一
在EW26現(xiàn)場(chǎng)演示中,系統(tǒng)可通過(guò)自然語(yǔ)言交互完成音頻處理鏈路定義,無(wú)需底層硬件配置與復(fù)雜代碼開(kāi)發(fā),即可在數(shù)分鐘內(nèi)生成完整DSP處理邏輯,并快速完成直播聲卡等終端產(chǎn)品原型驗(yàn)證。GenSoC將硬件架構(gòu)抽象、資源調(diào)度、外設(shè)配置等環(huán)節(jié)自動(dòng)化,大幅降低嵌入式音頻開(kāi)發(fā)門檻,使軟件工程師可直接完成SoC定制化開(kāi)發(fā),標(biāo)志著音頻DSP從代碼開(kāi)發(fā)向意圖驅(qū)動(dòng)開(kāi)發(fā)跨越。
·邊緣AI視覺(jué)
XMOS邊緣AI視覺(jué)方案基于XCORE®多核并行處理器架構(gòu),其核心優(yōu)勢(shì)在于端側(cè)獨(dú)立推理、高確定性執(zhí)行與微秒級(jí)時(shí)延,可以應(yīng)用于多種需要高實(shí)時(shí)性和網(wǎng)絡(luò)能力受限的應(yīng)用場(chǎng)景。
該方案無(wú)需依賴云端算力,可在本地完成圖像采集、特征提取、DNN模型推理與執(zhí)行指令輸出,實(shí)現(xiàn)實(shí)時(shí)識(shí)別與即時(shí)響應(yīng)。依托xcore.ai處理器“四合一”單芯片集成架構(gòu),系統(tǒng)兼具控制能力與AI加速能力,可在嚴(yán)格時(shí)延約束下完成決策執(zhí)行,同時(shí)滿足邊緣設(shè)備隱私保護(hù)、快速啟動(dòng)、低功耗等關(guān)鍵指標(biāo),拓展了邊緣視覺(jué)在工業(yè)、消費(fèi)與專業(yè)設(shè)備中的適用邊界。
·DNN降噪AI智能拾音
針對(duì)專業(yè)音頻、工業(yè)級(jí)應(yīng)用和通信領(lǐng)域的嚴(yán)苛指標(biāo),XMOS依托自研的xcore.ai高實(shí)時(shí)性加速引擎與先進(jìn)深度神經(jīng)網(wǎng)絡(luò)(DNN)算法,實(shí)現(xiàn)專業(yè)級(jí)遠(yuǎn)場(chǎng)拾音與抗干擾能力,該方案已得到市場(chǎng)的充分驗(yàn)證。
XMOS的DNN降噪系統(tǒng)解決方案可實(shí)時(shí)區(qū)分人聲、環(huán)境噪聲與突發(fā)非人聲干擾,通過(guò)DNN模型完成動(dòng)態(tài)噪聲抑制與目標(biāo)聲音增強(qiáng),在高混響、強(qiáng)噪聲等極端聲學(xué)環(huán)境下仍保持穩(wěn)定拾音性能。目前XMOS已助力多家客戶的AI智能拾音方案落地并推出了成熟產(chǎn)品,成為遠(yuǎn)場(chǎng)語(yǔ)音交互的核心技術(shù)支撐。
·隱私優(yōu)先的語(yǔ)音交互
隨著邊緣AI和物理AI的廣泛興起,用戶隱私信息與AI處理的便利性正變得同等重要,因而離線本地指令加上連續(xù)監(jiān)測(cè)拾音所帶來(lái)的更高安全性正變得日益重要。XMOS基于其在市場(chǎng)上廣受歡迎的系列語(yǔ)音處理器和解決方案,采用本地離線AI指令架構(gòu),打造了隱私優(yōu)先的語(yǔ)音交互方案。
該方案所有的語(yǔ)音信號(hào)處理、喚醒詞識(shí)別、ASR指令解析均在端側(cè)完成,不依賴云端傳輸,從底層實(shí)現(xiàn)數(shù)據(jù)隱私保護(hù)。產(chǎn)品支持遠(yuǎn)場(chǎng)連續(xù)監(jiān)測(cè)拾音,可在低功耗狀態(tài)下保持語(yǔ)音監(jiān)聽(tīng)能力,同時(shí)兼容多麥陣列拾音與波束成形算法,實(shí)現(xiàn)高準(zhǔn)確率本地語(yǔ)音交互,為智能家居、工業(yè)控制、車載交互等場(chǎng)景提供持續(xù)在線、安全可信的遠(yuǎn)場(chǎng)語(yǔ)音體驗(yàn)。
·以太網(wǎng)網(wǎng)絡(luò)音頻
基于自研處理器的高性能架構(gòu),XMOS為專業(yè)音頻傳輸領(lǐng)域帶來(lái)了極低時(shí)延的高精度數(shù)據(jù)傳輸,可以應(yīng)用于以太網(wǎng)網(wǎng)絡(luò)音頻解決方案。
該系統(tǒng)實(shí)現(xiàn)了低時(shí)延、高同步的音頻流傳輸,處理器硬件級(jí)時(shí)鐘同步與網(wǎng)絡(luò)協(xié)議優(yōu)化,保證多節(jié)點(diǎn)、長(zhǎng)距離音頻傳輸?shù)南辔灰恢滦耘c穩(wěn)定性,具備良好擴(kuò)展能力,可滿足專業(yè)音響、會(huì)議系統(tǒng)、廣播設(shè)備等對(duì)同步精度與時(shí)延指標(biāo)要求極高的應(yīng)用場(chǎng)景。
總結(jié)與展望
EW26展會(huì)傳遞出了清晰的行業(yè)趨勢(shì):邊緣AI技術(shù)的進(jìn)步推動(dòng)了很多更看重時(shí)延、確定性和功耗等非算力指標(biāo)的需求和應(yīng)用場(chǎng)景浮出水面,作為業(yè)界最早推出邊緣AI SoC的廠商之一,XMOS支持其客戶無(wú)需龐大資源與生態(tài),即可針對(duì)各種應(yīng)用場(chǎng)景實(shí)現(xiàn)差異化的、基于邊緣AI的應(yīng)用突破,并可以充分發(fā)揮其xcore.ai等芯片和解決方案的實(shí)時(shí)性、靈活性與高性能。xcore.ai處理器的超低時(shí)延、高集成度和可編程等特性,已在高端音頻、邊緣視覺(jué)等領(lǐng)域廣泛落地,并支持用戶去開(kāi)發(fā)了諸多創(chuàng)新的產(chǎn)品。
此外,邊緣AI和物理AI不僅在改變我們的工作和生活,也在改變半導(dǎo)體行業(yè)自身。XMOS作為生成式系統(tǒng)級(jí)芯片(GenSoC)領(lǐng)先開(kāi)發(fā)者,在EW26上現(xiàn)場(chǎng)展示了已經(jīng)能夠?qū)崿F(xiàn)音頻DSP快速定制的生成式SoC開(kāi)發(fā)工具,及其對(duì)整個(gè)硬件開(kāi)發(fā)流程的大大簡(jiǎn)化,不僅勾勒出邊緣AI與嵌入式計(jì)算的未來(lái)圖景,更以技術(shù)創(chuàng)新印證了其針對(duì)邊緣智能的架構(gòu)創(chuàng)新在實(shí)時(shí)性、靈活性、開(kāi)發(fā)效率和隱私保護(hù)等方面的價(jià)值。