應用

技術

物聯(lián)網世界 >> 物聯(lián)網新聞 >> 物聯(lián)網熱點新聞
企業(yè)注冊個人注冊登錄

元腦生態(tài)伙伴馬達智數助力信通院打通AI數據“任督二脈”

2022-03-29 14:30 美通社

導讀:北京2022年3月29日 -- 馬達智數與浪潮信息通過“元腦生態(tài)”合作,幫助中國信息通信研究院云計算和大數據研究所(以下簡稱“信通院云大所”)構建了AI數據集服務平臺,實現(xiàn)AI數據的全流程管理與維護,可節(jié)省約80%的數據流轉時間和60%的資源開銷,使開發(fā)效率提升50%以上,有效降低用戶使用難度,全面服務AI應用創(chuàng)新,助力AI應用的產業(yè)化落地。

北京2022年3月29日 -- 馬達智數與浪潮信息通過“元腦生態(tài)”合作,幫助中國信息通信研究院云計算和大數據研究所(以下簡稱“信通院云大所”)構建了AI數據集服務平臺,實現(xiàn)AI數據的全流程管理與維護,可節(jié)省約80%的數據流轉時間和60%的資源開銷,使開發(fā)效率提升50%以上,有效降低用戶使用難度,全面服務AI應用創(chuàng)新,助力AI應用的產業(yè)化落地。

數據之困 AI創(chuàng)新面臨三重難題

信通院云大所希望能夠構建一體化AI基礎設施,解決AI數據從收集、整理、存儲歸檔,到調用的全流程維護工作。在這一過程中,遇到了三大問題。

首先,要解決數據來源的問題。AI模型訓練需要海量數據,以語音識別模型為例,要訓練出能應對各種場景、語速、口音、口語等復雜情況的高準確度語音識別模型,至少需要1000個小時以上的訓練數據,按每條數據平均4秒時長計算,數據量至少在90萬條以上。文字識別OCR算法訓練需要的圖片數量則達到百萬級別。如果僅從業(yè)務過程中獲取數據,不僅獲取難度很大,而且在數據多樣性、數據規(guī)模等方面也很難滿足AI訓練的基本需求。

其次,如何保證數據質量。在大多數AI模型訓練任務中,“垃圾輸入”會帶來“垃圾輸出”。包括深度卷積神經網絡在內的監(jiān)督學習方法依賴的是經過適當標注的優(yōu)質數據,特別是需要大量專家知識的專業(yè)領域,更是對于大規(guī)模標記數據的可用性有著極高要求。

最后,如何更有效地存儲和更新數據。在AI應用中,數據的增長是幾何級數的。使用傳統(tǒng)的集中式存儲和集中式通信模式,往往無法通過一個巨型單點支撐主流AI模型的體量,存儲和通信能力都是瓶頸,而且效率會非常低下。

元腦賦智 打通AI數據“任督二脈

馬達智數是國內最早、最專業(yè)的AI基礎數據服務器商之一,致力于為AI產業(yè)鏈的相關客戶提供高質量、標準化的定制數據集服務,助力AI場景化應用快速落地,擁有5000+商業(yè)AI數據成功案例。2019年,馬達智數與浪潮信息達成了元腦生態(tài)簽約,共享浪潮信息在AI計算、資源與算法方面的全棧能力,共同打造領先的AI數據服務和豐富的AI生態(tài)體系,助力AI應用的產業(yè)化落地。

馬達智數與浪潮信息在元腦生態(tài)的框架下進行了緊密合作。雙方聯(lián)合推出了業(yè)內領先的AI數據一體機,整合了浪潮AI服務器、浪潮資源平臺AIStation、馬達智數全系列AI數據產品與服務,具有高度集成、一鍵部署、配置靈活等特點,能夠幫助行業(yè)AI用戶高效地獲取、加工和管理數據,并開展模型訓練,助力用戶快速、低成本地實現(xiàn)AI技術導入。

在信通院云大所AI數據集服務平臺項目中,馬達智數攜手浪潮信息提供了基于AI數據一體機的一體化解決方案。方案使用高速IO擴展、大容量內存的浪潮AI服務器作為硬件平臺,為數據收集、存儲、標注和管理提供強大的計算力支撐。并集成圖片類、文本類、語音類等常用數據集,通過數據標注平臺提高數據質量,滿足信通院云大所基礎測試、算法開發(fā)等需求。同時將已有的分散的各項系統(tǒng)數據集中于AI數據集服務平臺進行統(tǒng)一管理、協(xié)同處理,構建智能開發(fā)一體化環(huán)境。

通過對數據的統(tǒng)一管理調度,該方案有效降低了數據流轉時間和資源開銷,可節(jié)省約80%的數據流轉時間和60%的網絡、計算和存儲資源開銷。數據收集和標注平臺的整合接入,則大大提高了數據加工環(huán)節(jié)的效率,用戶可以直接通過數據標注平臺標注數據,并實時查看數據質量。同時,提供穩(wěn)定的人工標注服務,可使開發(fā)效率提升50%以上,有力地支持了口罩識別、語音識別等AI模型訓練與應用。

信通院云大所AI數據集服務平臺是馬達智數與浪潮信息在元腦生態(tài)中達成的重要合作成果。未來,馬達智數將繼續(xù)攜手浪潮信息,與更多的元腦生態(tài)合作伙伴一起“走出去”,攜手搭建起直通產業(yè)應用場景的“橋梁”,推動AI應用在更多場景和行業(yè)落地。