上海速亞信息科技有限公司
中國(guó)工程院院士邬賀铨:從實踐中深化對(duì)數據中心“數學(xué)”與“算術”的認識
來源: | 作者:shnews01 | 發(fā)布時(shí)間: 2022-08-10 | 133 次浏覽 | 分享到:
7月30日,在2022中國(guó)算力大會(huì)“算力築基高質量發(fā)展”主論壇上,中國(guó)工程院院士邬賀铨詳細闡述了對(duì)數據中心“數學(xué)”與“算術”的思考。他表示,“數學(xué)”指的是研究數據的科學(xué),“算術”是研究算力的技術。

7月30日,在2022中國(guó)算力大會(huì)“算力築基高質量發(fā)展”主論壇上,中國(guó)工程院院士邬賀铨詳細闡述了對(duì)數據中心“數學(xué)”與“算術”的思考。他表示,“數學(xué)”指的是研究數據的科學(xué),“算術”是研究算力的技術。


在“以算爲主”還(hái)是“以存爲主”方面(miàn),邬賀铨表示,人工智能(néng)驅動算力需求快速增長(cháng),基于GPU等構建的人工智能(néng)智算中心适用于訓練數據導出模型,訓練出數學(xué)模型後(hòu),深度神經(jīng)網絡并不需要調度非常多的參數,降低了對(duì)算力的需求;基于CPU的通用算力的IDC适用于在已知數學(xué)模型下進(jìn)行計算。因此他表示,人工智能(néng)智算中心主要任務是算,IDC互聯網數據中心主要任務是存。


在三類算力比例方面(miàn),邬賀铨表示,在基礎算力、智能(néng)算力和超算三個算力中,美國(guó)分别占全球的35%、15%、30%,而中國(guó)分别占27%、26%和20%,美國(guó)是以基礎算力爲主,中國(guó)智能(néng)算力的能(néng)力遠超美國(guó)。中國(guó)的超算和智能(néng)算力基本以政府爲主建設,基礎算力以運營商和互聯網企業爲主建設。


在冷數據與熱數據方面(miàn),邬賀铨表示,數據從大的方面(miàn)分爲冷數據和熱數據,熱數據主要指需要實時(shí)計算的數據,相比之下冷數據的計算需求非常态化。東西部分别适合處理熱數據和冷數據,“東數西算”實際是“東數西存”。


在存算分離與存内計算方面(miàn),邬賀铨表示,存算分離可采用開(kāi)放存儲體系和磁帶存儲介質,存儲器可同時(shí)服務多個服務器,池化存儲支持多雲,提高利用率,降低成(chéng)本能(néng)耗,可用于對(duì)冷數據的處理;存内計算适于對(duì)熱數據的處理,例如,自動駕駛可以在車内同時(shí)完成(chéng)存與算。


在封閉系統與開(kāi)放系統存儲方面(miàn),邬賀铨表示,開(kāi)放系統存儲實現存算分離,存儲容量爲多服務器共享,以池化方式支持多雲應用。不同存儲架構适應不同任務,可按照任務來軟件定義存儲。


在PUE與IT能(néng)效方面(miàn),邬賀铨表示,在IDC的IT系統能(néng)耗中,服務器約占50%,存儲系統占35%,網絡通信設備占15%,大部分電能(néng)用于維持服務器的狀态,隻有6%至12%用于計算。因此他建議,要減低能(néng)耗,對(duì)冷數據處理建議用磁帶代替磁盤,100PB存儲成(chéng)本10年可下降73%;對(duì)熱數據處理用閃存代替磁盤,但目前成(chéng)本比較高。另外,還(hái)可通過(guò)數據預處理提升能(néng)效,去掉一些無效值、空格和缺失及過(guò)時(shí)的數據。


在數據可信性與災備保護方面(miàn),邬賀铨表示,災備是數據中心剛性需求,美國(guó)數據保護占存儲投資的1/3,全球平均占比爲27.4%,而中國(guó)僅爲7.8%,尤其異地備份的比例更低,所以災備能(néng)力是不足的,所以在這(zhè)點上我們還(hái)是要改進(jìn),同時(shí),究竟是備份數據還(hái)是備份算力,這(zhè)是值得研究的問題。


此外,在談到“東數西算”時(shí),邬賀铨表示,“東數西算”使算力設施的布局超越了數據中心樞紐的範疇,東部與西部互爲冷熱數據的配對(duì)方面(miàn),要有合适的比例。同時(shí),同一數據中心樞紐或集群内部也有很多數據需要優化。


“關于數據中心的‘數學(xué)’和‘算術’,還(hái)有很多需要深入研究的内容,我們要善于從實踐中學(xué)習創新。”邬賀铨最後(hòu)表示。



采編:上海速亞信息科技有限公司

來源:人民郵電報 


返回上一頁