來(lái)源:【科學(xué)網(wǎng)】
信息社會(huì )進(jìn)入智能化新階段,信息基礎設施的主要作用已不是解決連通問(wèn)題,而是為人類(lèi)的生產(chǎn)與生活提供充分的分析、判斷和控制能力,因此,計算能力和大數據資源成了新的信息基礎設施的關(guān)鍵。算力作為數字經(jīng)濟時(shí)代的新生產(chǎn)力,必須實(shí)現基礎設施化。
算力和GDP呈正相關(guān)的關(guān)系,未來(lái)算力指數可能是比電力指數更重要的經(jīng)濟指標。因此,未來(lái)信息基礎設施必須通盤(pán)考慮算力網(wǎng)和通信網(wǎng),還要與電力等能源網(wǎng)絡(luò )協(xié)同配合,做好算力、通信、電力網(wǎng)全國一盤(pán)棋的頂層設計,統籌兼顧,力爭全局優(yōu)化。
算力網(wǎng)絡(luò )是新型基礎設施的一個(gè)組成部分,而東數西算又是算力網(wǎng)絡(luò )的一個(gè)組成部分。我們要基于經(jīng)濟社會(huì )發(fā)展的大邏輯、大格局、大趨勢,做好頂層路線(xiàn)圖的設計,避免只見(jiàn)樹(shù)木不見(jiàn)森林。
不同視角下的未來(lái)信息基礎設施
計算機界和通信界對未來(lái)的信息基礎設施有著(zhù)不同的視角。
計算思維的核心是分層次抽象。對應到未來(lái)信息基礎設施,就是以新的抽象來(lái)屏蔽不同云的差異,實(shí)現跨云計算。眾所周知,互聯(lián)網(wǎng)Internet是網(wǎng)際網(wǎng) (network of network),未來(lái)的信息基礎設施就是互聯(lián)云 (Intercloud: cloud of cloud)。
從計算機的視角來(lái)看,這是以云為中心,強調以云調網(wǎng)、云網(wǎng)融合、一云多網(wǎng)的信息基礎設施,重點(diǎn)是解決各種軟硬件的不兼容問(wèn)題。算力網(wǎng)基本載荷單元不是消息,而是計算任務(wù)。核心創(chuàng )新是做任務(wù)交換和高通量的計算,追求低熵有序。
而通信界的視角則是以網(wǎng)絡(luò )為中心,把計算和存儲能力看成是可調動(dòng)的資源,即網(wǎng)調云,因而強調算力資源評估、交易和調度,目標是構建網(wǎng)絡(luò )和計算高效協(xié)同的網(wǎng)絡(luò )架構。新的網(wǎng)絡(luò )架構重視算力的感知、異構算力的統一標識和算力資源的標準化等。
目前,算力網(wǎng)絡(luò )被認為是 6G與未來(lái)網(wǎng)絡(luò )中一項重要的基礎技術(shù),即在網(wǎng)絡(luò )中部署數據處理能力。這一理念目前主要是電信運營(yíng)商在推動(dòng),中國電信等運營(yíng)商先后發(fā)布了《算力網(wǎng)絡(luò )白皮書(shū)》,也提出了國際標準。2021年7月,國際電信聯(lián)盟電信標準分局(ITU-T)發(fā)布了第一個(gè)算力網(wǎng)絡(luò )技術(shù)的國際標準Y.2501。算力網(wǎng)絡(luò )的提出不僅僅是技術(shù)發(fā)展趨勢,更是市場(chǎng)競爭的需求。電信運營(yíng)商希望在連接 計算一體化服務(wù)場(chǎng)景下實(shí)現業(yè)務(wù)擴展,避免被管道化。
工信部通信科技委常務(wù)副主任、中國電信科技委主任韋樂(lè )平曾提出網(wǎng)是基礎、云為核心、網(wǎng)隨云動(dòng)、云網(wǎng)一體,我認為這是云網(wǎng)融合一個(gè)正確的發(fā)展原則。我希望通信領(lǐng)域的專(zhuān)家考慮網(wǎng)調云的時(shí)候,要充分理解哪些計算資源現在可以通過(guò)網(wǎng)絡(luò )進(jìn)行調配,哪些現在還不能通過(guò)網(wǎng)絡(luò )調配。實(shí)際情況是,目前只有相當少量的計算資源可以調配,很多還不能調配。
算力網(wǎng)絡(luò )是一個(gè)宏偉的目標,前景光明
人工智能之父約翰·麥卡錫早在1961年就提出Utility Computing 的目標:有一天,計算可能會(huì )被組織成一個(gè)公共事業(yè),就像電話(huà)系統是一個(gè)公共事業(yè)一樣。讓計算能力成為像電一樣公共基礎設設施(Utility),這是計算機界已經(jīng)奮斗了半個(gè)多世紀的宏偉目標。1984年,SUN公司提出的網(wǎng)絡(luò )就是計算機也是今天講的算力網(wǎng)絡(luò )的美妙前景。
從提出Utility Computing的奮斗目標開(kāi)始,計算機界就清楚公共計算服務(wù)與公共電網(wǎng)不同,至少需要關(guān)注三個(gè)問(wèn)題:一是接口——用戶(hù)如何和資源進(jìn)行對接?二是服務(wù)設備——用戶(hù)通過(guò)什么設備將資源轉換成服務(wù)?三是產(chǎn)品的異質(zhì)性——計算是一種復雜的服務(wù),存在多樣性,不同的編程語(yǔ)言和硬件如何兼容?
通過(guò)幾十年的努力,人們已經(jīng)發(fā)明了用于遠程接入的互聯(lián)網(wǎng)、管理物理計算資源的操作系統、把資源分給多人同時(shí)使用的虛擬化技術(shù)。近十年廣泛流行的云計算集成了這些技術(shù),為實(shí)現計算的公共基礎設施找到了出路。因此,只要云、邊、網(wǎng)、端都盡可能地實(shí)現云化,就有可能將原本不是公共物品的計算能力變成虛擬的公共物品。從長(cháng)遠目標來(lái)看,算力網(wǎng)絡(luò )的前景一定是光明的。
算力資源不同于水電,還需大量原始創(chuàng )新
媒體上有些文章將目前在做的算力網(wǎng)絡(luò )與交通網(wǎng)絡(luò )、電力網(wǎng)絡(luò )等量齊觀(guān),認為算力現在就可以做到像供水和供電一樣方便,這是太樂(lè )觀(guān)了。計算能力終究不是像水電一樣具有同質(zhì)性質(zhì)的公共品,每個(gè)算力產(chǎn)品都想通過(guò)專(zhuān)有的特性贏(yíng)得競爭,所以算力網(wǎng)絡(luò )的實(shí)現比交通和能源網(wǎng)絡(luò )復雜得多、也困難得多。構建算力網(wǎng)的技術(shù)還不成熟,還需要做很多基礎性的原始創(chuàng )新和大量的技術(shù)攻關(guān)。
正在研究突破的與算力網(wǎng)有關(guān)的計算技術(shù)包括:任務(wù)交換技術(shù)、智能流抽象、資源賦名、控域、網(wǎng)程、標簽化體系結構、內構安全、在網(wǎng)計算等等。突破這些技術(shù)都需要付出艱苦的努力。通信與網(wǎng)絡(luò )界也要突破許多關(guān)鍵技術(shù),其中確定性網(wǎng)絡(luò )對實(shí)現性能與用戶(hù)體驗可控的算力網(wǎng)絡(luò )具有重要意義。
算力網(wǎng)絡(luò )要為減熵做貢獻
傳統的信息高速公路的技術(shù)天花板已出現。信息高速公路遵循無(wú)序共享原則,這一原則為現有的信息基礎設施埋下了巨大隱患——性能干擾,用戶(hù)可感知的服務(wù)質(zhì)量存在很大的不確定性(從信息論的角度看,就是熵比較大)。由于采用大量冗余,各大云計算中心均面臨總體效率不高的問(wèn)題,許多數據中心的利用率甚至不到20%。因此,在計算機界人士的眼中,算力網(wǎng)絡(luò )作為未來(lái)網(wǎng)絡(luò )的組成部分,要為減熵作貢獻。
中國科學(xué)院計算技術(shù)研究所提出的信息高鐵就是建設高通量低熵算力網(wǎng)。信息高鐵強調低熵有序,針對高通量計算,其性能指標是通量(goodput,通量 = 任務(wù)吞吐率×良率),即保質(zhì)任務(wù)吞吐率,也就是單位時(shí)間完成的保質(zhì)任務(wù)數。信息高鐵追求的目標是可測、可控、可調、可信,希望能顯著(zhù)改善應用品質(zhì),提升系統通量與效率。
信息高鐵按照一橫一縱的思路,重新定義下一代信息基礎設施的邊界。一橫是通過(guò)聯(lián)邦制的方式橫向聯(lián)通,最大化組織起所有愿意共享的大/小數據中心的各類(lèi)異構算力資源,為用戶(hù)提供統一封裝、抽象易用的算力資源;一縱是縱向打通云、網(wǎng)、邊、端全鏈路基礎設施資源,通過(guò)全鏈路多級多維度測調、控域隔離等方式,實(shí)現海量物端應用的端到端服務(wù)質(zhì)量確保。
中科院計算所對信息高鐵做了初步的測試實(shí)驗,結果表明,不管是任務(wù)的良率還是任務(wù)的通量,都比傳統的互聯(lián)網(wǎng)高出6-7倍。而且,越是負載高的時(shí)候,信息高鐵的優(yōu)勢越明顯,良率也是如此。
算力網(wǎng)要避免帝國制壟斷運營(yíng)
從頂層設計的角度,我認為國家算力網(wǎng)的建設應由三部分組成:第一部分是以國家或地方財政建立的公共算力基礎設施;第二部分是電信運營(yíng)商和龍頭云服務(wù)商建設的骨干企業(yè)級算力基礎設施;第三部分是由大量中小型信息服務(wù)企業(yè)協(xié)作建立的算力網(wǎng)。
算力網(wǎng)的構建要高度重視中小企業(yè)。我希望全國的算力網(wǎng)避免單一帝國制壟斷運營(yíng),探索新型的聯(lián)邦制管理模式,激活中小企業(yè)的參與熱情。運行方式是否得當,決定著(zhù)算力網(wǎng)的前途。
在布局上,算力網(wǎng)絡(luò )既要全局統一,又要環(huán)節解耦。全局統一是指全國主要算力中心協(xié)同管理,形成東西互補、南北貫通的一體化算力網(wǎng),提供統一的算力資源服務(wù)。環(huán)節解耦是指算力的設備提供商、運營(yíng)商和增值服務(wù)商合理解耦,消費者僅需按統一定價(jià)支付費用就可得到多樣性的服務(wù)。在我看來(lái),算力網(wǎng)的生命力在于協(xié)同合作,過(guò)分強調一家企業(yè)的端到端一體化,不利于算力網(wǎng)的發(fā)展。
計算的應用可分為實(shí)時(shí)(數據處理)和非實(shí)時(shí)兩大類(lèi)。一般而言,有實(shí)時(shí)要求的應用并不要求很強大的算力,但那些面向基礎研究的科學(xué)計算、人工智能的訓練等不要求實(shí)時(shí)的應用,往往需要使用超級計算機和超大規模的人工智能訓練平臺。
新藥的研制、新材料的研發(fā),集成電路等新產(chǎn)品的設計等,都需要巨大的算力。非實(shí)時(shí)的計算可能對國家發(fā)展具有更基礎、更長(cháng)遠的作用,國家級的算力網(wǎng)絡(luò )資源應優(yōu)先考慮非實(shí)時(shí)的高性能計算和智能計算(模型的訓練)。實(shí)時(shí)性強的工業(yè)互聯(lián)網(wǎng)和金融網(wǎng)絡(luò )等大多由企業(yè)自建。此外,邊緣計算和物聯(lián)網(wǎng)大多有實(shí)時(shí)要求,算力網(wǎng)建設要高度重視確定性網(wǎng)絡(luò )的研究。
東數西算取得實(shí)效尚需艱苦努力
啟動(dòng)東數西算工程,有利于集中建設數據通信網(wǎng)絡(luò ),促進(jìn)我國西部地區的數字經(jīng)濟發(fā)展,能在一定程度上緩解東部供電的壓力。但是,放在全國的大盤(pán)子上,東數西算工程對全國節能減排只有一定比例的貢獻,不能無(wú)限制地夸大。
數字中心只要建了,不管建在東部還是西部,都是要耗電的。在西部建數據中心有兩方面的好處:一是西部的PUE值低一點(diǎn),相對于在東部建數據中心,有可能會(huì )節省20%的用電。但如果采用曙光公司發(fā)明的浸沒(méi)相變液冷技術(shù),耗電量對數據中心所在地的平均氣溫就不是十分敏感。二是傳輸線(xiàn)路的損耗,2000公里長(cháng)距離輸電的損耗是6%左右。兩者加起來(lái),在西部建數據中心節省的用電不會(huì )超過(guò)西部數據中心用電量的30%。根據中國信通院統計的各省2020年的算力規模,貴州、甘肅、寧夏、新疆、重慶等西部各省算力總和還不到5Eflops, 只占我國數據中心算力總規模(140Eflops)的4%左右。即使未來(lái)幾年翻倍的增長(cháng),估計西部新建數據中心的算力5年內也難以超過(guò)全國算力的20%。全國數據中心每年耗電2000億度左右,未來(lái)西部數據中心最多用電400億度的30% 就是120億度。能節省120億度電當然是值得努力爭取的大事,但與我國總用電量8萬(wàn)億度相比,只占0.15%。與每年跨省輸電2萬(wàn)億度相比,也只有西電東輸的0.6%。因此東數西算的意義不能光拿省電來(lái)說(shuō)事,也不能把東數西算看是我國算力基礎設施的整體戰略和全部?jì)热?,應從國家東西部平衡發(fā)展、構建全國算力網(wǎng)絡(luò )新基礎設施的大局著(zhù)眼。目前東部大城市建數據中心的需求很迫切,但沒(méi)有用電指標,批地也很困難,向西部尋求算力資源是迫切而合理的選擇。
值得指出的是,我國現行的《供電營(yíng)業(yè)規則》不允許光伏和風(fēng)力發(fā)電站直接給數據中心供電——發(fā)電必須入網(wǎng),電力統購統銷(xiāo)。這種政策不利于在西部建設數據中心,建議國家給數據中心一定的靈活性,推行源網(wǎng)荷儲一體化的理念,支持算力跟著(zhù)能源走,促進(jìn)綠電的消納。
另外值得注意的是,中西部地區數據中心的在用機架數的全國占比已上升到39%,超過(guò)北京、上海、廣東三個(gè)數據中心聚集區的在用機架數的全國占比(31%),但機器利用率不高。東數西算工程在西部建設的四個(gè)數據中心基地如何開(kāi)展業(yè)務(wù),大幅度提高算力的利用率,要做大量細致的工作。東數西算要達到西電東輸和南水北調的實(shí)效,還要做艱苦的努力。
美國擁有多個(gè)開(kāi)放的、全球性的與算力網(wǎng)有關(guān)的科研創(chuàng )新綜合試驗平臺,它們?yōu)槊绹畔㈩I(lǐng)域科研創(chuàng )新提供了肥沃的土壤;而我國現在僅有一個(gè)國家級的未來(lái)網(wǎng)絡(luò )實(shí)驗平臺,在先進(jìn)算力、分布式系統、云計算、邊緣計算等領(lǐng)域的國家級科研試驗平臺還處于空白的狀態(tài)。
建議國家盡快成立算力基礎設施研究中心和東數西算工程技術(shù)的試驗場(chǎng),建一些開(kāi)放性的平臺。這些平臺不能是一個(gè)孤島,應該與現有的網(wǎng)絡(luò )系統互聯(lián)互通,研發(fā)面向東數西算的聯(lián)邦制管理、算力測調和搓合交易系統等,形成算力基礎設施化的核心技術(shù)、基礎軟件和關(guān)鍵系統,并向東數西算工程推廣,加快各環(huán)節關(guān)鍵技術(shù)從孵化到完善的全過(guò)程,最終形成一套可面向一帶一路推廣的新信息技術(shù)體系。
(作者系中國工程院院士、中國計算機學(xué)會(huì )名譽(yù)理事長(cháng),本報記者趙廣立受權根據其在信息化百人會(huì )第八屆信息戰略論壇上的發(fā)言整理,本文發(fā)表前作者做了必要補充)
本文來(lái)自【科學(xué)網(wǎng)】,僅代表作者觀(guān)點(diǎn)。全國黨媒信息公共平臺提供信息發(fā)布傳播服務(wù)。
ID:jrtt