您當(dāng)前的位置:首頁(yè)概念正文

突破傳統(tǒng)超算中心局限 青云QingCloud EHPC實(shí)現(xiàn)便利性與安全性兼?zhèn)?/h1>
2021-12-21 19:12:24

隨著大數(shù)據(jù)技術(shù)、超算中心建設(shè)的快速發(fā)展,正有越來(lái)越多的科研院所、企事業(yè)單位作為需求端謀求著更加穩(wěn)定安全且強(qiáng)大的算力支持。然而在實(shí)際的應(yīng)用場(chǎng)景中,超算臺(tái)的建設(shè)依舊面臨技術(shù)落地及安全等方面的痛點(diǎn)亟待紓解。

作為一家企業(yè)級(jí)云服務(wù)商和數(shù)字化解決方案提供商,青云QingCloud(qingcloud.com,股票代碼:688316)在云計(jì)算與超算臺(tái)的融合領(lǐng)域有著相當(dāng)深的經(jīng)驗(yàn)。日前,在QingCloud EHPC發(fā)布會(huì)上,青云QingCloud云臺(tái)&服務(wù)部高級(jí)總監(jiān)陳海泉和青云QingCloud EHPC 產(chǎn)品經(jīng)理苗慧就青云最新推出的EHPC超算臺(tái)產(chǎn)品進(jìn)行了介紹,并分享了他們對(duì)超算臺(tái)中心建設(shè)的看法以及青云在這一領(lǐng)域的愿景。

青云的高能計(jì)算場(chǎng)景應(yīng)用

陳海泉指出,大數(shù)據(jù)和人工智能正在與超算融合,而大數(shù)據(jù)和人工智能與超算的結(jié)合也在核酸疫苗和核酸藥物的研發(fā)、金融風(fēng)控等場(chǎng)景中得到了具體應(yīng)用。

緊接著他詳細(xì)闡述了青云QingCloud EHPC超算臺(tái)所支持的各種新的業(yè)務(wù)場(chǎng)景。

對(duì)于超算中最常見(jiàn)的仿真和建模業(yè)務(wù),青云提供了低延時(shí)、高帶寬的InfiniBand網(wǎng)絡(luò)、高速并行文件存儲(chǔ)以及CPU/GPU的算力組合。這種算力組合不僅能支持大規(guī)模求解運(yùn)算,還能提供 GPU 桌面進(jìn)行圖形前后處理,完成一個(gè)閉環(huán)的業(yè)務(wù)場(chǎng)景。

對(duì)于大數(shù)據(jù)業(yè)務(wù),QingCloud云臺(tái)提供的對(duì)象存儲(chǔ)容量達(dá) 245PB,跟計(jì)算節(jié)點(diǎn)結(jié)合,可以用于大規(guī)模的數(shù)據(jù)處理和分析。計(jì)算節(jié)點(diǎn)到對(duì)象存儲(chǔ)的網(wǎng)絡(luò)帶寬達(dá)到1.6T,能夠保證大數(shù)據(jù)計(jì)算的超高能。

對(duì)于人工智能訓(xùn)練業(yè)務(wù),青云提供算力達(dá)850PFlops的A100 GPU資源池和全閃并行文件存儲(chǔ),并且能夠結(jié)合容器臺(tái),提供能極致優(yōu)化、輕量便捷、開(kāi)源開(kāi)放的人工智能臺(tái)。

依托云臺(tái)的多種存儲(chǔ)服務(wù),用戶可以按照自己的業(yè)務(wù)來(lái)選擇合適的存儲(chǔ)類型,包括冷熱類型的對(duì)象存儲(chǔ)、全閃并行文件存儲(chǔ)或者塊存儲(chǔ)等。而借力虛擬化技術(shù)的加持,青云可以快速為不同業(yè)務(wù)構(gòu)建其所需的運(yùn)行環(huán)境,隨時(shí)可以切換 MPI、TensorFlow 或者 MapReduce 軟件臺(tái),充分利用超算中心的硬件資源滿足各種業(yè)務(wù)場(chǎng)景的需求。

QingCloud EHPC對(duì)傳統(tǒng)超算中心的突破

陳海泉談到了傳統(tǒng)超算中心在使用方式和安全問(wèn)題上的痛點(diǎn)。他指出,用戶在使用傳統(tǒng)的超算中心時(shí),需要提交一個(gè)申請(qǐng),其中還有人工審批的環(huán)節(jié),當(dāng)用戶得到審批通過(guò)后,還需要安裝VPN客戶端連接超算中心提供的登錄節(jié)點(diǎn),繁瑣的流程影響了便利。

另一方面,超算中心的登錄節(jié)點(diǎn)往往是很多用戶共享的。共享節(jié)點(diǎn)存在兩個(gè)問(wèn)題:一是超算中心為了保證其自身安全不提供 root 權(quán)限,給用戶安裝軟件帶來(lái)麻煩。二是Linux隔一段時(shí)間就會(huì)暴露出一些系統(tǒng)漏洞,如果被某些用戶利用得到root權(quán)限,就能竊取臺(tái)上其他用戶的數(shù)據(jù)。

為解決便利和安全兩方面的問(wèn)題,青云的超算臺(tái)做了相應(yīng)的改進(jìn)。一方面青云把傳統(tǒng)的審批制度變成用戶自服務(wù)的形式,用戶隨時(shí)可以在云臺(tái)注冊(cè)賬號(hào),并且充值購(gòu)買其需要的計(jì)算資源。另一方面,青云做了計(jì)算、網(wǎng)絡(luò)與存儲(chǔ)的租戶隔離,實(shí)現(xiàn)青云管理節(jié)點(diǎn)跟計(jì)算節(jié)點(diǎn)的分離,同時(shí)提供零信任客戶端,讓用戶登錄超算中心的時(shí)候更便捷和安全。除此之外,青云還推出新的獨(dú)享EHPC集群、集成化工業(yè)仿真軟件等創(chuàng)新舉措以改進(jìn)超算業(yè)務(wù)。

QingCloud EHPC 產(chǎn)品簡(jiǎn)介及服務(wù)實(shí)踐

青云QingCloud EHPC產(chǎn)品經(jīng)理苗慧介紹,EHPC產(chǎn)品是基于青云公有云IaaS臺(tái)、PaaS臺(tái)的云基礎(chǔ)設(shè)施,主要為青云用戶提供公有云服務(wù),為部分客戶提供專屬云和混合云等多種形態(tài)的產(chǎn)品。QingCloud EHPC 提供云上超算 SaaS化服務(wù),通過(guò)青云的彈公網(wǎng)IP、公網(wǎng)帶寬,將數(shù)據(jù)進(jìn)行快速的上傳、下載,與本地?cái)?shù)據(jù)同步。

在產(chǎn)品架構(gòu)布局上,QingCloud EHPC的服務(wù)架構(gòu)主要分為資源層、管理層和用戶端三層。而在用戶構(gòu)建集群的過(guò)程中,EHPC集群分為四個(gè)節(jié)點(diǎn),分別是:登錄節(jié)點(diǎn)、管控節(jié)點(diǎn)、計(jì)算節(jié)點(diǎn)和GPU可視化節(jié)點(diǎn),而這四個(gè)節(jié)點(diǎn)完全掛載了青云的共享文件存儲(chǔ)以及共享軟件倉(cāng)庫(kù)。

苗慧總結(jié)了QingCloud EHPC臺(tái)的四個(gè)優(yōu)勢(shì),即彈伸縮,按需配置;只管使用,無(wú)需運(yùn)維;資源租賃,價(jià)比高;租戶隔離,安全可靠。

當(dāng)被問(wèn)及青云的目標(biāo)客戶群時(shí),苗慧表示青云在整個(gè)高能計(jì)算領(lǐng)域的主要用戶有科研院所,科研企業(yè)、汽車制造、新能源/新材料、芯片制造以及生物制藥等。

陳海泉總結(jié)了青云的未來(lái)愿景,即讓更多的超算中心加入青云的分布式云節(jié)點(diǎn),共建一個(gè)資源共享的算力網(wǎng)絡(luò)。

推薦搜索: 突破 傳統(tǒng) 超算

“如果發(fā)現(xiàn)本網(wǎng)站發(fā)布的資訊影響到您的版權(quán),可以聯(lián)系本站!同時(shí)歡迎來(lái)本站投稿!

虛擬

未來(lái)