登錄
微信登錄
打開手機(jī)微信,掃描二維碼
掃描成功
請(qǐng)勿刷新本頁面,按手機(jī)提示操作
中科曙光不會(huì)以任何理由要求您轉(zhuǎn)賬匯款,謹(jǐn)防詐騙
您的微信還未注冊(cè)
中科曙光不會(huì)以任何理由要求您轉(zhuǎn)賬匯款,謹(jǐn)防詐騙
您可以同時(shí)關(guān)注中科曙光微信公眾號(hào)
使用微信掃一掃即可登錄! 查閱資料更方便、 快捷!
您已經(jīng)注冊(cè)賬號(hào)和
關(guān)注微信公眾號(hào)
2025年1月
服務(wù)熱線:400-810-0466
成功案例
項(xiàng)目背景
咪咕公司是中國(guó)移動(dòng)面向移動(dòng)互聯(lián)網(wǎng)領(lǐng)域設(shè)立的,負(fù)責(zé)數(shù)字內(nèi)容領(lǐng)域產(chǎn)品提供、運(yùn)營(yíng)、服務(wù)的一體化專業(yè)子公司?;ヂ?lián)網(wǎng)從PC 桌面時(shí)代延伸到現(xiàn)在的移動(dòng)互聯(lián)網(wǎng)時(shí)代,更多的移動(dòng)設(shè)備進(jìn)入消費(fèi)者的視野,這是一個(gè)需要革新人機(jī)交互方式的時(shí)代。智能語音提供了一種免于接觸設(shè)備的交互方式,解除頻繁點(diǎn)擊觸摸屏的枷鎖,將多數(shù)設(shè)備連接到局域網(wǎng)中就可以實(shí)現(xiàn)“一呼百應(yīng)”的聲音操控。靈犀云的發(fā)布,展現(xiàn)了傳統(tǒng)運(yùn)營(yíng)商莫大的魄力。
需求簡(jiǎn)介
咪咕公司本項(xiàng)目采購機(jī)架式GPU服務(wù)器,為滿足咪咕公司靈犀云三期擴(kuò)容工程的建設(shè),主要內(nèi)容是在原有靈犀云的基礎(chǔ)之上新增對(duì)AI平臺(tái)的構(gòu)建,作為AI平臺(tái)構(gòu)建研究的先期實(shí)踐性項(xiàng)目,同時(shí)為后續(xù)咪咕GPU服務(wù)器集中采夠的需求提供建議和指導(dǎo)方針。主要構(gòu)建規(guī)模化和系統(tǒng)性的人工智能集群用于日常訓(xùn)練和應(yīng)用推理需求。重點(diǎn)通過對(duì)靈犀云智能語音項(xiàng)目的實(shí)踐完成對(duì)GPU服務(wù)器構(gòu)建集群的探索和對(duì)集群資源調(diào)度管理方面的研究。
咪咕公司GPU應(yīng)用服務(wù)器,是為了滿足咪咕公司靈犀云三期擴(kuò)容工程項(xiàng)目大規(guī)模數(shù)據(jù)計(jì)算要求,對(duì)GPU服務(wù)器的配置和管理提出技術(shù)要求,由GPU應(yīng)用服務(wù)器供應(yīng)商進(jìn)行有針對(duì)性舍棄和優(yōu)化的服務(wù)器。
解決方案
曙光AI產(chǎn)品系列中的GPU服務(wù)器主要面向中高功率密度數(shù)據(jù)中心和標(biāo)準(zhǔn)19’機(jī)架,并能夠?qū)崿F(xiàn)靈活采購和部署的一類GPU服務(wù)器。
其中本次配置采用了4U8卡GPU服務(wù)器分別搭配4塊P100和P40,同時(shí)還配置了雙口25GE光纖網(wǎng)卡,支持RoCE,提高了設(shè)備信息處理的帶寬,降低了信息傳輸中的延遲,主要面向人工智能中的深度學(xué)習(xí)使用場(chǎng)景。
對(duì)滿足需求的GPU卡與本項(xiàng)目選用的GPU服務(wù)器進(jìn)行系統(tǒng)穩(wěn)定性測(cè)試和GPU卡性能測(cè)試,并提供相關(guān)測(cè)試方法和測(cè)試報(bào)告,有力的驗(yàn)證了產(chǎn)品的穩(wěn)定性和高性能。
曙光深入理解咪咕的AI集群構(gòu)建需求、分享了曙光在互聯(lián)網(wǎng)行業(yè)中的一些配置和實(shí)踐經(jīng)驗(yàn)。同時(shí)還搭配了曙光的集群管理軟件和運(yùn)維管理軟件,為咪咕AI域的構(gòu)建提供全方位的工業(yè)設(shè)計(jì)、作業(yè)調(diào)度、集群監(jiān)控管理以及運(yùn)維等功能,方便快捷的應(yīng)用軟件服務(wù),強(qiáng)大的作業(yè)調(diào)度讓計(jì)算更加高效,豐富的集群配置、管理工具,讓集群管理更加簡(jiǎn)化。集群運(yùn)行狀態(tài)精細(xì)化展現(xiàn),集群異常狀況及時(shí)告警,讓系統(tǒng)隱患防患于未然。系統(tǒng)直觀展示各類軟硬件資源的運(yùn)行狀況,準(zhǔn)確快速地定位設(shè)備故障源,保障各種 IT 設(shè)備的安全穩(wěn)定運(yùn)行。結(jié)合曙光人工智能服務(wù)平臺(tái)SothisAI的成功經(jīng)驗(yàn),證明了曙光GPU服務(wù)器基于集群和容器化構(gòu)建AI平臺(tái)的可行性,提供了基于GPU服務(wù)構(gòu)建AI集群的一體化解決方案。