現(xiàn)在位置:主頁 > 科技 > 云智一體 國云煥新 天翼云攜手產(chǎn)業(yè)共譜AI華章

云智一體 國云煥新 天翼云攜手產(chǎn)業(yè)共譜AI華章

作者:編輯 ? 時間:2024-07-07 ? 瀏覽:人次

大會.jpg

7月5日,2024世界人工智能大會期間,中國電信星辰人工智能生態(tài)論壇在上海世博中心啟幕。論壇以“星辰注智,煥新領(lǐng)航”為主題,圍繞人工智能技術(shù)發(fā)展趨勢,分享中國電信與產(chǎn)業(yè)各界在人工智能領(lǐng)域的創(chuàng)新與實(shí)踐。天翼云科技有限公司董事長、總經(jīng)理胡志強(qiáng)出席,并發(fā)表演講《云智一體 國云煥新》。他表示,人工智能已成為新一輪科技革命和產(chǎn)業(yè)變革的核心驅(qū)動力量。天翼云堅持科技創(chuàng)新驅(qū)動高質(zhì)量發(fā)展,以豐富的智算資源供給、強(qiáng)大的智算服務(wù)能力和開放的模型應(yīng)用生態(tài),為數(shù)字經(jīng)濟(jì)發(fā)展注入新動能。

胡總.jpg

在智算資源供給方面,天翼云自建了豐富、多樣化的智能算力資源。圍繞AI產(chǎn)業(yè)集聚地區(qū),天翼云規(guī)劃建設(shè)北京、上海、廣東、浙江、安徽人工智能公共算力中心,提供訓(xùn)推一體化能力,并先后建成上海、北京萬卡池,這也是全國最早建成并真正投產(chǎn)運(yùn)行的兩個國產(chǎn)化、全液冷、單集群萬卡公共智算中心;在清潔能源集聚地,建設(shè)內(nèi)蒙、貴州、寧夏智算中心,提供綠色算力;此外,天翼云還在31省預(yù)部署AI云電腦和推理池,在280多個地市的一城一池節(jié)點(diǎn)和1000多個邊緣節(jié)點(diǎn)按需下沉AI云電腦算力和推理算力;提供國內(nèi)外主流的GPU、NPU算力方案,面向不同場景為用戶提供公有云、私有云、邊緣云多種形態(tài)服務(wù)。

另一方面,天翼云匯聚社會多方算力,通過高效調(diào)度實(shí)現(xiàn)算力供需匹配。天翼云重點(diǎn)研發(fā)算力分發(fā)網(wǎng)絡(luò)平臺“息壤”,從算力統(tǒng)一接入、算數(shù)網(wǎng)一體化調(diào)度、算力簡便易用三方面進(jìn)行技術(shù)創(chuàng)新,實(shí)現(xiàn)裸算力云化接入、算力更泛在、算力選擇和應(yīng)用部署更簡單,促進(jìn)算力互聯(lián)互通、高效利用、供需匹配。

基于此,息壤可賦能三大算力服務(wù)場景。一是天翼云自營的公共算力服務(wù)平臺,目前已接入多家算力伙伴,擴(kuò)大了天翼云算力規(guī)模和品類,滿足公有云客戶的多元算力需求;二是行業(yè)算力互聯(lián)網(wǎng),如國資央企智算云管理調(diào)度平臺,接入多家央企算力,提高國資監(jiān)管水平,提升算力利用率;三是城市算力互聯(lián)網(wǎng),通過整合區(qū)域內(nèi)多方算力,結(jié)合產(chǎn)業(yè)政策,實(shí)現(xiàn)一體化統(tǒng)籌調(diào)度算力,目前已在多個區(qū)域成功實(shí)踐。

當(dāng)前,基礎(chǔ)大模型訓(xùn)練呈現(xiàn)參數(shù)越來越大的趨勢,在超大規(guī)模參數(shù)的基礎(chǔ)大模型開發(fā)訓(xùn)練場景中,對AI基礎(chǔ)設(shè)施的算力、性能、穩(wěn)定性都提出了更高要求。天翼云基于單集群萬卡智算中心,搭載一體化計算加速平臺云驍和一站式智算服務(wù)平臺慧聚,從基礎(chǔ)設(shè)施到平臺,構(gòu)建了基礎(chǔ)大模型訓(xùn)練解決方案。

在大算力需求方面,天翼云建設(shè)了可橫向擴(kuò)展的PB級HPFS,滿足存儲要求;組建了低延時的超大規(guī)模RDMA網(wǎng)絡(luò),滿足基礎(chǔ)算力需求;同時,通過計算、內(nèi)存、通信多維優(yōu)化,提升綜合算效。在性能方面,天翼云升級AI框架,編譯效率翻番,通過拓?fù)涓兄{(diào)度,集合通信效率提升顯著,多種加速優(yōu)化后將國產(chǎn)算力的綜合算效比提升到了行業(yè)可比水平。在穩(wěn)定性方面,故障訓(xùn)前發(fā)現(xiàn),結(jié)合斷點(diǎn)續(xù)訓(xùn)能力,實(shí)現(xiàn)訓(xùn)練任務(wù)長期穩(wěn)定、高可用運(yùn)行。

構(gòu)建國產(chǎn)萬卡集群不是一萬張卡的簡單堆疊,而是一項(xiàng)高度復(fù)雜的系統(tǒng)工程,需要解決超大規(guī)模的組網(wǎng)互聯(lián)、高效率的集群計算、長期穩(wěn)定性和高可用性等眾多技術(shù)難題。天翼云基于國產(chǎn)萬卡智算集群和自研智算平臺,已具備支撐萬億參數(shù)基礎(chǔ)大模型訓(xùn)練的能力。

在行業(yè)大模型訓(xùn)推過程中,普遍存在著訓(xùn)練部署工程化復(fù)雜、訓(xùn)推效率有待提高、訓(xùn)練中斷頻繁等挑戰(zhàn)。面向行業(yè)大模型訓(xùn)推場景,天翼云提供一站式智算服務(wù)。其中,“慧聚”平臺預(yù)置行業(yè)數(shù)據(jù)集、納管國內(nèi)外主流AI加速硬件、并預(yù)置基于國產(chǎn)算力的基礎(chǔ)大模型等全棧工具鏈能力,大模型精調(diào)場景通過選數(shù)據(jù)、選硬件、選模型3步,即可實(shí)現(xiàn)大模型訓(xùn)推;通過自研AI框架、3D并行加速、自研訓(xùn)練加速庫、容器調(diào)度優(yōu)化等核心技術(shù),大幅提升訓(xùn)練效率;通過模型量化壓縮、自研推理加速算子庫、自研AI推理加速框架等核心技術(shù),推理效率也明顯提升;通過全鏈路故障分鐘級檢測、定位、告警,全鏈路日志監(jiān)控與可視化、斷點(diǎn)續(xù)訓(xùn)快速恢復(fù)等核心技術(shù),實(shí)現(xiàn)訓(xùn)推過程全鏈路監(jiān)控。

基于技術(shù)創(chuàng)新與項(xiàng)目經(jīng)驗(yàn)沉淀,天翼云打造了全面的平臺化能力和解決方案,保障客戶高效、便捷、穩(wěn)定、安全使用智算服務(wù)。

在模型應(yīng)用生態(tài)建設(shè)方面,天翼云在業(yè)界率先發(fā)布AI云電腦。AI云電腦具有算力更強(qiáng)大、更彈性、更安全、更優(yōu)惠的優(yōu)勢,降低大眾使用AI的門檻,加速推進(jìn)AI普惠化。目前天翼AI云電腦已接入多個主流通用大模型,以及教育、醫(yī)療、法律、心理等多個行業(yè)大模型,打造AI應(yīng)用中心,創(chuàng)新推出AI會議、AI低代碼、AI文檔、AI教育等場景化標(biāo)桿應(yīng)用,提升客戶辦公、生產(chǎn)效率。

此外,天翼云打造紅云大模型開發(fā)者社區(qū),聚合本土中文優(yōu)質(zhì)AI資源,加速AI應(yīng)用創(chuàng)新和商業(yè)閉環(huán)。通過簡單易用的工具鏈,端到端使能AI應(yīng)用開發(fā)全流程,助力孵化國產(chǎn)原生模型。

大會期間,天翼云攜智算創(chuàng)新成果亮相世博展覽館,展出了國內(nèi)領(lǐng)先的單體萬卡液冷智算池、“息壤”“云驍”“慧聚”三大智算平臺、AI云電腦以及基于天翼云智算云底座的星辰大模型等硬核技術(shù)成果,全方位展現(xiàn)在人工智能領(lǐng)域的深厚實(shí)力。

展區(qū).jpg

人工智能正成為發(fā)展新質(zhì)生產(chǎn)力的重要引擎,作為云服務(wù)國家隊(duì),天翼云具有豐富的智算資源儲備、強(qiáng)大的智算平臺能力以及開放的模型應(yīng)用生態(tài)。未來,天翼云將持續(xù)深耕技術(shù)創(chuàng)新,攜手產(chǎn)業(yè)各界共創(chuàng)智算未來,共贏AI時代。

轉(zhuǎn)載請保留原文鏈接:http://www.parkingblocks4less.com/a/keji/2024/0707/77278.html上一篇:上一篇:2024華為開發(fā)者大賽上海賽區(qū)在WAIC華為云分論壇正式啟動
下一篇:下一篇:沒有了