中國電信天翼云完成首個國產GPU萬卡訓練!4000億參數大模型領先

    2024-09-20 16:04:50 114觀看

    9月20日消息,中國電信宣布,天翼云自研的國內首個單集群萬卡國產化全功能預訓練云服務平臺,已經正式發布上線,基于華為昇騰芯片,并完成了萬卡規模Llama3.1-405B大模型訓練。e43驛資訊

    Llama3.1-405B作為4000億參數規模的大模型,在息壤訓推服務平臺的支持下,經過多輪優化,MFU(算力利用率)達到國內領先水平。e43驛資訊

    另外,700億參數大模型Llama2-70B在萬卡規模下完成訓練,MFU也處于業界領先水平。e43驛資訊

    中國電信天翼云完成首個國產GPU萬卡訓練!4000億參數大模型e43驛資訊

    據悉,天翼云的這套平臺具備萬卡納管和并行訓練能力,基于HPFS PB級并行文件系統、CTCCL RDMA高速卡間互聯技術、Gang策略與拓撲感知的智算容器調度,以及慧聚自研分布式訓練框架TeleFormers和平臺,實現萬卡資源納管、萬卡規模并行訓練。e43驛資訊

    其中,天翼云自研了AI框架Teleformers,對算子、通信、數據處理進行優化,還有并行策略的自適應調整,顯著提升了大模型訓練的訓練效率。e43驛資訊

    在目前業內大參數規模開源單體稠密模型Llama3.1-405B大模型訓練測試中,性能表現達到國際同等水平。e43驛資訊

    算子優化方面,針對昇騰芯片的特性,在網絡結構層面對諸多高頻算子進行了定制化改造,構建了高性能算子集。e43驛資訊

    比如matmul算子,利用昇騰芯片的計算親和性,將算子輸入padding到特定的維度,大幅提升執行效率,從而明顯縮短了訓練時間。e43驛資訊

    數據處理和流水線方面,通過設置合理的數據分片策略和HPFS條帶化優化,結合數據預取與數據下沉技術,大幅提升數據流的處理效率和穩定性;對預處理后的數據集進行了二次分片并提供就近緩存能力,減少GPU空閑時間。e43驛資訊

    中國電信天翼云完成首個國產GPU萬卡訓練!4000億參數大模型e43驛資訊

    自適應并行策略方面,基于對3D并行中各類計算單元的分析,天翼云設計了多種自適應的3D并行策略,依據模型規模和硬件資源的不同可以自動選擇合適的并行策略,充分利用計算資源和顯存資源,縮短模型訓練中每輪的迭代時間。e43驛資訊

    中國電信天翼云完成首個國產GPU萬卡訓練!4000億參數大模型e43驛資訊

    天翼云國產化萬卡智算中心還有多項技術突破——e43驛資訊

    天翼云息壤訓練服務平臺基于軟硬件協同設計,提供全鏈路故障監控、基于主動感知的全鏈路故障監控和定位、CheckPoint秒級多級高速存儲系統、容錯優雅調度和模型編譯緩存等系統,將萬卡規模故障發現和解決問題縮短到業內前沿的分鐘級,大幅提升有效訓練時間。e43驛資訊

    自動斷點續訓系統:e43驛資訊

    建設豐富的故障庫,基于此構建了多維故障感知系統,能夠快速主動感知相關故障事件和潛在的故障風險;e43驛資訊

    通過精準的故障隔離和調度手段,快速隔離處理故障節點并重新調度新節點接手任務繼續訓練,實現無人干預式斷點續訓,有效減少GPU閑置時間。e43驛資訊

    中國電信天翼云完成首個國產GPU萬卡訓練!4000億參數大模型e43驛資訊

    高速多級CheckPoint系統:e43驛資訊

    天翼云設計基于多級存儲的高速CheckPoint系統,通過兩階段異步存儲,實現高速寫入內存,并終異步寫入遠端系統;e43驛資訊

    針對斷點恢復場景,提供進程級故障原地快恢和遠端快速恢復能力,終實現對CheckPoint的秒級讀寫能力,大幅降低斷點恢復時間、提升訓練效率。e43驛資訊

    中國電信天翼云完成首個國產GPU萬卡訓練!4000億參數大模型e43驛資訊

    全鏈路檢測工具鏈:e43驛資訊

    天翼云開發了全鏈路故障監控工具鏈,能夠基于主動感知實現全鏈路的故障監控和定位。e43驛資訊

    該工具鏈可以主動發現設備故障,并降低訓練中斷的頻次,確保訓練過程的連續性和穩定性。e43驛資訊

    本文鏈接:http://www.bbbearmall.com/news-132091.html中國電信天翼云完成首個國產GPU萬卡訓練!4000億參數大模型領先

    標簽:
    聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com。天上從來不會掉餡餅,請大家時刻謹防詐騙
    国产精品无码成人午夜电影| 亚洲精品中文字幕无码蜜桃| 亚洲av无码一区二区三区乱子伦 | 婷婷综合久久中文字幕蜜桃三电影| 久久久无码精品亚洲日韩京东传媒 | 日韩亚洲欧美中文在线| 亚洲成a人片在线观看无码| 精品久久久无码人妻中文字幕豆芽| 精品无码AV一区二区三区不卡 | 日日摸夜夜爽无码毛片精选| 日韩精品一区二区三区中文 | 无码8090精品久久一区| 人妻少妇偷人精品无码| 久久久久亚洲AV无码专区首JN| 精品人妻中文字幕有码在线| 国产日韩AV免费无码一区二区三区| 亚洲人成网亚洲欧洲无码久久| 亚洲不卡无码av中文字幕| 一本一道AV无码中文字幕| 精品无码人妻久久久久久| 久久久无码人妻精品无码| 伊人久久精品无码二区麻豆| 中文字幕亚洲精品无码| 色综合久久中文综合网| 99久久中文字幕| 台湾佬中文娱乐网22| 最新中文字幕AV无码不卡| 亚洲av无码国产精品色在线看不卡| 国产精品亚洲аv无码播放| 麻豆亚洲AV永久无码精品久久| 亚洲AV成人无码久久精品老人| 中国无码人妻丰满熟妇啪啪软件| 亚洲中文字幕无码专区| 中文字幕一区二区免费| 中文字幕国产第一页首页| 中文无码不卡的岛国片| 特级做A爰片毛片免费看无码| 中文有无人妻vs无码人妻激烈| 亚洲日韩乱码中文无码蜜桃臀网站| 97无码人妻福利免费公开在线视频 | 精品一区二区无码AV |