紫金財經(jīng)9月25日消息 2024百度云智大會在北京召開。會上,百度智能云分別針對算力、模型、AI應用,全面升級百舸AI異構(gòu)計算平臺4.0、千帆大模型平臺3.0兩大AI基礎(chǔ)設施,并升級代碼助手、智能客服、數(shù)字人三大AI原生應用產(chǎn)品。
百度集團執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖表示,大模型以及配套的算力管理平臺、模型和應用開發(fā)平臺,正在迅速成為新一基礎(chǔ)設施。過去一年,文心旗艦大模型降價幅度超過90%,主力模型全面免費,最大限度降低了企業(yè)創(chuàng)新試錯的成本。
千帆大模型平臺全面升級至3.0版本
百度智能云宣布,千帆大模型平臺全面升級至3.0版本,并公布了最新“成績單”:在千帆大模型平臺上,文心大模型日均調(diào)用量超過7億次,累計幫助用戶精調(diào)了3萬個大模型,開發(fā)出70多萬個企業(yè)級應用。
在應用開發(fā)上,本次千帆平臺全面升級了企業(yè)級RAG和企業(yè)級Agent開發(fā)。同時,大會還發(fā)布了低代碼AI應用開發(fā)平臺“AI速搭”,通過自然語言對話就能進行企業(yè)級應用開發(fā),實現(xiàn)一句話創(chuàng)建AI應用。
在模型調(diào)用服務上,目前,文心大模型已經(jīng)形成旗艦大模型、主力大模型、輕量大模型、垂直場景大模型等豐富的大模型家族,滿足企業(yè)個性化的模型需求。升級后的千帆3.0,不但可以調(diào)用包括文心系列大模型在內(nèi)的近百個國內(nèi)外大模型,還支持調(diào)用語音、視覺等各種傳統(tǒng)的小模型。成本方面,過去一年,文心旗艦大模型降價幅度超過90%、主力模型全面免費,最大限度降低企業(yè)創(chuàng)新試錯的成本。
在模型開發(fā)上,今年企業(yè)定制、微調(diào)專屬模型的需求不斷增加。千帆3.0不僅提供了最完善的大模型工具鏈,還支持CV、NLP、語音等傳統(tǒng)模型的開發(fā),并實現(xiàn)數(shù)據(jù)、模型、算力等資源的統(tǒng)一納管和調(diào)度,為企業(yè)提供一站式的大、小模型開發(fā)服務。
在應用開發(fā)方面,針對企業(yè)落地大模型的高頻應用場景,千帆3.0從檢索效果、檢索性能、存儲擴展、調(diào)配靈活性四方面對企業(yè)級檢索增強生成(RAG)進行了全面升級;針對企業(yè)級Agent的開發(fā),千帆3.0增加了業(yè)務自主編排、人工編排、知識注入、記憶能力以及百度搜索等80多個官方組件支持。
百舸AI異構(gòu)計算平臺4.0發(fā)布
大算力是大模型落地的基礎(chǔ)條件。為滿足企業(yè)落地大模型從集群創(chuàng)建、開發(fā)實驗,到模型訓練、推理的全旅程算力需求,應對超大規(guī)模GPU集群高成本、難運營兩大挑戰(zhàn),百度智能云升級發(fā)布百舸AI異構(gòu)計算平臺4.0,面向萬卡、十萬卡集群全面升級算力管理能力。
沈抖表示,百舸4.0正是為部署十萬卡大規(guī)模集群而設計的。今天的百舸4.0,已經(jīng)具備了成熟的十萬卡集群部署和管理能力,就是要突破這些新挑戰(zhàn),為整個產(chǎn)業(yè)提供持續(xù)領(lǐng)先的算力平臺。
在集群創(chuàng)建階段,企業(yè)通常需要進行大量復雜、瑣碎的算力配置和調(diào)試工作。百舸4.0預置了主流的大模型訓練工具,能夠?qū)崿F(xiàn)工具層面的秒級部署,并將萬卡集群運行準備時間從幾周縮減至1小時,極大地提升部署效率,縮短業(yè)務上線周期。
在開發(fā)實驗階段,百舸4.0全新升級的可觀測大盤,能夠?qū)Χ嘈具m配、集群效能、任務自動容錯等方面進行全方位監(jiān)測,提供直觀決策依據(jù),幫助用戶更好地把控整體項目。
在穩(wěn)定性方面,百舸4.0能夠自動篩查集群狀態(tài),并基于對GPU故障的精準預測,及時轉(zhuǎn)移工作負載,降低故障發(fā)生頻次。此外,百舸獨有的故障秒級感知定位、Flash Checkpoint模型任務狀態(tài)回滾等技術(shù),能夠大幅減少集群故障處置時間,實現(xiàn)接近無損的集群容錯。
目前,百舸在萬卡集群上實現(xiàn)了有效訓練時長占比99.5%以上,業(yè)界領(lǐng)先,極大地節(jié)約了客戶算力與時間成本。此外,百舸4.0通過在集群設計、任務調(diào)度、并行策略、顯存優(yōu)化等一系列創(chuàng)新,大幅提升了集群的模型訓練效率,整體性能相比業(yè)界平均水平提升高達30%。
三大AI原生應用產(chǎn)品實現(xiàn)升級
此外,隨著大模型產(chǎn)業(yè)落地逐漸走向深水區(qū),AI原生應用也將迎來爆發(fā)式增長,為了滿足企業(yè)直接選購成熟AI應用的需求,百度智能云面向數(shù)字人、智能客服、代碼提效三大領(lǐng)域,升級了三大AI原生應用產(chǎn)品。
基于文心大模型重構(gòu)的AI原生智能客服應用“客悅”,在用戶復雜意圖理解、多模態(tài)信息交流等方面實現(xiàn)了大幅提升,讓智能客服變得更聰明、更擬人?;诖竽P湍芰?,新升級的曦靈數(shù)字人4.0支持根據(jù)文字快速生成不同妝造、不同行業(yè)特色的3D數(shù)字人形象和視頻,并且曦靈平臺宣布:將3D超寫實數(shù)字人的價格從萬元大幅降價至199元,達業(yè)內(nèi)最低價。
全新升級的全流程AI代碼提效工具“文心快碼”,聚焦研發(fā)全生命周期的業(yè)務流,實現(xiàn)了從項目接手到最終交付,全流程編碼開發(fā)效率與質(zhì)量的雙重提升。文心快碼業(yè)界首發(fā)了「企業(yè)級代碼架構(gòu)解釋」、「企業(yè)級代碼審查」,兩項全新功能。