機(jī)器之心報道
作者:杜偉
從此,操作系統(tǒng)被賦予了新的內(nèi)核,也讓應(yīng)用開發(fā)體驗迎來前所未有的新變化。
大模型發(fā)展至今,還能帶給開發(fā)者哪些驚喜呢?
在 4 月 16 日舉辦的 2024 百度 Create AI 開發(fā)者大會上,百度智能云扔下一顆「重磅炸彈」,重新定義了計算機(jī)的核心系統(tǒng)軟件 —— 操作系統(tǒng)。
會上,百度集團(tuán)執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖宣布正式發(fā)布新一代智能計算操作系統(tǒng) —— 萬源。在大模型技術(shù)不斷推動云服務(wù)向 AI 靠攏的當(dāng)下,這成為了百度跳出傳統(tǒng)云計算、革新 AI 原生應(yīng)用開發(fā)體驗的一大舉措。
沈抖在百度 Create AI 開發(fā)者大會上。
對比操作系統(tǒng)的核心組件,比如底層硬件設(shè)備、管理軟硬件資源的內(nèi)核層、與用戶交互的 Shell 層和集成各類工具程序的應(yīng)用層,萬源的整體框架是這樣的:
Kernel(內(nèi)核)層包含百度百舸?AI 異構(gòu)計算平臺和百度文心大模型,滿足模型訓(xùn)練算力需求和多樣化大模型使用需求。
內(nèi)核層之上的 Shell(外殼)層為千帆 ModelBuilder 平臺,讓開發(fā)者按需和細(xì)分場景來定制、精調(diào)模型。
最上面為 Toolkit(工具)層,千帆 AppBuilder 和 AgentBuilder 支持了各類應(yīng)用和 Agent 的快速開發(fā)。
智能計算操作系統(tǒng)萬源的「三層」組成。
自下往上,萬源要在底層屏蔽掉云原生系統(tǒng)與異構(gòu)算力的復(fù)雜性、并強(qiáng)化大模型這一能力引擎,在中層對大模型進(jìn)行部署精調(diào),在上層為 AI 原生應(yīng)用和 Agent 的快速開發(fā)提供支撐和保障。
也就是說,借助操作系統(tǒng)這個完整載體,百度智能云將高效的異構(gòu)算力、智能的系統(tǒng)內(nèi)核和敏捷的應(yīng)用開發(fā)「打包」,為業(yè)界加速 AI 原生應(yīng)用布局提供一個新選擇。
或許有人會問,從傳統(tǒng)操作系統(tǒng)發(fā)展到如今新一代的智能計算操作系統(tǒng),需要什么契機(jī)呢?我們有必要從計算機(jī)操作方式進(jìn)化、計算平臺迭代、大模型技術(shù)變革等幾個方面展開說說。
大模型崛起
新一代操作系統(tǒng)成為必選項
當(dāng)然,我們熟悉的計算機(jī)操作系統(tǒng)通常是 Linux、Windows 等。但說起來,操作系統(tǒng)不是與計算機(jī)同步出現(xiàn),它管理的對象也隨時代需求、技術(shù)趨勢而變。
1946 年 2 月,世界上第一臺電子計算機(jī) ENIAC 誕生,彼時操作全部要人工完成。匯編語言、匯編器的出現(xiàn)逐漸用程序代替人工、用軟件管理硬件,這是操作系統(tǒng)的雛形。高級編程語言和編譯器讓計算平臺進(jìn)一步進(jìn)化,并帶來更復(fù)雜的軟件和更強(qiáng)大的硬件,要求操作系統(tǒng)快速迭代。
此后,不斷增加的軟件規(guī)模和復(fù)雜度讓單臺機(jī)器力不從心,集群出現(xiàn)。操作系統(tǒng)管理的對象從單臺機(jī)器及其上運(yùn)行的「進(jìn)程」擴(kuò)展為整個集群及運(yùn)行的各類「微服務(wù)」,云計算來了。
直到這時,操作系統(tǒng)的框架和組成沒有大的變化。在本質(zhì)上,操作系統(tǒng)負(fù)責(zé)連通硬件和軟件,向下屏蔽底層的復(fù)雜性,向上抽象成簡單的交互界面。
近年來,大模型、AI 原生應(yīng)用、Agent 及相伴而生的理解、生成、邏輯和記憶能力推動技術(shù)變革,讓自然語言主導(dǎo)的人機(jī)交互嶄露頭角,沒有編程基礎(chǔ)的人也可以成為開發(fā)者,編程需求的滿足比以往容易得多。
開發(fā)范式的種種新變化進(jìn)一步催生軟件市場的爆發(fā),硬件也隨之進(jìn)步,傳統(tǒng)操作系統(tǒng)改變的契機(jī)到了,尤其體現(xiàn)在一些層的組成內(nèi)容上。
比如在操作系統(tǒng)內(nèi)核中,底層硬件從以 CPU 算力為主變成以 GPU 算力為主,并首次增加軟硬件之外的第三種資源 —— 大模型壓縮的世界知識。相應(yīng)地,操作系統(tǒng)管理的對象不再只是進(jìn)程和微服務(wù),現(xiàn)在還多了基于大模型衍生的智能。
這意味著,一個超越傳統(tǒng)軟件范疇的全新操作系統(tǒng)成為必選項,對基于 AI 的智能計算更好地抽象和封裝,重新定義人機(jī)交互,成為大模型能力全方位加持的強(qiáng)大載體,為開發(fā)者提供更智能、更流暢、更個性化的開發(fā)體驗。
這一切在萬源這里得到了滿足,內(nèi)核層有能夠?qū)崿F(xiàn)萬卡規(guī)模集群模型訓(xùn)練的算力和大語言模型、CV 大模型能力,外殼層可以對內(nèi)核層的大模型定制精調(diào),工具層則實現(xiàn)了簡單便捷的 AI 原生應(yīng)用和 Agent 開發(fā)。
我們應(yīng)看到,實現(xiàn)萬源各層功能離不開百度智能云在算力、模型、工具和應(yīng)用等各個層面的產(chǎn)品積累。這也是我們接下來要講的內(nèi)容。
三層一體
萬源操作系統(tǒng)的「新」落在哪里?
可以看到,大模型出現(xiàn)以來提出的全新人機(jī)交互需求、人們對開發(fā)體驗的更多樣性訴求以及傳統(tǒng)云計算向智能計算的轉(zhuǎn)變,讓萬源的出現(xiàn)有了必要性和合理性。
那么,萬源各層組成有哪些新的、獨(dú)特之處呢?先從 Kernel(內(nèi)核)層看起,算力和大模型是兩大組成部分。
作為 AI 三要素之一,算力重要性無需多言。在萬源中,百度百舸?AI 異構(gòu)計算平臺是將現(xiàn)有算力資源發(fā)揮到極致的基座。該平臺針對大模型訓(xùn)練、推理任務(wù),分別在智算集群設(shè)計、調(diào)度和容錯等環(huán)節(jié)優(yōu)化。目前,百舸在萬卡集群上的模型有效訓(xùn)練時長占比超過了 98.8%,線性加速比和帶寬有效性均達(dá)到了 95%,實現(xiàn)業(yè)界領(lǐng)先算力效能,為內(nèi)核層提供高效的算力保障。
此外還有一個問題,國內(nèi)芯片供應(yīng)存在不確定性,這必然會導(dǎo)致多芯片并存的格局(即國內(nèi)和國內(nèi)品牌芯片共存),這為智算集群中模型推理和單一任務(wù)訓(xùn)練提出了挑戰(zhàn)。百舸不僅兼容了昆侖芯、昇騰、海光 DCU、英偉達(dá)、英特爾等國內(nèi)外主流 AI 芯片,更實現(xiàn)百卡和千卡規(guī)模、單一訓(xùn)練任務(wù)下,不同廠商芯片的混合訓(xùn)練,其中百卡規(guī)模性能損失不超過 3%,千卡規(guī)模性能損失不超過 5%,實現(xiàn)業(yè)界領(lǐng)先。
正如沈抖會上所言,「百舸為大家屏蔽掉了芯片之間的差異,提供了自由選擇不同芯片組合的權(quán)利?!?/span>
內(nèi)核層的另一主角是 77 個精選大模型,包括百度 ERNIE 4.0、ERNIE 3.5 大語言模型、近期發(fā)布的 ERNIE Speed/Lite/Tiny 系列輕量模型、文心視覺大模型和各種第三方大模型。它們壓縮并封裝了龐大的世界知識,是更上層運(yùn)行簡單接口和 AI 原生應(yīng)用的能力源泉。
來到外殼層,主角是千帆 ModelBuilder,負(fù)責(zé)大模型管理、調(diào)度和二次開發(fā)。有了它,開發(fā)者不用從頭開始訓(xùn)練大模型,付出很少數(shù)據(jù)、資源即可在基礎(chǔ)大模型上快速精調(diào)出適合自身業(yè)務(wù)和場景的模型。
再往上為 ToolKit(工具)層,集成了產(chǎn)業(yè)級 AI 原生應(yīng)用開發(fā)平臺 AppBuilder 和基于文心大模型的智能體構(gòu)建平臺 AgentBuilder。有了內(nèi)核層和外殼層的算力和模型鋪墊,萬源要在此層讓開發(fā)者切身體驗到不一樣的 AI 原生應(yīng)用開發(fā)。
其中,AppBuilder 支持工作流編排。開發(fā)者選擇使用預(yù)置模板和組件或者集成、擴(kuò)建特色組件,輕松定制自己的業(yè)務(wù)流程。經(jīng)過 ModelBuilder 精調(diào)的模型也可以直接調(diào)用,怎么方便怎么來。開發(fā)完的應(yīng)用支持一鍵發(fā)布到百度搜索等其他平臺,并通過 API 或 SDK 在用戶系統(tǒng)中直接集成。
AgentBuilder 則致力于零門檻,讓不會編程的用戶通過 prompt 輸入和操作調(diào)優(yōu),快速創(chuàng)建專屬于自己的智能體,在使用場景中自動提供服務(wù)。
此外,萬源還提供了完善的模型 & 數(shù)據(jù)管理以及模型安全服務(wù),為 AI 原生應(yīng)用的繁榮保駕護(hù)航。
至此,從內(nèi)核層、外殼層到工具層,百度在我們面前展現(xiàn)出了新一代智能計算操作系統(tǒng)的全貌。
背后的技術(shù)優(yōu)勢
能解決好問題才行
我們觀察到,萬源一舉解決了業(yè)界同行們都在面臨的三個關(guān)鍵問題,分別是算力、模型訓(xùn)練和部署、以及應(yīng)用開發(fā),并在過程中形成了自己的核心技術(shù)優(yōu)勢。
尤其是在算力部分,百舸?AI 異構(gòu)計算平臺實現(xiàn)了單一任務(wù)下不同廠商芯片的大模型混合訓(xùn)練, 百卡規(guī)模性能損失不超過 3%,千卡規(guī)模性能損失不超過 5%。這些是如何做到的呢?
首先,百舸的線性加速比達(dá)到了 95%,這要?dú)w功于百度智能云面向 AI 計算推出的 AI 加速套件「AIAK」,它的核心是網(wǎng)絡(luò)通信加速。我們知道,AI 跑在芯片上靠的是各種各樣的算子,但每家芯片廠商的算子實現(xiàn)并不一樣。
百度則選擇在整個框架層面拆分底層的通信和上層算子的優(yōu)化和實現(xiàn),這樣各家芯片有了針對這些算子的優(yōu)化實現(xiàn)。最終不同廠商的芯片都能跑在百度的加速庫上,即百度集合通信庫 BCCL,它是百舸的重要組件。但是,這一步并沒有直接解決一云多異構(gòu)芯片的問題。
還需要第二步。以前一種芯片算力是相同的,所以我們的并行策略大多是均勻切分的。但現(xiàn)在算力、通信、存儲都不一樣了,為了充分發(fā)揮出各芯片算力性能那就需要實現(xiàn)不均勻的切分方式,比如在模型張量切分中,不同芯片可能需要切分成不同的大小,在流水線切分中則需要在不同芯片上放不同的層數(shù)。這就需要對框架做相應(yīng)的改造和優(yōu)化,我們的訓(xùn)推加速軟件就實現(xiàn)了這些不均勻的,混合的切分策略,讓每個芯片算力能充分發(fā)揮出來。
而接下來,集群中各種芯片的比例可能是不一樣的,在各種情況下都能找到最優(yōu)的任務(wù)切分方法。在前面這么多復(fù)雜策略的情況下通過測試顯然是不行的。通過一套自動化并行策略框架,根據(jù)各種策略所需要的計算量,存儲量,通信量,以及不同芯片的計算和 IO 效率,從而快速計算出最優(yōu)的任務(wù)切分策略,保證在各種配比下芯片算力都能充分發(fā)揮出來。這是實現(xiàn)一云多芯的基礎(chǔ)原理。
至于百卡和千卡規(guī)模性能損失為何如此低,這還要得益于百舸在存儲方面支持了高性能分布式存儲 PFS、以及萬卡級別的 RDMA 網(wǎng)絡(luò),前者顯著提升訓(xùn)練和推理過程中的 I/O 吞吐能力,后者有效降低網(wǎng)絡(luò)延遲。
同樣地,萬源讓大模型的訓(xùn)練和部署不再困難。尤其是對個人開發(fā)者而言,他們沒有訓(xùn)練大模型所需的算力、數(shù)據(jù)和精力,這一切都讓萬源代為完成。
有了 ModelBuilder,開發(fā)者沒有了從頭開始訓(xùn)練模型的煩惱,隨時隨調(diào)隨用。部署起來同樣方便快捷。
最后,應(yīng)用開發(fā)問題依靠 AppBuilder 得到更好解決,它的兩個優(yōu)勢幫了大忙。
一是依托文心 4.0 強(qiáng)大的理解和遵循能力,效果好且不用長時間調(diào)優(yōu),成本和門檻降了下來。同時豐富的 AI 能力組件、大模型能力組件和百度獨(dú)家開放的業(yè)務(wù)組件讓 AI 原生應(yīng)用開發(fā)更加高效。二是創(chuàng)建一點(diǎn)都不繁瑣,只需三步:命名、描述具體要求、運(yùn)行,一氣呵成。
而隨著算力、模型訓(xùn)練和部署、以及應(yīng)用開發(fā)這些節(jié)點(diǎn)的關(guān)鍵問題一一被有效地克服,萬源為 AI 原生應(yīng)用提供了更強(qiáng)的動力和更大的舞臺,讓 AI 在應(yīng)用層的機(jī)會更多。
寫在最后
不難發(fā)現(xiàn),大模型出現(xiàn)以來,AI 圈呈現(xiàn)一個非常明顯的特點(diǎn),即大家追逐的熱點(diǎn)變化很快。短短幾年時間,我們已經(jīng)看到了從最開始的基礎(chǔ)和行業(yè)垂直模型,慢慢發(fā)展到之后基于大模型的各類 AI 原生應(yīng)用和 Agent。
很顯然,對于業(yè)界玩家們來說,盡可能不錯過每一個節(jié)點(diǎn),才更有可能不被同行落下,反過來就有可能跑贏對手。我們看到,在大模型發(fā)展至今的整體規(guī)劃和布局中,百度步步為營,并以廣泛、真實的客戶實踐和產(chǎn)業(yè)落地需求為導(dǎo)向。
從業(yè)界首發(fā)行業(yè)大模型到全球首個企業(yè)級大模型生產(chǎn)平臺千帆 ModelBuilder,百度走在了大模型落地的前列。目前,千帆大模型平臺已經(jīng)服務(wù)了 8.5 萬家企業(yè)客戶,并累計精調(diào)超過 1.4 萬個模型。
隨著從卷大模型進(jìn)入到卷應(yīng)用的階段,百度加快了基于大模型的 AI 原生應(yīng)用開發(fā)及生態(tài)建設(shè)。去年 10 月 17 日,百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏在百度世界 2023 上預(yù)言,「我們即將進(jìn)入一個 AI 原生的時代」。此后, AI 原生應(yīng)用開發(fā)平臺千帆 AppBuilder 全面開放服務(wù),讓人人都能自己開發(fā)。目前已經(jīng)有 8100 家伙伴通過該平臺開發(fā) AI 原生應(yīng)用。
此次,百度又為這個新時代的到來拋出全新的思考 —— 萬源。百度從完整的 AI 原生操作系統(tǒng)出發(fā),將過去多年在算力、大模型和應(yīng)用層面積累的工作「化零為整」,以更強(qiáng)的姿態(tài)迎接 AI 原生時代面臨的挑戰(zhàn)。
未來,百度一方面將繼續(xù)把萬源的基礎(chǔ)設(shè)施、內(nèi)核服務(wù)做得更智能、高效,另一方面致力于在上層提供更便捷的開發(fā)工具,做到雙管齊下。同時進(jìn)一步開放生態(tài)合作,攜手應(yīng)用開發(fā)者、企業(yè)、芯片廠商將萬源打造地更加完備。
版權(quán)聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn),該文觀點(diǎn)僅代表作者本人。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權(quán)/違法違規(guī)的內(nèi)容, 請發(fā)送郵件至 舉報,一經(jīng)查實,本站將立刻刪除。