下接萬卡集群、上連AI原生應(yīng)用，操作系統(tǒng)的進(jìn)化超出你的想象（萬卡互聯(lián)是什么）

投稿用戶 ? 2024年4月22日 pm2:49 ? 科研百科 ? 閱讀 103

機(jī)器之心報道

作者：杜偉

從此，操作系統(tǒng)被賦予了新的內(nèi)核，也讓應(yīng)用開發(fā)體驗迎來前所未有的新變化。

大模型發(fā)展至今，還能帶給開發(fā)者哪些驚喜呢？

在 4 月 16 日舉辦的 2024 百度 Create AI 開發(fā)者大會上，百度智能云扔下一顆「重磅炸彈」，重新定義了計算機(jī)的核心系統(tǒng)軟件 —— 操作系統(tǒng)。

會上，百度集團(tuán)執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖宣布正式發(fā)布新一代智能計算操作系統(tǒng) —— 萬源。在大模型技術(shù)不斷推動云服務(wù)向 AI 靠攏的當(dāng)下，這成為了百度跳出傳統(tǒng)云計算、革新 AI 原生應(yīng)用開發(fā)體驗的一大舉措。

下接萬卡集群、上連AI原生應(yīng)用，操作系統(tǒng)的進(jìn)化超出你的想象（萬卡互聯(lián)是什么）

沈抖在百度 Create AI 開發(fā)者大會上。

對比操作系統(tǒng)的核心組件，比如底層硬件設(shè)備、管理軟硬件資源的內(nèi)核層、與用戶交互的 Shell 層和集成各類工具程序的應(yīng)用層，萬源的整體框架是這樣的：

Kernel（內(nèi)核）層包含百度百舸?AI 異構(gòu)計算平臺和百度文心大模型，滿足模型訓(xùn)練算力需求和多樣化大模型使用需求。

內(nèi)核層之上的 Shell（外殼）層為千帆 ModelBuilder 平臺，讓開發(fā)者按需和細(xì)分場景來定制、精調(diào)模型。

最上面為 Toolkit（工具）層，千帆 AppBuilder 和 AgentBuilder 支持了各類應(yīng)用和 Agent 的快速開發(fā)。

下接萬卡集群、上連AI原生應(yīng)用，操作系統(tǒng)的進(jìn)化超出你的想象（萬卡互聯(lián)是什么）

智能計算操作系統(tǒng)萬源的「三層」組成。

自下往上，萬源要在底層屏蔽掉云原生系統(tǒng)與異構(gòu)算力的復(fù)雜性、并強(qiáng)化大模型這一能力引擎，在中層對大模型進(jìn)行部署精調(diào)，在上層為 AI 原生應(yīng)用和 Agent 的快速開發(fā)提供支撐和保障。

也就是說，借助操作系統(tǒng)這個完整載體，百度智能云將高效的異構(gòu)算力、智能的系統(tǒng)內(nèi)核和敏捷的應(yīng)用開發(fā)「打包」，為業(yè)界加速 AI 原生應(yīng)用布局提供一個新選擇。

或許有人會問，從傳統(tǒng)操作系統(tǒng)發(fā)展到如今新一代的智能計算操作系統(tǒng)，需要什么契機(jī)呢？我們有必要從計算機(jī)操作方式進(jìn)化、計算平臺迭代、大模型技術(shù)變革等幾個方面展開說說。

大模型崛起

新一代操作系統(tǒng)成為必選項

當(dāng)然，我們熟悉的計算機(jī)操作系統(tǒng)通常是 Linux、Windows 等。但說起來，操作系統(tǒng)不是與計算機(jī)同步出現(xiàn)，它管理的對象也隨時代需求、技術(shù)趨勢而變。

1946 年 2 月，世界上第一臺電子計算機(jī) ENIAC 誕生，彼時操作全部要人工完成。匯編語言、匯編器的出現(xiàn)逐漸用程序代替人工、用軟件管理硬件，這是操作系統(tǒng)的雛形。高級編程語言和編譯器讓計算平臺進(jìn)一步進(jìn)化，并帶來更復(fù)雜的軟件和更強(qiáng)大的硬件，要求操作系統(tǒng)快速迭代。

此后，不斷增加的軟件規(guī)模和復(fù)雜度讓單臺機(jī)器力不從心，集群出現(xiàn)。操作系統(tǒng)管理的對象從單臺機(jī)器及其上運(yùn)行的「進(jìn)程」擴(kuò)展為整個集群及運(yùn)行的各類「微服務(wù)」，云計算來了。

直到這時，操作系統(tǒng)的框架和組成沒有大的變化。在本質(zhì)上，操作系統(tǒng)負(fù)責(zé)連通硬件和軟件，向下屏蔽底層的復(fù)雜性，向上抽象成簡單的交互界面。

近年來，大模型、AI 原生應(yīng)用、Agent 及相伴而生的理解、生成、邏輯和記憶能力推動技術(shù)變革，讓自然語言主導(dǎo)的人機(jī)交互嶄露頭角，沒有編程基礎(chǔ)的人也可以成為開發(fā)者，編程需求的滿足比以往容易得多。

開發(fā)范式的種種新變化進(jìn)一步催生軟件市場的爆發(fā)，硬件也隨之進(jìn)步，傳統(tǒng)操作系統(tǒng)改變的契機(jī)到了，尤其體現(xiàn)在一些層的組成內(nèi)容上。

比如在操作系統(tǒng)內(nèi)核中，底層硬件從以 CPU 算力為主變成以 GPU 算力為主，并首次增加軟硬件之外的第三種資源 —— 大模型壓縮的世界知識。相應(yīng)地，操作系統(tǒng)管理的對象不再只是進(jìn)程和微服務(wù)，現(xiàn)在還多了基于大模型衍生的智能。

這意味著，一個超越傳統(tǒng)軟件范疇的全新操作系統(tǒng)成為必選項，對基于 AI 的智能計算更好地抽象和封裝，重新定義人機(jī)交互，成為大模型能力全方位加持的強(qiáng)大載體，為開發(fā)者提供更智能、更流暢、更個性化的開發(fā)體驗。

這一切在萬源這里得到了滿足，內(nèi)核層有能夠?qū)崿F(xiàn)萬卡規(guī)模集群模型訓(xùn)練的算力和大語言模型、CV 大模型能力，外殼層可以對內(nèi)核層的大模型定制精調(diào)，工具層則實現(xiàn)了簡單便捷的 AI 原生應(yīng)用和 Agent 開發(fā)。

我們應(yīng)看到，實現(xiàn)萬源各層功能離不開百度智能云在算力、模型、工具和應(yīng)用等各個層面的產(chǎn)品積累。這也是我們接下來要講的內(nèi)容。

三層一體

萬源操作系統(tǒng)的「新」落在哪里？

可以看到，大模型出現(xiàn)以來提出的全新人機(jī)交互需求、人們對開發(fā)體驗的更多樣性訴求以及傳統(tǒng)云計算向智能計算的轉(zhuǎn)變，讓萬源的出現(xiàn)有了必要性和合理性。

那么，萬源各層組成有哪些新的、獨(dú)特之處呢？先從 Kernel（內(nèi)核）層看起，算力和大模型是兩大組成部分。

作為 AI 三要素之一，算力重要性無需多言。在萬源中，百度百舸?AI 異構(gòu)計算平臺是將現(xiàn)有算力資源發(fā)揮到極致的基座。該平臺針對大模型訓(xùn)練、推理任務(wù)，分別在智算集群設(shè)計、調(diào)度和容錯等環(huán)節(jié)優(yōu)化。目前，百舸在萬卡集群上的模型有效訓(xùn)練時長占比超過了 98.8%，線性加速比和帶寬有效性均達(dá)到了 95%，實現(xiàn)業(yè)界領(lǐng)先算力效能，為內(nèi)核層提供高效的算力保障。

下接萬卡集群、上連AI原生應(yīng)用，操作系統(tǒng)的進(jìn)化超出你的想象（萬卡互聯(lián)是什么）

此外還有一個問題，國內(nèi)芯片供應(yīng)存在不確定性，這必然會導(dǎo)致多芯片并存的格局（即國內(nèi)和國內(nèi)品牌芯片共存），這為智算集群中模型推理和單一任務(wù)訓(xùn)練提出了挑戰(zhàn)。百舸不僅兼容了昆侖芯、昇騰、海光 DCU、英偉達(dá)、英特爾等國內(nèi)外主流 AI 芯片，更實現(xiàn)百卡和千卡規(guī)模、單一訓(xùn)練任務(wù)下，不同廠商芯片的混合訓(xùn)練，其中百卡規(guī)模性能損失不超過 3%，千卡規(guī)模性能損失不超過 5%，實現(xiàn)業(yè)界領(lǐng)先。

正如沈抖會上所言，「百舸為大家屏蔽掉了芯片之間的差異，提供了自由選擇不同芯片組合的權(quán)利?！?/span>

下接萬卡集群、上連AI原生應(yīng)用，操作系統(tǒng)的進(jìn)化超出你的想象（萬卡互聯(lián)是什么）

內(nèi)核層的另一主角是 77 個精選大模型，包括百度 ERNIE 4.0、ERNIE 3.5 大語言模型、近期發(fā)布的 ERNIE Speed/Lite/Tiny 系列輕量模型、文心視覺大模型和各種第三方大模型。它們壓縮并封裝了龐大的世界知識，是更上層運(yùn)行簡單接口和 AI 原生應(yīng)用的能力源泉。

下接萬卡集群、上連AI原生應(yīng)用，操作系統(tǒng)的進(jìn)化超出你的想象（萬卡互聯(lián)是什么）

來到外殼層，主角是千帆 ModelBuilder，負(fù)責(zé)大模型管理、調(diào)度和二次開發(fā)。有了它，開發(fā)者不用從頭開始訓(xùn)練大模型，付出很少數(shù)據(jù)、資源即可在基礎(chǔ)大模型上快速精調(diào)出適合自身業(yè)務(wù)和場景的模型。

下接萬卡集群、上連AI原生應(yīng)用，操作系統(tǒng)的進(jìn)化超出你的想象（萬卡互聯(lián)是什么）

再往上為 ToolKit（工具）層，集成了產(chǎn)業(yè)級 AI 原生應(yīng)用開發(fā)平臺 AppBuilder 和基于文心大模型的智能體構(gòu)建平臺 AgentBuilder。有了內(nèi)核層和外殼層的算力和模型鋪墊，萬源要在此層讓開發(fā)者切身體驗到不一樣的 AI 原生應(yīng)用開發(fā)。

其中，AppBuilder 支持工作流編排。開發(fā)者選擇使用預(yù)置模板和組件或者集成、擴(kuò)建特色組件，輕松定制自己的業(yè)務(wù)流程。經(jīng)過 ModelBuilder 精調(diào)的模型也可以直接調(diào)用，怎么方便怎么來。開發(fā)完的應(yīng)用支持一鍵發(fā)布到百度搜索等其他平臺，并通過 API 或 SDK 在用戶系統(tǒng)中直接集成。

AgentBuilder 則致力于零門檻，讓不會編程的用戶通過 prompt 輸入和操作調(diào)優(yōu)，快速創(chuàng)建專屬于自己的智能體，在使用場景中自動提供服務(wù)。

下接萬卡集群、上連AI原生應(yīng)用，操作系統(tǒng)的進(jìn)化超出你的想象（萬卡互聯(lián)是什么）

此外，萬源還提供了完善的模型 & 數(shù)據(jù)管理以及模型安全服務(wù)，為 AI 原生應(yīng)用的繁榮保駕護(hù)航。

至此，從內(nèi)核層、外殼層到工具層，百度在我們面前展現(xiàn)出了新一代智能計算操作系統(tǒng)的全貌。

背后的技術(shù)優(yōu)勢

能解決好問題才行

我們觀察到，萬源一舉解決了業(yè)界同行們都在面臨的三個關(guān)鍵問題，分別是算力、模型訓(xùn)練和部署、以及應(yīng)用開發(fā)，并在過程中形成了自己的核心技術(shù)優(yōu)勢。

尤其是在算力部分，百舸?AI 異構(gòu)計算平臺實現(xiàn)了單一任務(wù)下不同廠商芯片的大模型混合訓(xùn)練，百卡規(guī)模性能損失不超過 3%，千卡規(guī)模性能損失不超過 5%。這些是如何做到的呢？

首先，百舸的線性加速比達(dá)到了 95%，這要?dú)w功于百度智能云面向 AI 計算推出的 AI 加速套件「AIAK」，它的核心是網(wǎng)絡(luò)通信加速。我們知道，AI 跑在芯片上靠的是各種各樣的算子，但每家芯片廠商的算子實現(xiàn)并不一樣。

百度則選擇在整個框架層面拆分底層的通信和上層算子的優(yōu)化和實現(xiàn)，這樣各家芯片有了針對這些算子的優(yōu)化實現(xiàn)。最終不同廠商的芯片都能跑在百度的加速庫上，即百度集合通信庫 BCCL，它是百舸的重要組件。但是，這一步并沒有直接解決一云多異構(gòu)芯片的問題。

還需要第二步。以前一種芯片算力是相同的，所以我們的并行策略大多是均勻切分的。但現(xiàn)在算力、通信、存儲都不一樣了，為了充分發(fā)揮出各芯片算力性能那就需要實現(xiàn)不均勻的切分方式，比如在模型張量切分中，不同芯片可能需要切分成不同的大小，在流水線切分中則需要在不同芯片上放不同的層數(shù)。這就需要對框架做相應(yīng)的改造和優(yōu)化，我們的訓(xùn)推加速軟件就實現(xiàn)了這些不均勻的，混合的切分策略，讓每個芯片算力能充分發(fā)揮出來。

而接下來，集群中各種芯片的比例可能是不一樣的，在各種情況下都能找到最優(yōu)的任務(wù)切分方法。在前面這么多復(fù)雜策略的情況下通過測試顯然是不行的。通過一套自動化并行策略框架，根據(jù)各種策略所需要的計算量，存儲量，通信量，以及不同芯片的計算和 IO 效率，從而快速計算出最優(yōu)的任務(wù)切分策略，保證在各種配比下芯片算力都能充分發(fā)揮出來。這是實現(xiàn)一云多芯的基礎(chǔ)原理。

至于百卡和千卡規(guī)模性能損失為何如此低，這還要得益于百舸在存儲方面支持了高性能分布式存儲 PFS、以及萬卡級別的 RDMA 網(wǎng)絡(luò)，前者顯著提升訓(xùn)練和推理過程中的 I/O 吞吐能力，后者有效降低網(wǎng)絡(luò)延遲。

同樣地，萬源讓大模型的訓(xùn)練和部署不再困難。尤其是對個人開發(fā)者而言，他們沒有訓(xùn)練大模型所需的算力、數(shù)據(jù)和精力，這一切都讓萬源代為完成。

有了 ModelBuilder，開發(fā)者沒有了從頭開始訓(xùn)練模型的煩惱，隨時隨調(diào)隨用。部署起來同樣方便快捷。

最后，應(yīng)用開發(fā)問題依靠 AppBuilder 得到更好解決，它的兩個優(yōu)勢幫了大忙。

一是依托文心 4.0 強(qiáng)大的理解和遵循能力，效果好且不用長時間調(diào)優(yōu)，成本和門檻降了下來。同時豐富的 AI 能力組件、大模型能力組件和百度獨(dú)家開放的業(yè)務(wù)組件讓 AI 原生應(yīng)用開發(fā)更加高效。二是創(chuàng)建一點(diǎn)都不繁瑣，只需三步：命名、描述具體要求、運(yùn)行，一氣呵成。

而隨著算力、模型訓(xùn)練和部署、以及應(yīng)用開發(fā)這些節(jié)點(diǎn)的關(guān)鍵問題一一被有效地克服，萬源為 AI 原生應(yīng)用提供了更強(qiáng)的動力和更大的舞臺，讓 AI 在應(yīng)用層的機(jī)會更多。

寫在最后

不難發(fā)現(xiàn)，大模型出現(xiàn)以來，AI 圈呈現(xiàn)一個非常明顯的特點(diǎn)，即大家追逐的熱點(diǎn)變化很快。短短幾年時間，我們已經(jīng)看到了從最開始的基礎(chǔ)和行業(yè)垂直模型，慢慢發(fā)展到之后基于大模型的各類 AI 原生應(yīng)用和 Agent。

很顯然，對于業(yè)界玩家們來說，盡可能不錯過每一個節(jié)點(diǎn)，才更有可能不被同行落下，反過來就有可能跑贏對手。我們看到，在大模型發(fā)展至今的整體規(guī)劃和布局中，百度步步為營，并以廣泛、真實的客戶實踐和產(chǎn)業(yè)落地需求為導(dǎo)向。

從業(yè)界首發(fā)行業(yè)大模型到全球首個企業(yè)級大模型生產(chǎn)平臺千帆 ModelBuilder，百度走在了大模型落地的前列。目前，千帆大模型平臺已經(jīng)服務(wù)了 8.5 萬家企業(yè)客戶，并累計精調(diào)超過 1.4 萬個模型。

隨著從卷大模型進(jìn)入到卷應(yīng)用的階段，百度加快了基于大模型的 AI 原生應(yīng)用開發(fā)及生態(tài)建設(shè)。去年 10 月 17 日，百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏在百度世界 2023 上預(yù)言，「我們即將進(jìn)入一個 AI 原生的時代」。此后， AI 原生應(yīng)用開發(fā)平臺千帆 AppBuilder 全面開放服務(wù)，讓人人都能自己開發(fā)。目前已經(jīng)有 8100 家伙伴通過該平臺開發(fā) AI 原生應(yīng)用。

此次，百度又為這個新時代的到來拋出全新的思考 —— 萬源。百度從完整的 AI 原生操作系統(tǒng)出發(fā)，將過去多年在算力、大模型和應(yīng)用層面積累的工作「化零為整」，以更強(qiáng)的姿態(tài)迎接 AI 原生時代面臨的挑戰(zhàn)。

未來，百度一方面將繼續(xù)把萬源的基礎(chǔ)設(shè)施、內(nèi)核服務(wù)做得更智能、高效，另一方面致力于在上層提供更便捷的開發(fā)工具，做到雙管齊下。同時進(jìn)一步開放生態(tài)合作，攜手應(yīng)用開發(fā)者、企業(yè)、芯片廠商將萬源打造地更加完備。

下接萬卡集群、上連AI原生應(yīng)用，操作系統(tǒng)的進(jìn)化超出你的想象（萬卡互聯(lián)是什么）

版權(quán)聲明：本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn)，該文觀點(diǎn)僅代表作者本人。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權(quán)/違法違規(guī)的內(nèi)容，請發(fā)送郵件至舉報，一經(jīng)查實，本站將立刻刪除。

贊 (0)

投稿用戶

5款服裝類進(jìn)銷存軟件大盤點(diǎn)，選擇合適的很重要（服裝進(jìn)銷存軟件哪個好）

上一篇 2024年4月22日 pm2:43

TMS盤點(diǎn)：oTMS、快貨運(yùn)、唯智、富勒、藍(lán)橋

下一篇 2024年4月22日 pm2:55

科研百科

中國科協(xié)、教育部港澳臺大學(xué)生暑期實習(xí)活動全國組委會2022年第一次工作調(diào)度會召開

4月24日，中國科協(xié)、教育部港澳臺大學(xué)生暑期實習(xí)活動全國組委會正式成立，并以線上線下結(jié)合方式召開全國組委會2022年第一次工作調(diào)度會。中國科協(xié)黨組成員兼港澳臺辦公室主任羅暉、教育部…

2022年4月29日
352 0
解讀！事關(guān)龍巖住宅小區(qū)業(yè)主公共收益資金安全管理（小區(qū)業(yè)主公共收益使用）

《龍巖市城市管理局關(guān)于加強(qiáng)住宅小區(qū)業(yè)主公共收益資金安全管理的通知》（龍城規(guī)〔2022〕5號，以下簡稱《通知》）已于2022年10月28日印發(fā)，將于2022年11月13日起正式實施。…

科研百科 2023年3月12日
250 0
華碩電競特工B460軍規(guī)小板評測：十代酷睿親民座駕支持WiFi 6（華碩電競特工b460m）

北京時間5月27號晚9點(diǎn)，英特爾正式解禁了B460芯片組主板。與Z490芯片組主板相比，B460芯片組主板在功能上最大的區(qū)別之一就是不支持CPU超頻，因此特別適合搭配已鎖倍頻的第十…

科研百科 2023年3月14日
334 0
拒絕斷網(wǎng)：3母1子全屋WiFi覆蓋，玩轉(zhuǎn)360全屋路由（360全屋路由子母裝）

又?jǐn)嗑W(wǎng)了？網(wǎng)絡(luò)攝像頭卡死？智能音箱斷連？莫慌，很有可能是你家智能聯(lián)網(wǎng)設(shè)備太多了，老路由承受不了。這個問題很好琢磨，來和筆點(diǎn)君一起算算，家里有幾部手機(jī)？有幾臺電腦？多少智能設(shè)備？智…

科研百科 2023年8月30日
200 0
濟(jì)南市天橋區(qū)實驗小學(xué)：加強(qiáng)黨建引領(lǐng)，激發(fā)校園新活力（黨建引領(lǐng)小學(xué)高質(zhì)量發(fā)展）

學(xué)校藝術(shù)團(tuán)參加天橋區(qū)慶祝教師節(jié)大會。 “奮進(jìn)之筆書先鋒”是濟(jì)南市天橋區(qū)實驗小學(xué)黨支部打造黨建品牌的核心理念，也是學(xué)校共繪立德樹人同心圓的主旨內(nèi)涵。多年來，學(xué)校黨支部緊緊圍繞天橋區(qū)“…

科研百科 2023年6月25日
186 0
工程管理小程序(小型工程管理系統(tǒng))

小型工程管理系統(tǒng) 隨著建筑行業(yè)的不斷發(fā)展，小型工程管理系統(tǒng)的需求也在不斷增加。這些系統(tǒng)可以幫助建筑公司更好地管理工程業(yè)務(wù)，提高效率和準(zhǔn)確性。本文將介紹一種小型工程管理系統(tǒng)的設(shè)計和實…

科研百科 2024年6月6日
60 0
電子政務(wù)政府辦公系統(tǒng)(電子政務(wù)協(xié)同辦公系統(tǒng))

電子政務(wù)協(xié)同辦公系統(tǒng)：提升工作效率，優(yōu)化工作流程隨著數(shù)字化時代的到來，電子政務(wù)協(xié)同辦公系統(tǒng)已經(jīng)成為政府機(jī)構(gòu)數(shù)字化轉(zhuǎn)型的重要組成部分。在這個系統(tǒng)中，政府機(jī)構(gòu)的各部門可以協(xié)作工作，…

科研百科 2024年6月6日
100 0
河南省教育科學(xué)規(guī)劃2022年度專項課題立項名單公布（2021河南省教育科學(xué)規(guī)劃課題立項）

河南省教育廳關(guān)于公布河南省教育科學(xué)規(guī)劃2022年度專項課題立項名單的通知各省轄市、濟(jì)源示范區(qū)、省直管縣（市）教育局，有關(guān)高校，廳直屬單位（中小學(xué)）：根據(jù)《河南省教育廳辦公室關(guān)于…

科研百科 2023年10月6日
185 0
生物與化學(xué)類企業(yè)定制開發(fā)ERP有哪些坑？（erp系統(tǒng)）

由于化學(xué)與生物試劑行業(yè)產(chǎn)品種類多，業(yè)務(wù)流程復(fù)雜。通用ERP往往適用性較差，不少企業(yè)選擇定制開發(fā)管理系統(tǒng)，以適應(yīng)企業(yè)業(yè)務(wù)發(fā)展。筆者為寬爾產(chǎn)品負(fù)責(zé)人，常年從事化學(xué)與生物類管理軟件的開…

科研百科 2022年10月3日
270 0
項目管理服務(wù)平臺(項目項目管理系統(tǒng))

項目項目管理系統(tǒng)項目項目管理系統(tǒng)具體功能介紹1、工程管理工程管理專業(yè)是包含工程管理、工程審計、工程審計、工程管理、工程技術(shù)服務(wù)等方面的工程技術(shù)專業(yè)。工程管理專業(yè)是一種行政管理學(xué)科的…

科研百科 2024年5月19日
110 0

下接萬卡集群、上連AI原生應(yīng)用，操作系統(tǒng)的進(jìn)化超出你的想象（萬卡互聯(lián)是什么）

相關(guān)推薦