老黃數字人登場：英偉達秀“元宇宙”肌肉推巴掌大AI超算和虛擬人平台

今日，人工智能及高性能計算頂級技術盛會NVIDIA
GTC大會如約而至。這個市值已高達7700億美元的AI頂級玩家，剛剛推出全球最小、功能最強大、能效最高的下一代AI超級計算機NVIDIA
Jetson AGX Orin，其算力達到200TOPS，可與內置GPU的服務器媲美。

黃仁勛“手辦”對答如流，英偉達強勢拉開元宇宙序幕，幫企業開發大模型。

在下午的虛擬主題演講中，NVIDIA創始人兼CEO黃仁勛穿着熟悉的皮衣，公布了一系列最新AI技術和產品，並推出承載着其“元宇宙”願景的全新虛擬化身平台。

由這個平台生成的“迷你玩具版黃仁勛”Toy-Me，能與人自然地問答交流。

在幫助企業降低AI開發部署門檻方面，NVIDIA可以說是做到了極致，比如提供方便企業構建AI大模型的框架，以及定製專屬聲音的虛擬助手。

黃仁勛說，NVIDIA開發者數量已接近300萬，CUDA過去15年下載量達3000萬次，一年下載量達到700萬。

此外，NVIDIA繼續表露對醫療健康領域的熱情，推出搭載新一代Orin芯片、無縫連接醫療設備和邊緣服務器的AI計算平台Clara Holoscan。

黃仁勛還宣布，NVIDIA將構建一個數字孿生模型來模擬和預測氣候變化，新的超級計算機將名為E-2，即Earth Two，地球的數字孿生，能夠在虛擬世界模擬引擎Omniverse中以Million-X百萬倍的速度運行。

01.

Jetson AGX Orin：

手掌大小，算力堪比服務器

自2014年推出Jetson TK1至今，NVIDIA Jetson系列已經積累了85萬名開發者。

今日，NVIDIA推出全球最小、功能強大、能效最高的新一代AI超級計算機NVIDIA Jetson AGX Orin，用於機器人、自主機器、醫療器械和其他形式的邊緣嵌入式計算。

Jetson AGX Orin保持了與前代機型Jetson AGX Xavier相同的外形尺寸和引腳兼容性，處理能力提升6倍，每秒算力達200TOPS，可與內置GPU的服務器相媲美，而尺寸只有手掌那麼大。

它採用NVIDIA Ampere架構GPU、Arm Cortex-A78AE CPU以及新一代深度學習和視覺加速器。高速接口、更快的存儲帶寬和對多模態傳感器的支持，為多個并行AI應用流水線輸送數據。

與歷代Jetson計算機一樣，使用Jetson AGX Orin的客戶可以運用NVIDIA CUDA-X加速計算棧、NVIDIA JetPack SDK和最新NVIDIA工具進行應用開發和優化，包括雲原生開發工作流程。

來自NVIDIA NGC目錄的預訓練模型已經過優化，並可以使用NVIDIA TAO工具套件和客戶數據集進行微調。這減少了生產級AI的部署時間和成本，而雲原生技術實現了產品整個生命周期內的無縫更新。

DRIVE AGX Orin同樣由Jetson AGX Orin等 NVIDIA Ampere架構提供支持，它是新發布的NVIDIA DRIVE Concierge和DRIVE Chauffeur背後的先進處理器，這兩個AI平台分別為安全的自動駕駛提供動力。

針對特定用例的軟件框架包括用於機器人技術的NVIDIA Isaac Sim，用於自動駕駛的NVIDIA DRIVE，用於智慧城市的NVIDIA Metropolis。最新的Isaac版本包括對機器人操作系統（ROS）開發人員社區的重要支持。

NVIDIA還發布了用於Isaac Sim的全新NVIDIA Omniverse Replicator，用於為機器人生成合成訓練數據。這些硬件加速軟件包使ROS開發者更容易在Jetson平台上構建高性能AI機器人。

NVIDIA Jetson AGX Orin模塊和開發者工具包將於2022年第一季度上市。

黃仁勛還在演講中談道：“到2024年，絕大多數新款電動汽車將具備強大的自動駕駛能力。”

他展示了一個新自動駕駛平台DRIVE Hyperion 8 GA，這是2024年模型的架構。其傳感器套件包含12個攝像頭、9個毫米波雷達、12個超聲波雷達和1個前向激光雷達，所有這些都由2顆NVIDIA DRIVE Orin芯片來進行處理。

據他透露，目前，英偉達已經在全球各地收集到了PB級的道路數據，並擁有大約3000名訓練有素的標記員，創建訓練數據。儘管如此，合成數據仍是NVIDIA數據策略的基石。

02.

NeMo Megatron：

讓企業開發自己的大模型

為了方便企業開發部署大型語言模型，NVIDIA推出了為訓練具有數萬億參數的語言模型而優化的加速框架NeMo Megatron。

NVIDIA NeMo Megatron是Megatron的基礎上發展起來的。Megatron是由NVIDIA研究人員主導的開源項目，研究大型Transformer語言模型的高效訓練。Megatron 530B是全球最大的可定製語言模型。

利用先進的數據、張量和管道并行化技術，它能使大型語言模型的訓練有效地分佈在成千上萬的GPU上。

企業可以通過NeMo Megatron框架，進一步訓練它以服務新的領域和語言。經優化，該框架可以在NVIDIA DGX SuperPOD的大規模加速計算基礎設施上進行擴展。

除了NeMo Megatron外，NVIDIA還推出了一個開發Physics-ML模型的框架NVIDIA Modulus。

它使用物理原理及源自原理型物理和觀測結果的數據訓練Physics-ML模型，支持多GPU多節點訓練，由此生成的模型，其物理仿真速度比模擬快1000-100,000倍。

科學家可藉助Modulus創建數字孿生模型，來解決預測氣候變化等重要科學問題。

例如研究人員利用歐洲中期天氣預報中心的ERA5大氣數據訓練Physics-ML模型，該模型在128個A100 GPU上訓練需要4小時，訓練后的模型能以30公里的空間分辨率預測颶風嚴重程度和路徑。

原本需要7天才能完成的預測，現在在一個GPU上只需0.25秒，比模擬快了10萬倍。

為了幫助企業加快AI之旅，NVIDIA宣布在全球範圍內擴展其LaunchPad計劃，它允許用戶即時訪問在加速基礎設施上運行的NVIDIA AI軟件。企業可使用NVIDIA LaunchPad免費體驗開發和部署大型語言模型。

LaunchPad計劃由Equinix服務支持，包括數據中心、連接和裸金屬產品，獲得LaunchPad體驗后，企業可以在全球Equinix地點運行其NVIDIA加速的人工智能工作負載。

03.

Riva定製語音：

快速創建定製版品牌聲音

NVIDIA的Riva語音AI軟件同樣有了新進展，黃仁勛宣布了該軟件一個新功能——Riva定製語音。

Riva可識別英語、西班牙語、德語、法語、日語、普通話和俄語等7種語言，可以生成隱藏字幕、翻譯、摘要、回答問題並理解意圖。

只需訓練30分鐘的音頻數據，企業即可構建屬於自己品牌大使的聲音，獲得類似人類的表現力。

也就是說，用戶根據特定的領域或行業術語，可以量身定製擁有獨特聲音的虛擬助理。

不到三年間，NVIDIA的對話AI軟件已被下載超過25萬次，並被廣泛採用到各個行業。

對於小規模研發，NVIDIA NGC容器註冊表免費提供NVIDIA Riva，開發者可加入Riva開放測試版程序來試用該軟件。

對於擁有大規模部署並尋求NVIDIA專家技術支持的客戶，NVIDIA宣布了NVIDIA Riva Enterprise計劃，該計劃預計將於明年初推出。

04.

Omniverse Avatar：

構建生動的智能虛擬化身

虛擬助手的下一步，是擁有常識、推理能力和生動的視覺形象。

在GTC大會上，黃仁勛宣布推出一個全方位的虛擬化身平台——Omniverse Avatar。

它是NVIDIA一系列先進AI技術的集大成者，將Metropolis的感知能力、Riva的語音識別能力、Merlin的推薦能力、Omniverse的動畫渲染能力等交匯於一體。

這使得開發者能構建出一個完全交互式的虛擬化身，它足夠生動，能對語音和面部提示做出反應，能理解多種語言，能給出智能的建議。

黃仁勛展示了一些例子。

比如，其玩偶複製品可以跟人對答如流。

Metropolis工程師用Maxine創建了Tokkio智能操作台應用程序，讓操作台具有高度交互性，可快速做出對話響應。

在餐廳，兩名顧客點餐時，一個客戶服務虛擬化身可以跟他們交談和理解他們的需求。

這些演示由NVIDIA AI軟件和Megatron 530B提供支持，Megatron 530B是目前世界上最大的可定製語言模型。

在DRIVE Concierge AI平台的演示中，中央儀錶板屏幕上的數字助理，可幫助司機選擇最佳駕駛模式，使其按時到達目的地，然後在汽車續航里程下降到100英里以下時，按他的請求設置提醒。

Maxine項目更強調多種語言的實時翻譯和轉錄。

藉助Maxine，這個人的話不僅被轉錄，還能以相同的聲音和語調被實時轉換成德語、法語等多種語言。

Maxine使用計算機視覺來追蹤人的面部，並識別其表情，3D動畫可為其製作虛擬而逼真的頭像。

可以想象，在企業和開發人員中，每個行業都需要某種形式的虛擬化身。

使用Omniverse Avatar平台，你可以為視頻會議和協作平台、客戶支持平台、內容創建、應用收益和數字孿生、機器人應用等等構建定製的AI助理。

NVIDIA的虛擬世界模擬Omniverse是打造虛擬世界的關鍵平台。從機器人、自動駕駛車隊、倉庫、工業廠房到整個城市，都能在Omniverse數字孿生中完成創建、訓練和運行。

黃仁勛說，Omniverse面向數據中心規模設計，有朝一日有望能達到全球數據規模。

愛立信正構建整個城市的數字孿生環境，幫助確定如何放置和配置每個站點以獲得最佳覆蓋範圍和網絡性能，可對整個5G網絡執行逼真遠程仿真。

05.

AI推理：Triton推理

服務器助力實時大模型推理

目前微軟、三星、Snap等25000多家客戶都在使用NVIDIA的AI推理平台。

今日，NVIDIA推出多節點分佈式推理功能的NVIDIA Triton推理服務器，以及NVIDIA A2 Tensor Core GPU加速器。

NVIDIA A2 GPU是一個入門級、低功耗的緊湊型加速器，適用於邊緣服務器中的推理和邊緣AI，推理性能比CPU高出20倍。

NVIDIA AI推理平台此次更新包括開源NVIDIA Triton推理服務器軟件的新功能，和對NVIDIA TensorRT的更新。

最新NVIDIA Triton推理服務器中的多GPU、多節點特性，使大型語言模型推理工作負載能夠實時在多個GPU和節點上擴展。

藉助Triton推理服務器，Megatron 530B能在兩個NVIDIA DGX系統上運行，將處理時間從CPU服務器上的1分鐘以上縮短到0.5秒，令實時部署部署大型語言模型成為可能。

在軟件優化上，Triton推理服務器的模型分析器，新工具可以自動化地從數百種組合中為AI模型選擇最佳配置，以實現最優性能，同時確保應用程序所需的服務質量。

RAPIDS FIL是針對隨機森林和梯度提升決策樹模型GPU或CPU推理的新後端，為開發者使用Triton進行深度學習和傳統機器學習提供了一個統一的部署引擎。

Triton與AWS、阿里雲等平台集成，並支持在各代GPU、x86 CPU和Arm CPU上優化AI推理工作負載。NVIDIA AI Enterprise也集成了Triton。

NVIDIA AI Enterprise是一款經NVIDIA優化、認證和支持的用於開發和部署AI的端到端軟件套件，客戶可利用它在本地數據中心和私有雲的主流服務器上運行AI工作負載。

NVIDIA旗艦TensorRT推理引擎亦進行了更新，已原生集成到TensorFlow和PyTorch中，只需1行代碼，就能提供比框架內推理快3倍的性能。

NVIDIA TensorRT 8.2是SDK的最新版本，可實時運行數十億個參數的語言模型。

NVIDIA還宣布微軟會議軟件Teams採用NVIDIA AI和Azure認知服務。

微軟Azure認知服務為高品質AI模型提供基於雲的API，以創建智能應用程序。他們在用Triton運行語音轉文本模型，為微軟Teams用戶提供準確的實時字幕和轉錄。

微軟Teams每月有近2.5億活躍用戶，微軟Azure認知服務上的NVIDIA GPU和 Triton推理服務器使用28種語言和方言，結合AI模型幫助提升實時字幕和轉錄功能的成本效益。

Mavenir宣布由NVIDIA Metropolis AI-on-5G平台提供支持的MAVedge-AI智能視頻分析，以加速企業人工智能，該方案預計2022年初提供給客戶。

06.

數據中心：全新網絡安全功能

面向數據中心，黃仁勛宣布推出BlueField DOCA 1.2來支持全新網絡安全功能，希望使BlueField成為業界構建零信任安全平台的理想之選。

目前有1400名開發者正在BlueField上進行開發，現在採用BlueField的網絡安全公司已可提供零信任安全即服務。

NVIDIA還發明了一個深度學習網絡安全平台Morpheus來監控分析網絡行為。

它構建於NVIDIA RAPIDS和NVIDIA AI之上，其工作流會為每種應用和用戶的組合創建AI模型和數字指紋，並學習其日常的模式和尋找異常操作。這些異常操作將觸發安全警告，並提醒分析員作出響應。

Bluefield、DOCA和Morpheus都是數據中心的全堆棧加速AI解決方案的一部分。NVIDIA將為其網絡安全合作夥伴提供一個零信任的安全平台，從而提高安全性和應用程序性能。

Bluefield坐在網絡上，向Morpheus AI平台提供數據中心發生的所有活動。Morpheus是一個深度學習網絡安全平台，可以監控和分析來自每個用戶、機器和服務的所有信息。

NVIDIA今日也宣布了Morpheus早期訪問2版本。

Morpheus創建了預訓練的用戶活動指紋模型。當這些指紋發生變化時，它能夠實時識別出異常交易正在發生，創建一個可疑行為正在發生的安全警報，並隔離活動和加以提醒。

07.

醫療健康：合作癌症中心，推新機器人平台

在醫療健康領域，NVIDIA宣布與多家先進癌症中心合作，將AI的力量帶到癌症治療。這些癌症中心將採用NVIDIA DGX來加速開發AI模型。

許多醫療設備公司正在將AI和機器人技術融入其中，在機器人手術、移動CT掃描、支氣管鏡檢中使用NVIDIA加速計算平台。

為加速AI醫療設備的應用，NVIDIA推出一個面向醫療健康行業的新計算平台NVIDIA Clara Holoscan。

Holoscan是繼Isaac和Drive后，NVIDIA的第三個機器人平台，能為可擴展、軟件定義、端到端流媒體數據處理的醫療設備提供所需的計算基礎設施。

該平台集成了NVIDIA AGX Orin和ConnectX-7，FP32算力達5.2TFLOPS，AI算力達250TOPS，740Gbps高速IO用於連接傳感器。

添加RTX A6000 Ampere GPU后，可獲得另外39TFLOPS（FP32）和超過600TOPS的AI推理性能。

Clara Holoscan是一個醫療設備與邊緣服務器無縫連接的端到端平台，能助力開發者創建AI微服務，用以在設備上運行低延遲串流應用，同時將更複雜的任務傳至數據中心資源。

藉助Clara Holoscan，開發者可以自定義應用，按需在其醫療設備中充分添加或減少計算和輸入/輸出功能，從而平衡延遲、成本、空間、性能和帶寬的需求。

Clara Holoscan SDK通過加速庫、AI模型和超聲波、數字病理學、內窺鏡檢查等參考應用支持此項工作，以幫助開發者利用嵌入式和可擴展的混合雲計算。

在藥物發現方面，加拿大AI製藥創企Entos發明了一種深度學習架構OrbNet，用物理機器學習方法訓練圖神經網絡，取代分子模擬中昂貴的原子間作用力，將分子模擬速度提高1000倍。

08.

Quantum-2：史上最先進端到端網絡平台

此次GTC期間，NVIDIA還宣布了下一代NVIDIA Quantum-2平台，可進行雲原生超級計算。

該網絡平台由NVIDIA Quantum-2交換機、ConnectX-7網絡適配器、BlueField-3數據處理單元（DPU）和支持新架構的所有軟件組成。ConnectX-7將於明年1月問世。

其中，Quantum-2 InfiniBand交換機基於新的Quantum-2 ASIC，採用台積電7N節點，包含570個晶體管，超過有540億晶體管的A100。

Quantum-2 InfiniBand擁有400Gbps，網絡速度翻倍，交換機吞吐量增加了2倍，集群可擴展性增為原來的6.5倍，同時降低了數據中心的功耗。

其多租戶性能隔離利用先進的基於遙測的擁塞控制系統，確保可靠的吞吐量，無論用戶激增或工作量需求激增，都能確保可靠的吞吐量，從而防止一個租戶的活動干擾其他租戶的活動。

相比上一代，第三代SHARPv3TM網絡計算技術的交換機計算能力比原來高32倍，用於加速AI訓練。

09.

新加速庫：優化路線規劃，加速量子模擬

最後，我們來看看NVIDIA推出的3個新加速庫。

首先是NVIDIA ReOpt，這是一款針對運籌優化問題的加速求解器，可實現實時路線規劃優化。

以與NVIDIA合作的達美樂披薩為例，配送14個披薩的路徑有870億種，這意味達美樂要在30分鐘內將披薩送達絕非易事。

運籌優化對“最後一英里”配送是必需的，路線規劃是個極為棘手的物流問題，如果應用到行業中，即使是小規模的路線優化也能節省數十億美元。

黃仁勛展示了一個用NVIDIA Omniverse虛擬倉庫來展示優化路線在自動訂單揀選場景中的影響，優化后的規劃能使訂單揀選節省一半的時間和路程。

當前路線優化求解器收到新訂單后，需要數小時來重新運行和響應，而ReOpt能持續運行並實時動態地進行重新優化，在短短几秒鐘內響應並擴展至數千個位置。

第二個是cuQuantum DGX設備，配備有針對量子計算工作流的加速庫，可用態矢量和張量網絡的方法來加速量子電路模擬。

GoogleCirq將成第一個得到加速的量子模擬器。

藉助該設備，曾經需要耗費幾個月的模擬，現在幾天就能完成。

NVIDIA研究部門在量子算法模擬方面取得了重要里程碑，用1688個量子位為3375個頂點集求解MaxCut問題。

這是有史以來最大的精確量子電路模擬，比以往模擬的量子位多8倍。

cuQuantum DGX設備將在第一季度推出。

第三個加速庫是在PyData和NumPy生態系統的大規模加速計算cuNumeric，它允許用戶用Python代碼在超級計算機上透明加速和擴展NumPy工作流，並無需更改代碼。

它屬於NVIDIA RAPIDS開源Python數據科學套件，RAPIDS今年的下載量超過50萬次，比去年增長了4倍多。NumPy在過去5年下載量達到了1.22億次，別用於GitHub上近80萬個項目。

在著名的CFD Python教學代碼中，cuNumeric能擴展至1000個GPU，而擴展效率僅比線性擴展效率損失了20%。

10.

結語

乘着AI、高性能計算和元宇宙的東風，NVIDIA今年過得可謂風生水起，市值一路扶搖直上，突破7700億美元。其Omniverse平台更是被分析機構視作NVIDIA一項重要的平台擴張戰略。

在這表面風光的背後，NVIDIA的遠見和前瞻性不容小覷。無論是如火如荼的AI，還是方興未艾的虛擬世界，NVIDIA能成為科技熱潮的直接受益者，都離不開過去多年對其軟硬件產品的打磨。

此次NVIDIA GTC大會期間，我們還將看到更多覆蓋深度學習、數據科學、高性能計算、機器人等領域的最新進展，而始於NVIDIA CUDA的加速計算正在這些領域催化效率提升，推動現代科技快速進化、走向未來。

老黃數字人登場：英偉達秀“元宇宙”肌肉 推巴掌大AI超算和虛擬人平台

相关推荐

老黃數字人登場：英偉達秀“元宇宙”肌肉推巴掌大AI超算和虛擬人平台