作者 | ZeR0
編輯 | 漠影
芯東西11月9日報道,今日,人工智能及高性能計算頂級技術(shù)盛會NVIDIA GTC大會如約而至。
這個市值已高達(dá)7700億美元的AI頂級玩家,剛剛推出全球最小、功能強(qiáng)大、能效最高的下一代AI超級計算機(jī)NVIDIA Jetson AGX Orin,其算力達(dá)到200TOPS,可與內(nèi)置GPU的服務(wù)器媲美。
在下午的虛擬主題演講中,NVIDIA創(chuàng)始人兼CEO黃仁勛穿著熟悉的皮衣,公布了一系列最新AI技術(shù)和產(chǎn)品,并推出承載著其“元宇宙”愿景的全新虛擬化身平臺。
由這個平臺生成的“迷你玩具版黃仁勛”Toy-Me,能與人自然地問答交流。
在幫助企業(yè)降低AI開發(fā)部署門檻方面,NVIDIA可以說是做到了極致,比如提供方便企業(yè)構(gòu)建AI大模型的框架,以及定制專屬聲音的虛擬助手。
黃仁勛說,NVIDIA開發(fā)者數(shù)量已接近300萬,CUDA過去15年下載量達(dá)3000萬次,一年下載量達(dá)到700萬。
此外,NVIDIA繼續(xù)表露對醫(yī)療健康領(lǐng)域的熱情,推出搭載新一代Orin芯片、無縫連接醫(yī)療設(shè)備和邊緣服務(wù)器的AI計算平臺Clara Holoscan。
黃仁勛還宣布,NVIDIA將構(gòu)建一個數(shù)字孿生模型來模擬和預(yù)測氣候變化,數(shù)字孿生將名為E-2,即Earth Two,地球的數(shù)字孿生,能夠在虛擬世界模擬引擎Omniverse中以Million-X百萬倍的速度運(yùn)行。
一、Jetson AGX Orin:手掌大小,算力堪比服務(wù)器
自2014年推出Jetson TK1至今,NVIDIA Jetson系列已經(jīng)積累了85萬名開發(fā)者。
今日,NVIDIA推出全球最小、功能強(qiáng)大、能效最高的新一代AI超級計算機(jī)NVIDIA Jetson AGX Orin,用于機(jī)器人、自主機(jī)器、醫(yī)療器械和其他形式的邊緣嵌入式計算。
Jetson AGX Orin保持了與前代機(jī)型Jetson AGX Xavier相同的外形尺寸和引腳兼容性,處理能力提升6倍,每秒算力達(dá)200TOPS,可與內(nèi)置GPU的服務(wù)器相媲美,而尺寸只有手掌那么大。
它采用NVIDIA Ampere架構(gòu)GPU、Arm Cortex-A78AE CPU以及新一代深度學(xué)習(xí)和視覺加速器。高速接口、更快的存儲帶寬和對多模態(tài)傳感器的支持,為多個并行AI應(yīng)用流水線輸送數(shù)據(jù)。
與歷代Jetson計算機(jī)一樣,使用Jetson AGX Orin的客戶可以運(yùn)用NVIDIA CUDA-X加速計算棧、NVIDIA JetPack SDK和最新NVIDIA工具進(jìn)行應(yīng)用開發(fā)和優(yōu)化,包括云原生開發(fā)工作流程。
來自NVIDIA NGC目錄的預(yù)訓(xùn)練模型已經(jīng)過優(yōu)化,并可以使用NVIDIA TAO工具套件和客戶數(shù)據(jù)集進(jìn)行微調(diào)。這減少了生產(chǎn)級AI的部署時間和成本,而云原生技術(shù)實現(xiàn)了產(chǎn)品整個生命周期內(nèi)的無縫更新。
DRIVE AGX Orin同樣由Jetson AGX Orin等 NVIDIA Ampere架構(gòu)提供支持,它是新發(fā)布的NVIDIA DRIVE Concierge和DRIVE Chauffeur背后的先進(jìn)處理器,這兩個AI平臺分別為安全的自動駕駛提供動力。
針對特定用例的軟件框架包括用于機(jī)器人技術(shù)的NVIDIA Isaac Sim,用于自動駕駛的NVIDIA DRIVE,用于智慧城市的NVIDIA Metropolis。最新的Isaac版本包括對機(jī)器人操作系統(tǒng)(ROS)開發(fā)人員社區(qū)的重要支持。
NVIDIA還發(fā)布了用于Isaac Sim的全新NVIDIA Omniverse Replicator,用于為機(jī)器人生成合成訓(xùn)練數(shù)據(jù)。這些硬件加速軟件包使ROS開發(fā)者更容易在Jetson平臺上構(gòu)建高性能AI機(jī)器人。
NVIDIA Jetson AGX Orin模塊和開發(fā)者工具包將于2022年第一季度上市。
黃仁勛還在演講中談道:“到2024年,絕大多數(shù)新款電動汽車將具備強(qiáng)大的自動駕駛能力?!?/p>
他展示了一個新自動駕駛平臺DRIVE Hyperion 8 GA,這是2024年模型的架構(gòu)。其傳感器套件包含12個攝像頭、9個毫米波雷達(dá)、12個超聲波雷達(dá)和1個前向激光雷達(dá),所有這些都由2顆NVIDIA DRIVE Orin芯片來進(jìn)行處理。
據(jù)他透露,目前,英偉達(dá)已經(jīng)在全球各地收集到了PB級的道路數(shù)據(jù),并擁有大約3000名訓(xùn)練有素的標(biāo)記員,創(chuàng)建訓(xùn)練數(shù)據(jù)。盡管如此,合成數(shù)據(jù)仍是NVIDIA數(shù)據(jù)策略的基石。
二、NeMo Megatron:讓企業(yè)開發(fā)自己的大模型
為了方便企業(yè)開發(fā)部署大型語言模型,NVIDIA推出了為訓(xùn)練具有數(shù)萬億參數(shù)的語言模型而優(yōu)化的加速框架NeMo Megatron。
NVIDIA NeMo Megatron是Megatron的基礎(chǔ)上發(fā)展起來的。Megatron是由NVIDIA研究人員主導(dǎo)的開源項目,研究大型Transformer語言模型的高效訓(xùn)練。Megatron 530B是全球最大的可定制語言模型。
利用先進(jìn)的數(shù)據(jù)、張量和管道并行化技術(shù),它能使大型語言模型的訓(xùn)練有效地分布在成千上萬的GPU上。
企業(yè)可以通過NeMo Megatron框架,進(jìn)一步訓(xùn)練它以服務(wù)新的領(lǐng)域和語言。經(jīng)優(yōu)化,該框架可以在NVIDIA DGX SuperPOD的大規(guī)模加速計算基礎(chǔ)設(shè)施上進(jìn)行擴(kuò)展。
除了NeMo Megatron外,NVIDIA還推出了一個開發(fā)Physics-ML模型的框架NVIDIA Modulus。
它使用物理原理及源自原理型物理和觀測結(jié)果的數(shù)據(jù)訓(xùn)練Physics-ML模型,支持多GPU多節(jié)點(diǎn)訓(xùn)練,由此生成的模型,其物理仿真速度比模擬快1000-100,000倍。
科學(xué)家可借助Modulus創(chuàng)建數(shù)字孿生模型,來解決預(yù)測氣候變化等重要科學(xué)問題。
例如研究人員利用歐洲中期天氣預(yù)報中心的ERA5大氣數(shù)據(jù)訓(xùn)練Physics-ML模型,該模型在128個A100 GPU上訓(xùn)練需要4小時,訓(xùn)練后的模型能以30公里的空間分辨率預(yù)測颶風(fēng)嚴(yán)重程度和路徑。
原本需要7天才能完成的預(yù)測,現(xiàn)在在一個GPU上只需0.25秒,比模擬快了10萬倍。
為了幫助企業(yè)加快AI之旅,NVIDIA宣布在全球范圍內(nèi)擴(kuò)展其LaunchPad計劃,它允許用戶即時訪問在加速基礎(chǔ)設(shè)施上運(yùn)行的NVIDIA AI軟件。企業(yè)可使用NVIDIA LaunchPad免費(fèi)體驗開發(fā)和部署大型語言模型。
LaunchPad計劃由Equinix服務(wù)支持,包括數(shù)據(jù)中心、連接和裸金屬產(chǎn)品,獲得LaunchPad體驗后,企業(yè)可以在全球Equinix地點(diǎn)運(yùn)行其NVIDIA加速的人工智能工作負(fù)載。
三、Riva定制語音:快速創(chuàng)建定制版品牌聲音
NVIDIA的Riva語音AI軟件同樣有了新進(jìn)展,黃仁勛宣布了該軟件一個新功能——Riva定制語音。
Riva可識別英語、西班牙語、德語、法語、日語、普通話和俄語等7種語言,可以生成隱藏字幕、翻譯、摘要、回答問題并理解意圖。
只需訓(xùn)練30分鐘的音頻數(shù)據(jù),企業(yè)即可構(gòu)建屬于自己品牌大使的聲音,獲得類似人類的表現(xiàn)力。
也就是說,用戶根據(jù)特定的領(lǐng)域或行業(yè)術(shù)語,可以量身定制擁有獨(dú)特聲音的虛擬助理。
不到三年間,NVIDIA的對話AI軟件已被下載超過25萬次,并被廣泛采用到各個行業(yè)。
對于小規(guī)模研發(fā),NVIDIA NGC容器注冊表免費(fèi)提供NVIDIA Riva,開發(fā)者可加入Riva開放測試版程序來試用該軟件。
對于擁有大規(guī)模部署并尋求NVIDIA專家技術(shù)支持的客戶,NVIDIA宣布了NVIDIA Riva Enterprise計劃,該計劃預(yù)計將于明年初推出。
四、Omniverse Avatar:構(gòu)建生動的智能虛擬化身
虛擬助手的下一步,是擁有常識、推理能力和生動的視覺形象。
在GTC大會上,黃仁勛宣布推出一個全方位的虛擬化身平臺——Omniverse Avatar。
它是NVIDIA一系列先進(jìn)AI技術(shù)的集大成者,將Metropolis的感知能力、Riva的語音識別能力、Merlin的推薦能力、Omniverse的動畫渲染能力等交匯于一體。
這使得開發(fā)者能構(gòu)建出一個完全交互式的虛擬化身,它足夠生動,能對語音和面部提示做出反應(yīng),能理解多種語言,能給出智能的建議。
黃仁勛展示了一些例子。
比如,其玩偶復(fù)制品可以跟人對答如流。
Metropolis工程師用Maxine創(chuàng)建了Tokkio智能操作臺應(yīng)用程序,讓操作臺具有高度交互性,可快速做出對話響應(yīng)。
在餐廳,兩名顧客點(diǎn)餐時,一個客戶服務(wù)虛擬化身可以跟他們交談和理解他們的需求。
這些演示由NVIDIA AI軟件和Megatron 530B提供支持,Megatron 530B是目前世界上最大的可定制語言模型。
在DRIVE Concierge AI平臺的演示中,中央儀表板屏幕上的數(shù)字助理,可幫助司機(jī)選擇最佳駕駛模式,使其按時到達(dá)目的地,然后在汽車?yán)m(xù)航里程下降到100英里以下時,按他的請求設(shè)置提醒。
Maxine項目更強(qiáng)調(diào)多種語言的實時翻譯和轉(zhuǎn)錄。
借助Maxine,這個人的話不僅被轉(zhuǎn)錄,還能以相同的聲音和語調(diào)被實時轉(zhuǎn)換成德語、法語等多種語言。
Maxine使用計算機(jī)視覺來追蹤人的面部,并識別其表情,3D動畫可為其制作虛擬而逼真的頭像。
可以想象,在企業(yè)和開發(fā)人員中,每個行業(yè)都需要某種形式的虛擬化身。
使用Omniverse Avatar平臺,你可以為視頻會議和協(xié)作平臺、客戶支持平臺、內(nèi)容創(chuàng)建、應(yīng)用收益和數(shù)字孿生、機(jī)器人應(yīng)用等等構(gòu)建定制的AI助理。
NVIDIA的虛擬世界模擬Omniverse是打造虛擬世界的關(guān)鍵平臺。從機(jī)器人、自動駕駛車隊、倉庫、工業(yè)廠房到整個城市,都能在Omniverse數(shù)字孿生中完成創(chuàng)建、訓(xùn)練和運(yùn)行。
黃仁勛說,Omniverse面向數(shù)據(jù)中心規(guī)模設(shè)計,有朝一日有望能達(dá)到全球數(shù)據(jù)規(guī)模。
愛立信正構(gòu)建整個城市的數(shù)字孿生環(huán)境,幫助確定如何放置和配置每個站點(diǎn)以獲得最佳覆蓋范圍和網(wǎng)絡(luò)性能,可對整個5G網(wǎng)絡(luò)執(zhí)行逼真遠(yuǎn)程仿真。
五:AI推理:Triton推理服務(wù)器助力實時大模型推理
目前微軟、三星、Snap等25000多家客戶都在使用NVIDIA的AI推理平臺。
今日,NVIDIA推出多節(jié)點(diǎn)分布式推理功能的NVIDIA Triton推理服務(wù)器,以及NVIDIA A2 Tensor Core GPU加速器。
NVIDIA A2 GPU是一個入門級、低功耗的緊湊型加速器,適用于邊緣服務(wù)器中的推理和邊緣AI,推理性能比CPU高出20倍。
NVIDIA AI推理平臺此次更新包括開源NVIDIA Triton推理服務(wù)器軟件的新功能,和對NVIDIA TensorRT的更新。
最新NVIDIA Triton推理服務(wù)器中的多GPU、多節(jié)點(diǎn)特性,使大型語言模型推理工作負(fù)載能夠?qū)崟r在多個GPU和節(jié)點(diǎn)上擴(kuò)展。
借助Triton推理服務(wù)器,Megatron 530B能在兩個NVIDIA DGX系統(tǒng)上運(yùn)行,將處理時間從CPU服務(wù)器上的1分鐘以上縮短到0.5秒,令實時部署部署大型語言模型成為可能。
在軟件優(yōu)化上,Triton推理服務(wù)器的模型分析器,新工具可以自動化地從數(shù)百種組合中為AI模型選擇最佳配置,以實現(xiàn)最優(yōu)性能,同時確保應(yīng)用程序所需的服務(wù)質(zhì)量。
RAPIDS FIL是針對隨機(jī)森林和梯度提升決策樹模型GPU或CPU推理的新后端,為開發(fā)者使用Triton進(jìn)行深度學(xué)習(xí)和傳統(tǒng)機(jī)器學(xué)習(xí)提供了一個統(tǒng)一的部署引擎。
Triton與AWS、阿里云等平臺集成,并支持在各代GPU、x86 CPU和Arm CPU上優(yōu)化AI推理工作負(fù)載。NVIDIA AI Enterprise也集成了Triton。
NVIDIA AI Enterprise是一款經(jīng)NVIDIA優(yōu)化、認(rèn)證和支持的用于開發(fā)和部署AI的端到端軟件套件,客戶可利用它在本地數(shù)據(jù)中心和私有云的主流服務(wù)器上運(yùn)行AI工作負(fù)載。
NVIDIA旗艦TensorRT推理引擎亦進(jìn)行了更新,已原生集成到TensorFlow和PyTorch中,只需1行代碼,就能提供比框架內(nèi)推理快3倍的性能。
NVIDIA TensorRT 8.2是SDK的最新版本,可實時運(yùn)行數(shù)十億個參數(shù)的語言模型。
NVIDIA還宣布微軟會議軟件Teams采用NVIDIA AI和Azure認(rèn)知服務(wù)。
微軟Azure認(rèn)知服務(wù)為高品質(zhì)AI模型提供基于云的API,以創(chuàng)建智能應(yīng)用程序。他們在用Triton運(yùn)行語音轉(zhuǎn)文本模型,為微軟Teams用戶提供準(zhǔn)確的實時字幕和轉(zhuǎn)錄。
微軟Teams每月有近2.5億活躍用戶,微軟Azure認(rèn)知服務(wù)上的NVIDIA GPU和 Triton推理服務(wù)器使用28種語言和方言,結(jié)合AI模型幫助提升實時字幕和轉(zhuǎn)錄功能的成本效益。
Mavenir宣布由NVIDIA Metropolis AI-on-5G平臺提供支持的MAVedge-AI智能視頻分析,以加速企業(yè)人工智能,該方案預(yù)計2022年初提供給客戶。
六、數(shù)據(jù)中心:全新網(wǎng)絡(luò)安全功能
面向數(shù)據(jù)中心,黃仁勛宣布推出BlueField DOCA 1.2來支持全新網(wǎng)絡(luò)安全功能,希望使BlueField成為業(yè)界構(gòu)建零信任安全平臺的理想之選。
目前有1400名開發(fā)者正在BlueField上進(jìn)行開發(fā),現(xiàn)在采用BlueField的網(wǎng)絡(luò)安全公司已可提供零信任安全即服務(wù)。
NVIDIA還發(fā)明了一個深度學(xué)習(xí)網(wǎng)絡(luò)安全平臺Morpheus來監(jiān)控分析網(wǎng)絡(luò)行為。
它構(gòu)建于NVIDIA RAPIDS和NVIDIA AI之上,其工作流會為每種應(yīng)用和用戶的組合創(chuàng)建AI模型和數(shù)字指紋,并學(xué)習(xí)其日常的模式和尋找異常操作。這些異常操作將觸發(fā)安全警告,并提醒分析員作出響應(yīng)。
Bluefield、DOCA和Morpheus都是數(shù)據(jù)中心的全堆棧加速AI解決方案的一部分。NVIDIA將為其網(wǎng)絡(luò)安全合作伙伴提供一個零信任的安全平臺,從而提高安全性和應(yīng)用程序性能。
Bluefield坐在網(wǎng)絡(luò)上,向Morpheus AI平臺提供數(shù)據(jù)中心發(fā)生的所有活動。Morpheus是一個深度學(xué)習(xí)網(wǎng)絡(luò)安全平臺,可以監(jiān)控和分析來自每個用戶、機(jī)器和服務(wù)的所有信息。
NVIDIA今日也宣布了Morpheus早期訪問2版本。
Morpheus創(chuàng)建了預(yù)訓(xùn)練的用戶活動指紋模型。當(dāng)這些指紋發(fā)生變化時,它能夠?qū)崟r識別出異常交易正在發(fā)生,創(chuàng)建一個可疑行為正在發(fā)生的安全警報,并隔離活動和加以提醒。
七、醫(yī)療健康:合作癌癥中心,推新機(jī)器人平臺
在醫(yī)療健康領(lǐng)域,NVIDIA宣布與多家先進(jìn)癌癥中心合作,將AI的力量帶到癌癥治療。這些癌癥中心將采用NVIDIA DGX來加速開發(fā)AI模型。
許多醫(yī)療設(shè)備公司正在將AI和機(jī)器人技術(shù)融入其中,在機(jī)器人手術(shù)、移動CT掃描、支氣管鏡檢中使用NVIDIA加速計算平臺。
為加速AI醫(yī)療設(shè)備的應(yīng)用,NVIDIA推出一個面向醫(yī)療健康行業(yè)的新計算平臺NVIDIA Clara Holoscan。
Holoscan是繼Isaac和Drive后,NVIDIA的第三個機(jī)器人平臺,能為可擴(kuò)展、軟件定義、端到端流媒體數(shù)據(jù)處理的醫(yī)療設(shè)備提供所需的計算基礎(chǔ)設(shè)施。
該平臺集成了NVIDIA AGX Orin和ConnectX-7,F(xiàn)P32算力達(dá)5.2TFLOPS,AI算力達(dá)250TOPS,740Gbps高速IO用于連接傳感器。
添加RTX A6000 Ampere GPU后,可獲得另外39TFLOPS(FP32)和超過600TOPS的AI推理性能。
Clara Holoscan是一個醫(yī)療設(shè)備與邊緣服務(wù)器無縫連接的端到端平臺,能助力開發(fā)者創(chuàng)建AI微服務(wù),用以在設(shè)備上運(yùn)行低延遲串流應(yīng)用,同時將更復(fù)雜的任務(wù)傳至數(shù)據(jù)中心資源。
借助Clara Holoscan,開發(fā)者可以自定義應(yīng)用,按需在其醫(yī)療設(shè)備中充分添加或減少計算和輸入/輸出功能,從而平衡延遲、成本、空間、性能和帶寬的需求。
Clara Holoscan SDK通過加速庫、AI模型和超聲波、數(shù)字病理學(xué)、內(nèi)窺鏡檢查等參考應(yīng)用支持此項工作,以幫助開發(fā)者利用嵌入式和可擴(kuò)展的混合云計算。
在藥物發(fā)現(xiàn)方面,加拿大AI制藥創(chuàng)企Entos發(fā)明了一種深度學(xué)習(xí)架構(gòu)OrbNet,用物理機(jī)器學(xué)習(xí)方法訓(xùn)練圖神經(jīng)網(wǎng)絡(luò),取代分子模擬中昂貴的原子間作用力,將分子模擬速度提高1000倍。
八、Quantum-2:史上最先進(jìn)端到端網(wǎng)絡(luò)平臺
此次GTC期間,NVIDIA還宣布了下一代NVIDIA Quantum-2平臺,可進(jìn)行云原生超級計算。
該網(wǎng)絡(luò)平臺由NVIDIA Quantum-2交換機(jī)、ConnectX-7網(wǎng)絡(luò)適配器、BlueField-3數(shù)據(jù)處理單元(DPU)和支持新架構(gòu)的所有軟件組成。ConnectX-7將于明年1月問世。
其中,Quantum-2 InfiniBand交換機(jī)基于新的Quantum-2 ASIC,采用臺積電7N節(jié)點(diǎn),包含570個晶體管,超過有540億晶體管的A100。
Quantum-2 InfiniBand擁有400Gbps,網(wǎng)絡(luò)速度翻倍,交換機(jī)吞吐量增加了2倍,集群可擴(kuò)展性增為原來的6.5倍,同時降低了數(shù)據(jù)中心的功耗。
其多租戶性能隔離利用先進(jìn)的基于遙測的擁塞控制系統(tǒng),確??煽康耐掏铝?,無論用戶激增或工作量需求激增,都能確??煽康耐掏铝浚瑥亩乐挂粋€租戶的活動干擾其他租戶的活動。
相比上一代,第三代SHARPv3TM網(wǎng)絡(luò)計算技術(shù)的交換機(jī)計算能力比原來高32倍,用于加速AI訓(xùn)練。
九、新加速庫:優(yōu)化路線規(guī)劃,加速量子模擬
最后,我們來看看NVIDIA推出的3個新加速庫。
首先是NVIDIA ReOpt,這是一款針對運(yùn)籌優(yōu)化問題的加速求解器,可實現(xiàn)實時路線規(guī)劃優(yōu)化。
以與NVIDIA合作的達(dá)美樂披薩為例,配送14個披薩的路徑有870億種,這意味達(dá)美樂要在30分鐘內(nèi)將披薩送達(dá)絕非易事。
運(yùn)籌優(yōu)化對“最后一英里”配送是必需的,路線規(guī)劃是個極為棘手的物流問題,如果應(yīng)用到行業(yè)中,即使是小規(guī)模的路線優(yōu)化也能節(jié)省數(shù)十億美元。
黃仁勛展示了一個用NVIDIA Omniverse虛擬倉庫來展示優(yōu)化路線在自動訂單揀選場景中的影響,優(yōu)化后的規(guī)劃能使訂單揀選節(jié)省一半的時間和路程。
當(dāng)前路線優(yōu)化求解器收到新訂單后,需要數(shù)小時來重新運(yùn)行和響應(yīng),而ReOpt能持續(xù)運(yùn)行并實時動態(tài)地進(jìn)行重新優(yōu)化,在短短幾秒鐘內(nèi)響應(yīng)并擴(kuò)展至數(shù)千個位置。
第二個是cuQuantum DGX設(shè)備,配備有針對量子計算工作流的加速庫,可用態(tài)矢量和張量網(wǎng)絡(luò)的方法來加速量子電路模擬。
谷歌Cirq將成第一個得到加速的量子模擬器。
借助該設(shè)備,曾經(jīng)需要耗費(fèi)幾個月的模擬,現(xiàn)在幾天就能完成。
NVIDIA研究部門在量子算法模擬方面取得了重要里程碑,用1688個量子位為3375個頂點(diǎn)集求解MaxCut問題。
這是有史以來最大的精確量子電路模擬,比以往模擬的量子位多8倍。
cuQuantum DGX設(shè)備將在第一季度推出。
第三個加速庫是在PyData和NumPy生態(tài)系統(tǒng)的大規(guī)模加速計算cuNumeric,它允許用戶用Python代碼在超級計算機(jī)上透明加速和擴(kuò)展NumPy工作流,并無需更改代碼。
它屬于NVIDIA RAPIDS開源Python數(shù)據(jù)科學(xué)套件,RAPIDS今年的下載量超過50萬次,比去年增長了4倍多。NumPy在過去5年下載量達(dá)到了1.22億次,別用于GitHub上近80萬個項目。
在著名的CFD Python教學(xué)代碼中,cuNumeric能擴(kuò)展至1000個GPU,而擴(kuò)展效率僅比線性擴(kuò)展效率損失了20%。
結(jié)語
乘著AI、高性能計算和元宇宙的東風(fēng),NVIDIA今年過得可謂風(fēng)生水起,市值一路扶搖直上,突破7700億美元。其Omniverse平臺更是被分析機(jī)構(gòu)視作NVIDIA一項重要的平臺擴(kuò)張戰(zhàn)略。
在這表面風(fēng)光的背后,NVIDIA的遠(yuǎn)見和前瞻性不容小覷。無論是如火如荼的AI,還是方興未艾的虛擬世界,NVIDIA能成為科技熱潮的直接受益者,都離不開過去多年對其軟硬件產(chǎn)品的打磨。
此次NVIDIA GTC大會期間,我們還將看到更多覆蓋深度學(xué)習(xí)、數(shù)據(jù)科學(xué)、高性能計算、機(jī)器人等領(lǐng)域的最新進(jìn)展,而始于NVIDIA CUDA的加速計算正在這些領(lǐng)域催化效率提升,推動現(xiàn)代科技快速進(jìn)化、走向未來。