Hirdetés
. Hirdetés

NVIDIA GTC 2025 - Érvelő intelligencia az AI gyárból

|

Blackwell grafikus processzorának új nemzedékével nyit utat a még összetettebb kérdéseket pontosabban megválaszoló mesterséges intelligencia, az érvelő AI előtt, jelentette be az NVIDIA. A gyártó éves konferenciáján debütált a következtetést gyorsító, nyílt forráskódú Dynamo inferencia szoftver, valamint az infrastruktúra késleltetését csökkentő Spectrum-X hálózati megoldás is.

Hirdetés

Cikkünk a ComputerTrends NETWORKSHOP 2025 különszámában jelent meg >>>

A kaliforniai San Joséban márciusban megtartott GTC 2025 konferenciáján mutatta be az NVIDIA Blackwell Ultra grafikus processzorát, amely minden eddiginél nagyobb teljesítményével nemcsak az AI modellek elő- és utótanítását emeli új szintre, hanem a test-time scaling néven ismert technika alkalmazását is elősegíti. A vállalatok ezzel a technikával a tanítás szakaszát követően, a következtetések számítása közben is javíthatják AI modelljeik teljesítményét, a kapott válaszok pontosságát, így szélesebb körben, könnyebben és gyorsabban építhetnek majd érvelő, ügynöki és fizikai mesterséges intelligenciára épülő alkalmazásokat.

Az egy évvel ezelőtt bejelentett, úttörő Blackwell mikroarchitektúrára épülő Blackwell Ultrával egy időben mutatkozott be az NVIDIA GB300 NVL72 teljesen vízhűtött, rack-szekrény formátumú megoldása, valamint az NVIDIA HGX B300 NVL16 rendszer is. A GB300 NVL72 másfélszer nagyobb AI teljesítményt nyújt, mint GB200-as elődje, míg maga a Blackwell architektúra - a korábbi NVIDIA Hopper platformmal összevetve - ötvenszer nagyobb bevételi lehetőséget ígér az AI gyáraknak, hangzott el a konferencián. AI gyárak alatt az NVIDIA a különösen nagy számítási erőforrásokat igénylő ügynöki, generatív és fizikai mesterséges intelligenciára, ilyen típusú AI munkaterhelések futtatására tervezett és épített infrastruktúrát érti.

- Fejlődésében hatalmasat lépett előre a mesterséges intelligencia, az érvelő és az ügynöki AI immár nagyságrendekkel nagyobb számítási teljesítményt igényel - mondta nyitó előadásában Jensen Huang, az NVIDIA alapító vezérigazgatója. - A Blackwell Ultrát pontosan erre terveztük, egyetlen, sokoldalú platformként az AI modellek elő- és utótanítását, valamint következtetését és érvelését egyaránt könnyen és hatékonyan támogatja.

Az AI munkaterhelések növekvő mérete és összetettsége világszerte kihat a beruházásokra, átalakítja az adatközpontokat, mutatott rá a vezérigazgató. Az NVIDIA ezért a továbbikban is évente új GPU-kkal és CPU-kkal, valamint olyan gyorsító platformokkal fogja segíteni a modern, nagy teljesítményű és hatékony AI infrastruktúra építését, mint a jövő év második felében várható Vera Rubin architektúra.

GTC 2025: Jensen Huang, az NVIDIA alapító vezérigazgatójának nyitó előadása

Ügynöki és fizikai AI a Blackwell Ultra erejével

A GB300 NVL72 összesen 72 darab Blackwell Ultra GPU-t, valamint 36 darab Arm Neoverse-alapú NVIDIA Grace CPU-t kapcsol össze egy rack-formátumú megoldásban, amely a test-time scaling számára épített, egyetlen masszív grafikus processzorként működik, mondta a gyártó. A platform minden eddiginél nagyobb teljesítményének köszönhetően az AI modellek a problémák több, lehetséges megoldását is feltárhatják, az összetett kérdések megválaszolását pedig több lépésre bonthatják, ami jobb minőségű kimenetelt eredményez.

Várható, hogy a GB300 NVL72 az NVIDIA DGX Cloud részeként a legnagyobb szolgáltatók felhőiben is elérhető lesz, hogy teljesen menedzselt AI platformként szoftveresen optimalizált teljesítménnyel, szolgáltatásokkal és szakértelemmel segítse a munkaterhelések bevezetését és futtatását. A GB300 NVL72-re és a DGX GB300 rendszerekre épülő NVIDIA DGX SuperPOD integrált megoldást pedig a vállalatok gyorsan és egyszerűen, kulcsrakész AI gyárként vehetik használatba.

Az NVIDIA HGX B300 NVL16 számítási teljesítménye hétszer, memóriakapacitása pedig négyszer nagyobb, mint a Hopper platformé, így a nagy nyelvi modelleket az eddiginél 11-szer gyorsabb következtetésekhez segíti, és az olyan komplex munkaterhelések futtatásában is átütő teljesítményt ér el, mint az AI érvelés.

Képességeivel a Blackwell Ultra platform emellett olyan alkalmazásokban is ki fog tűnni, mint az ügynöki és a fizikai mesterséges intelligencia. Az ügynöki AI túlmutat az utasítások puszta követésén, kifinomult érvelő algoritmusaival az összetett, több lépésből álló problémákat is önállóan megoldja, és a lépéseket is megtervezi, illetve megteszi, amelyek a kijelölt cél eléréséhez vezetnek. A fizikai AI segítségével pedig a vállalatok szintetikus világokat, fotorealisztikus videókat generálhatnak valós időben a robotok és az önvezérlő járművek gyorsabb tanításához (lásd az utolsó alcímnél).

Hirdetés

Az AI infrastruktúra nélkülözhetetlen eleme a fejlett megoldásokra épülő, horizontálisan bővíthető (scale-out) hálózat, amely csökkenti a késleltetést, és elejét veszi a torlódás kialakulásának. A Blackwell Ultra alapú rendszerek zökkenőmenetesen integráltak az NVIDIA Spectrum-X Ethernet és Quantum-X800 InfiniBand platformokkal, amelyek az NVIDIA ConnectX-8 SuperNIC révén minden egyes GPU számára másodpercenként 800 gigabites adatátviteli sebességet biztosítanak. Teljesítményük olyan képességeket ad a távoli memória közvetlen eléréséhez, amelyekkel az érvelő AI modelleket kezelő AI gyárak és felhőadatközpontok megszüntethetik a szűk keresztmetszeteket.

További újdonság, hogy a - szintén a Blackwell Ultra rendszerek részét képező - NVIDIA BlueField-3 adatfeldolgozó egységek (DPU-k) mostantól támogatják a multi-tenant hálózati kialakítást, az elasztikus GPU-alapú feldolgozást, a gyorsított adatelérést és a kiberfenyegetések valós idejű észlelését.

A Blackwell Ultra-alapú termékek várhatóan 2025 második felétől kezdve jelennek majd meg az NVIDIA-partnerek - nagy szervergyártók és felhőszolgáltatók - kínálatában.

Az inferencia dinamója

A teljes Blackwell termékportfóliót az NVIDIA AI platform támogatja, amelynek új eleme, az NVIDIA Dynamo nyílt forráskódú inferencia-keretrendszer szintén a konferencián mutatkozott be. A Dynamo az átviteli sebesség ugrásszerű növelésével és a válaszidő, valamint a költségek csökkentésével az érvelő AI szolgáltatások skálázását segíti, így a scaling test-time technika alkalmazásához is a leghatékonyabb választás lehet a vállalatok számára, mondta a gyártó.

Új szoftvermegoldásként a Dynamo az AI gyárak akár sok ezer grafikus processzorán is összehangolja (orkesztrálja) és felgyorsítja a következtetések számítását, továbbá szétbontja a kiszolgálást, azaz nagy nyelvi modellek futtatásakor a számítás és a generálás szakaszait külön GPU-k között osztja el. A megoldás ezzel lehetővé teszi, hogy a felhasználók minden szakaszt specifikus igények szerint külön optimalizáljanak, és biztosítja a hardver-erőforrások legteljesebb kihasználását.

A Blackwell Ultra premierje a konferencián

Blackwell-alapú rendszereiken futtathatják a vállalatok a szintén új NVIDIA Llama Nemotron Reason modelleket, valamint az AI ügynökök fejlesztésére és összekapcsolására szolgáló NVIDIA AI-Q Blueprint szoftvert is. Mindkettőt az NVIDIA AI Enterprise platformja támogatja, amely az NVIDIA NIM mikroszolgáltatásokat, valamint a gyártó AI keretrendszereit, könyvtárait és eszközeit is tartalmazza - a vállalatok ezeket a megoldásokat a felhőben, adatközpontokban és munkaállomásokon is telepíthetik.

Gyorsan tanuló humanoid robotok

Konferenciáján az NVIDIA olyan technológiák portfólióját is bejelentette, amellyel a humanoid robotok fejlesztését gyorsítaná fel. Az újdonságok közül kiemelkedik az Isaac GR00T N1, a világ első nyílt, teljesen testre szabható alapmodellje, amellyel a humanoid robotok általános érvelő és más, feladatvégző képességekkel ruházhatók fel, valamint az Isaac GR00T Blueprint, amellyel szintetikus adatok generálhatók.

A már elérhető GR00T N1 a testre szabható modellek közül az első, amelyeket az NVIDIA a jövőben előtanít, és a robotfejlesztők rendelkezésére bocsát, hogy felgyorsítsa a munkaerő-hiánnyal küzdő iparágak átalakítását. Az első modell olyan általános képességekkel érkezik, mint a tárgyak megfogása és mozgatása egy vagy két karral, átadásuk egyik kézből a másikba, illetve mindezen képességek kombinálása összetettebb munkafolyamatok elvégzéséhez, például anyagmozgatás, csomagolás vagy termékek ellenőrzése során.

Speciális feladatokat végző humanoid robotokhoz a fejlesztők valós vagy szintetikus adatokkal is továbbtaníthatják a GR00T N1 modellt. A testre szabáshoz nagy, szerteágazó és kiváló minőségű adatkészletekre lesz szükségük, amelyek összeállítása azonban - valós, emberi demonstrációk megragadásával legalábbis - időigényes és költséges folyamat.

Az NVIDIA Omniverse platformjára és Cosmos Transfer alapmodelljére épülő Isaac GR00T Blueprint ezt a problémát orvosolja. Segítségével a fejlesztők kevés emberi demonstráció adataiból is a mozdulatokat leíró szintetikus adatok nagy, exponenciálisan növekvő mennyiségét állíthatják elő. A megoldással az NVIDIA mindössze 11 óra alatt 780 ezer mozgáspályát generált - ennek előállítása emberi demonstrációk útján 6500 órába, vagyis kilenc hónapba telt volna. A szintetikus adatok hozzáadásával a GR00T N1 modell 40 százalékkal felülmúlta korábbi teljesítményét, amelyet kizárólag valós adatokon tanulva ért el.

A fejlesztők GR00T N1 tanításához használt adatokat és a feladatvégzés kiértékelésének forgatókönyveit letölthetik a Hugging Face és a GitHub honlapjáról. Az Isaac GR00T Blueprint interaktív demója a build.nvidia.com címen érhető el, illetve letölthető a GitHub oldaláról.

Hirdetés
0 mp. múlva automatikusan bezár Tovább az oldalra »

Úgy tűnik, AdBlockert használsz, amivel megakadályozod a reklámok megjelenítését. Amennyiben szeretnéd támogatni a munkánkat, kérjük add hozzá az oldalt a kivételek listájához, vagy támogass minket közvetlenül! További információért kattints!

Engedélyezi, hogy a https://www.computertrends.hu értesítéseket küldjön Önnek a kiemelt hírekről? Az értesítések bármikor kikapcsolhatók a böngésző beállításaiban.