arzh-CNenfrdejakoplptesuk
Rechercher trouver 4120  discussion sociale  tg2 f2 lin2 in2 Icône X 3 y2  p2 Tik vapeur2

La carte graphique Nvidia GB300 NVL72 affiche un gain de performances record : +45 % par rapport à DeepSeek R1 par rapport à la GB200

Nvidia publie officiellement les résultats du benchmark MLPerf pour son nouveau système rackable Blackwell Ultra GB300 NVL72, indiquant Augmentation de 45 % de la productivité en inférence DeepSeek R1 par rapport à la génération précédente GB200Le système combine une architecture mise à jour, des unités de tenseur accélérées et un certain nombre d'optimisations au niveau logiciel, ce qui a permis à Nvidia de prendre première place dans tous les tests clés, y compris Llama 3.1 405B, Llama 3.1 8B et Whisper.

Blackwell Ultra GB300

Dans le contexte de Déploiements GB200 dans les centres de données mondiaux, nouvelle version GB300 avec l'architecture Blackwell Ultra va plus loin en offrant une bande passante considérablement accrue entre GPU - 130 To/s à travers NVLink 1,8 To/s entre chacun des 72 systèmes graphiques du rack. Cela a permis de mettre à l'échelle efficacement même les modèles de langage les plus volumineux tout en maintenant une latence stable à des volumes de traitement élevés.

Les éléments clés de la croissance ont été cœurs de tenseurs mis à jourfournissant Opérations d'attention 2 fois plus rapides et 50 % de FLOPS en plus pour les tâches d'IA, ainsi que l'utilisation active du format NVFP4 pour la quantification des poids. Cela a permis réduire le volume du modèle sans perte de précision et accélérer les calculs, en particulier dans les tâches d'inférence sur DeepSeek R1.

Selon Nvidia, ces améliorations peuvent rendre Blackwell Ultra l'outil principal dans la construction de ce qu'on appelle « Usines d'IA », où l'optimisation de la puissance impacte directement la rentabilité du traitement. Selon leurs déclarations, Le GB300 est capable de fonctionner 5 fois plus vite que les accélérateurs Hopper, ce qui est particulièrement pertinent dans le contexte des solutions concurrentes d'AMD et de Huawei, qui affichent également une croissance dans le segment des accélérateurs d'IA.

Étant donné que Les livraisons du GB300 débuteront ce mois-ci, la publication de résultats MLPerf record semble faire partie de la campagne stratégique de Nvidia pour renforcer son leadership dans les solutions d'IA d'entreprise.