jeugpu     Rechercher trouver 4120

 tg2 f2 lin2 in2 Icône X 3 y2  p2 Tik vapeur2

NVIDIA TITAN X

NVIDIA GeForce GTX TITAN X2

Le nouveau TITAN X, qui est devenu le premier appareil basé sur le processeur GP102, se positionnait principalement comme un accélérateur de qualité professionnelle conçu pour la recherche et les applications commerciales liées à l'apprentissage en profondeur.

Ce GPU est conçu comme une alternative au supercalculateur GP100, qui n'est pas inférieur à ce dernier dans les fonctions de rendu graphique 3D et de calculs FP32. Dans le même temps, les créateurs du GP102 ont réduit tous les composants qui ne correspondent pas à l'objectif du produit.

nm.GP102.750

Par exemple, un seul SM (Streaming Multiprocessor - un bloc qui combine des cœurs CUDA avec des unités de mappage de texture, des planificateurs, des répartiteurs et des segments de mémoire locale) dans GP100 contient 64 cœurs CUDA pour les opérations FP32, tandis que SM dans GP102 a à cet égard la configuration héritée de Maxwell : 128 cœurs CUDA. La répartition plus fine des cœurs CUDA dans le GP100 permet au processeur d'exécuter simultanément plus de flux d'instructions (et également des groupes de threads - warps - et des blocs warp), et la quantité totale de types de stockage à l'intérieur du SM, comme la mémoire partagée (mémoire partagée) et le fichier de registre, en termes de l'ensemble du GPU a augmenté par rapport à l'architecture Maxwell.

De plus, dans GP100, pour 64 cœurs CUDA pour les opérations FP32, il y a 32 cœurs pour FP64, tandis que le SM dans GP102 a une configuration héritée de Maxwell à cet égard : 128 cœurs CUDA pour FP32 et 4 pour FP64. D'où les performances tronquées en double précision du GP102.
Enfin, le GP100 embarque un cache L4096 plus important : 3072 Ko contre 102 Ko dans le GP102. Et bien sûr, le GP2 n'a pas de contrôleur de bus NVLINK, et les contrôleurs de mémoire HBM4096 (avec une largeur de bus totale de 5 bits) sont remplacés par des contrôleurs SDRAM GDDR12X. 32 de ces contrôleurs 384 bits fournissent un bus d'accès mémoire XNUMX bits commun.


La puce GP102, fabriquée à l'aide de la technologie de processus FinFET 16 nm de TSMC, contient 12 milliards de transistors dans une zone de 471 mm2. A titre de comparaison : les caractéristiques du GP100 sont de 15,3 milliards de transistors et 610 mm2. C'est une différence très importante. De plus, si TSMC n'a pas augmenté la taille du photomasque pour le processus 16 nm par rapport à 28 nm, alors le GP100 est presque épuisé, tandis que l'architecture légère du GP102 permettra à NVIDIA de créer un noyau plus grand pour le large marché de consommation dans le futur, en utilisant la même chaîne de production (ce qui, cependant, est peu probable à moins que les développeurs ne repensent leurs normes TDP pour les modèles haut de gamme).

Spécifications NVIDIA TITAN X

 Date de sortie  Août 2 2016 ans
 Prix ​​de départ, $  1200

Chip

 Modèle de processeur graphique 16 nm GP102-400
 Cœurs : TMU : ROP 3584: 224: 96

Des fréquences

 Fréquence GPU (boost), MHz 1431 (1531)
 Fréquence mémoire (effective), MHz 1251 (10008)
 Performances FP32, GFLOPS 10,257

Mémoire

 Taille de la mémoire vidéo, Mo  12288
 Bus mémoire, peu  384
 Bande passante mémoire, Go/s  480

Interface et TDP

 Interface PCI-Express  3.0 x16
 TDP. Mar 250

Le processeur graphique de la nouveauté fonctionne à des fréquences plus élevées (1417/1531 MHz) que dans le Tesla P100 (jusqu'à 1328/1480 MHz dans la version supercalculateur et jusqu'à 1300 MHz dans le facteur de forme de la carte PCI-Express). Reste que les fréquences du "Titan" sont assez conservatrices par rapport aux caractéristiques de la GeForce GTX 1080 (1607/1733 MHz). Comme nous le verrons dans les expériences d'overclocking, le facteur limitant était la consommation d'énergie de l'appareil, que NVIDIA a fixée à ses 250 W habituels. NVIDIA Titan X dispose de 3.584 XNUMX processeurs de flux.

Le TITAN X est équipé d'une mémoire SDRAM GDDR12X de 5 Go avec une bande passante de 10 Gbit/s par broche. Le bus 384 bits permet un transfert de données à une vitesse de 480 Go / s: dans cet indicateur, TITAN X n'est que légèrement inférieur au détenteur actuel du record - Radeon R9 Fury X, ainsi qu'à d'autres produits AMD basés sur des GPU Fidji (512 Go/s).

Commentaires (0)