jeugpu     Rechercher trouver 4120

 tg2 f2 lin2 in2 Icône X 3 y2  p2 Tik vapeur2

GeForce GTX 1080

1080

GeForce GTX 1080 - construite sur la base du GPU GP104 - la deuxième puce la plus ancienne de la gamme Pascal. P104 par rapport à P100 représente presque la moitié du nombre de transistors et de la surface de la puce. Si nous partons de la gamme Maxwell, la nouvelle puce occupe une position intermédiaire entre le GM204, que NVIDIA utilise dans les GeForce GTX 970/980, et le GM200 (GeForce GTX 980 Ti et GTX 980 TITAN X) tant en termes de paramètres "physiques" du cristal et le nombre de cœurs CUDA et d'unités de texture. La configuration back-end du GP104 définit sans équivoque sa position de successeur du GM204, car il est également livré avec un bus mémoire 256 bits partagé entre huit contrôleurs et 64 ROP.

sm.gp104.800

Du point de vue de la disposition des unités de calcul GPU, l'architecture Pascal dans l'implémentation GP104 suit exactement les principes énoncés dans Maxwell. Toute la logique de calcul est concentrée dans des structures appelées Graphics Processing Cluster (GPC) - il y en a quatre dans ce processeur. À l'intérieur du GPC se trouvent cinq multiprocesseurs de flux, chacun comprenant 128 cœurs CUDA, 8 modules de texture et une section de cache L1 qui est passée de 24 à 48 Ko par rapport à Maxwell. Chaque GPC comprend également un seul moteur de polymorphe (moteur raster dans le diagramme) qui effectue les étapes de rendu initiales : détection des contours du polygone, projection et élimination des pixels invisibles.

La principale réalisation du processus 16 nm s'exprime ici dans des fréquences d'horloge qui ont presque doublé par rapport à la GeForce GTX 980 : la fréquence de base est de 1607 MHz, la Boost Clock est de 1733 MHz (puisque cette dernière est la fréquence moyenne dans les applications typiques, la GTX 1080 est capable d'accélérer à des valeurs plus élevées.

Les calculs en double précision (FP64) sont effectués par le processeur GP104 à une vitesse de 1/32 du FP32 - en cela, il hérite des puces du deuxième niveau et des niveaux suivants de la famille Maxwell. L'architecture Pascal peut également exécuter des opérations FP16 à deux fois les performances de FP32, tandis que Maxwell les exécute à la même vitesse. En termes de consommation électrique, la GeForce GTX 1080 appartient à la même classe que la GeForce GTX 980 - 180 watts. Sur la base de ces données et des performances déclarées en TFLOPS pour les GTX 980 et GTX 1080, nous obtenons une augmentation de 63% de l'efficacité énergétique de Pascal par rapport à Maxwell. La quantité de RAM est de 8 Go de type GDDR5X - la quantité qui était auparavant l'apanage des cartes graphiques AMD basées sur des GPU Hawaii avec un bus mémoire de 512 bits.

microns gddr5x 575px

L'une des principales différences entre GDDR5X et GDDR5 est la capacité de transmettre quatre bits de données par cycle de signal (QDR - Quad Data Rate) par opposition à deux bits (DDR - Double Data Rate), comme c'était le cas dans toutes les modifications précédentes de Mémoire SDRAM DDR. Les fréquences physiques des cœurs de mémoire et de l'interface de transfert de données se situent approximativement dans la même plage que celle des puces GDDR5.

Spécifications GeForce GTX 1080 

 Date de sortie  27 mai 2016 année
 Prix ​​de départ, $  599

Chip

 Modèle de processeur graphique 16 nm GP104-400
 Cœurs : TMU : ROP 2560: 160: 64

Des fréquences

 Fréquence GPU (boost), MHz 1607 (1733)
 Fréquence mémoire (effective), MHz 1251 (10008)
 Performances FP32, GFLOPS 8,228

Mémoire

 Taille de la mémoire vidéo, Mo  8192
 Bus mémoire, peu  256
 Bande passante mémoire, Go/s  320

Interface et TDP

 Interface PCI-Express  3.0 x16
 TDP. Mar 180

Et afin de saturer la bande passante accrue des puces avec des données, GDDR5X utilise un préchargement de données augmenté de 8n à 16n. Avec une interface 32 bits d'une puce séparée, cela signifie que le contrôleur sélectionne non pas 32, mais 64 octets de données dans un cycle d'accès à la mémoire. En conséquence, la bande passante de l'interface résultante atteint 10-14 Gb / s par broche à une fréquence CK (horloge de commande) de 1250-1750 MHz - c'est la fréquence indiquée par les utilitaires de surveillance et d'overclocking des cartes vidéo, tels que GPU-Z . Au moins pour l'instant, ces chiffres sont inclus dans la norme, mais à l'avenir, Micron prévoit d'atteindre des chiffres allant jusqu'à 16 Gb / s.

Le prochain avantage de GDDR5X est l'augmentation du volume de puce - de 8 à 16 Gbps. La GeForce GTX 1080 est livrée avec huit puces de 8 Go, mais à l'avenir, les fabricants de cartes graphiques pourront doubler la quantité de RAM à mesure que des puces plus volumineuses seront disponibles. Comme GDDR5, GDDR5X permet l'utilisation de deux puces sur un contrôleur 32 bits en mode dit clamshell, ce qui permet d'adresser 32 Go de mémoire sur un bus GP256 104 bits.

55

L'architecture Maxwell dispose déjà du support GPU le plus large du marché pour les nouvelles fonctionnalités de rendu de DirectX 12 (niveau de fonctionnalité 12_1). Pascal ajoute quelques options supplémentaires à cet arsenal qui ont également un potentiel pour les applications VR. Async Compute - l'une des fonctionnalités de DirectX 12, auparavant uniquement disponible sur les processeurs AMD GCN, vous permet d'allouer dynamiquement des ressources GPU entre les charges de travail graphiques et informatiques afin que les ressources libérées après l'achèvement de l'une des tâches puissent être immédiatement transférées vers le tâche restante.

Alors qu'AMD est passé à la synchronisation PCI Express dans les configurations multi-GPU, NVIDIA utilise toujours une interface distincte en SLI. Cependant, l'attention du public a échappé au fait qu'à des tailles d'écran suffisamment élevées, les GPU NVIDIA échangent également une partie des données via PCI Express. Cela suggère que sous la forme implémentée dans les architectures NVIDIA précédentes, le SLI a déjà épuisé sa limite de bande passante. A notre connaissance, il est de 1 Go/s, ce qui n'est plus suffisant pour échanger des trames dans une résolution de 3840x2160 à 60 Hz.

sm.sli.800

Mais au lieu de passer complètement au PCI Express, Pascal a retravaillé l'interface existante. Traditionnellement, une carte graphique NVIDIA dispose de deux connexions SLI qui fonctionnent simultanément pour relier le GPU à ses voisins dans une configuration triple ou quadruple, mais un seul canal est utilisé pour le transfert de données dans un ensemble à deux processeurs. L'utilisation de deux canaux en tandem avec le GPU est le moyen le plus évident d'augmenter les performances, et c'est exactement ce qui s'est passé avec Pascal.

NVIDIA a également publié un pont spécial, disponible en plusieurs versions de différentes longueurs, qui a amélioré les caractéristiques physiques pour permettre à l'interface de fonctionner à une fréquence augmentée des 400 MHz précédents à 650 MHz.

Commentaires (0)