enfrdepluk
Rechercher trouver 4120  discussion sociale  tg2 f2 lin2 in2 Icône X 3 y2  p2 Tik vapeur2

GeForce GTX 1080

1080

GeForce GTX 1080 – construite sur la base GPU GP104 est la deuxième puce la plus ancienne de la gamme Pascal. Le P104, comparé au P100, représente près de la moitié du nombre de transistors et de la surface de la puce. Si l'on part de la gamme Maxwell, alors la nouvelle puce occupe une position intermédiaire entre le GM204, que NVIDIA utilise dans la GeForce GTX 970/980, et le GM200 (GeForce GTX 980 Ti et GTX 980 TITAN X), tous deux en termes de paramètres « physiques » du cristal et en termes de nombre de cœurs CUDA et de modules de texture. La configuration back-end du GP104 le positionne sans aucun doute comme un successeur du GM204, puisqu'il est également livré avec un bus mémoire de 256 bits, réparti entre huit contrôleurs, et 64 blocs ROP.

sm.gp104.800

Du point de vue de l'agencement des unités de calcul GPU L'architecture Pascal dans l'implémentation GP104 suit de près les principes énoncés dans Maxwell. Toute la logique de calcul est concentrée dans des structures appelées Graphics Processing Cluster (GPC) - il y en a quatre dans ce processeur. À l'intérieur du GPC, il y a cinq Stream Multiprocessors, dont chacun comprend 128 cœurs CUDA, 8 unités de texture et une section de cache L1, qui passe de 24 à 48 Ko par rapport à Maxwell. Chaque GPC comprend également un seul moteur Polymorph (moteur Raster dans le diagramme) qui effectue les étapes de rendu initiales : détection des bords du polygone, projection et découpage des pixels invisibles.

La principale réalisation du processus 16 nm s'exprime ici dans des fréquences d'horloge qui ont presque doublé par rapport à la GeForce GTX 980 : la fréquence de base est de 1607 MHz, la Boost Clock est de 1733 MHz (puisque cette dernière est la fréquence moyenne dans les applications typiques, la GTX 1080 est capable d'accélérer à des valeurs plus élevées.

Le processeur GP64 effectue des calculs à double précision (FP104) à une vitesse de 1/32 de FP32 - en cela, il hérite des puces du deuxième échelon et des échelons suivants de la famille Maxwell. L'architecture Pascal peut également effectuer les opérations FP16 à deux fois les performances du FP32, tandis que Maxwell les exécute à la même vitesse. En termes de consommation électrique, la GeForce GTX 1080 est dans la même classe que la GeForce GTX 980 - 180 W. Sur la base de ces données et des performances TFLOPS déclarées pour les GTX 980 et GTX 1080, nous obtenons un gain d'efficacité énergétique de 63 % pour Pascal par rapport à Maxwell. La capacité de la RAM est de 8 Go GDDR5X - un volume qui était auparavant l'apanage des cartes vidéo AMD basées sur GPU Hawaï, avec un bus mémoire de 512 bits.

microns gddr5x 575px

L'une des principales différences entre GDDR5X et GDDR5 est la capacité de transmettre quatre bits de données par cycle de signal (QDR - Quad Data Rate) par opposition à deux bits (DDR - Double Data Rate), comme c'était le cas dans toutes les modifications précédentes de Mémoire SDRAM DDR. Les fréquences physiques des cœurs de mémoire et de l'interface de transfert de données se situent approximativement dans la même plage que celle des puces GDDR5.

Spécifications GeForce GTX 1080 

 Date de sortie  27 mai 2016 année
 Prix ​​de départ, $  599

Chip

 Modèle GPU 16 nm GP104-400
 Cœurs : TMU : ROP 2560: 160: 64

Des fréquences

 fréquence GPU(augmentation), MHz 1607 (1733)
 Fréquence mémoire (effective), MHz 1251 (10008)
 Performances FP32, GFLOPS 8,228

Mémoire

 Taille de la mémoire vidéo, Mo  8192
 Bus mémoire, peu  256
 Bande passante mémoire, Go/s  320

Interface et TDP

 Interface PCI-Express  3.0 x16
 TDP. Mar 180

Et afin de saturer le débit accru des puces en données, GDDR5X utilise une prélecture de données augmentée de 8n à 16n. Avec une interface 32 bits d'une puce distincte, cela signifie que le contrôleur sélectionne non pas 32, mais 64 octets de données au cours d'un cycle d'accès à la mémoire. En conséquence, le débit de l'interface résultant atteint 10-14 Gbit/s par contact à une fréquence CK (command clock) de 1250 1750-XNUMX XNUMX MHz - c'est la fréquence indiquée par les utilitaires de surveillance et d'overclocking des cartes vidéo - tels que GPU-Z. Au moins maintenant, de tels indicateurs sont inclus dans la norme, mais à l'avenir, Micron prévoit d'atteindre des chiffres allant jusqu'à 16 Gbit/s.

Le prochain avantage de GDDR5X est l'augmentation du volume de puce - de 8 à 16 Gbps. La GeForce GTX 1080 est livrée avec huit puces de 8 Go, mais à l'avenir, les fabricants de cartes graphiques pourront doubler la quantité de RAM à mesure que des puces plus volumineuses seront disponibles. Comme GDDR5, GDDR5X permet l'utilisation de deux puces sur un contrôleur 32 bits en mode dit clamshell, ce qui permet d'adresser 32 Go de mémoire sur un bus GP256 104 bits.

55

L'architecture Maxwell possède déjà la plus vaste GPU sur le marché avec prise en charge de nouvelles fonctions de rendu dans la norme DirectX 12 (niveau de fonctionnalité 12_1). Pascal ajoute plusieurs options supplémentaires à cet arsenal qui ont également un potentiel d'utilisation dans le domaine de la réalité virtuelle. Async Compute est l'une des fonctionnalités de DirectX 12, auparavant réservée aux processeurs AMD basés sur l'architecture GCN, qui vous permet d'allouer dynamiquement des ressources GPU entre la charge graphique et la charge informatique afin que les ressources libérées après l'achèvement d'une des tâches puissent être immédiatement utilisées pour la tâche restante.

Alors qu'AMD dans plusieurs configurations GPU passé en synchronisation via le bus PCI Express, NVIDIA utilise toujours une interface distincte en SLI. Cependant, ce qui a échappé à l'attention du public est le fait qu'à des niveaux suffisamment élevés de séparation de l'écran GPU NVIDIA échange également certaines données via PCI Express. Cela suggère que sous la forme implémentée dans les architectures NVIDIA précédentes, le SLI a déjà atteint sa limite de débit. A notre connaissance, il est de 1 Go/s, ce qui n'est plus suffisant pour échanger des images dans une résolution de 3840x2160 à 60 Hz.

sm.sli.800

Mais au lieu de passer complètement au PCI Express, Pascal a repensé l'interface existante. Traditionnellement, une carte graphique NVIDIA dispose de deux connexions SLI qui fonctionnent simultanément pour la communication. GPU avec ses voisins dans une configuration triple ou quadruple, mais un seul canal est utilisé pour la transmission des données dans une combinaison à deux processeurs. Utilisez deux canaux en tandem GPU est le moyen le plus évident d'augmenter la productivité, et c'est exactement ce qui s'est passé avec Pascal.

NVIDIA a également publié un pont spécial, disponible en plusieurs versions de différentes longueurs, qui a amélioré les caractéristiques physiques pour permettre à l'interface de fonctionner à une fréquence augmentée des 400 MHz précédents à 650 MHz.