jeugpu     Rechercher trouver 4120

 tg2 f2 lin2 in2 Icône X 3 y2  p2 Tik vapeur2

Radeon R9 290X

 La nouvelle puce graphique Hawaii au cœur de la carte graphique AMD Radeon R9 290X est basée sur l'architecture Graphics Core Next (GCN) que nous connaissons déjà, qui a été légèrement modifiée pour les capacités de calcul et pour prendre pleinement en charge toutes les fonctionnalités de DirectX 11.2, comme auparavant fait dans la puce Bonaire (Radeon HD 7790), qui est également devenue la base de la Radeon R7 260X. Les changements architecturaux à Bonaire et à Hawaï concernent des améliorations des capacités informatiques (prise en charge d'un plus grand nombre de threads exécutés simultanément) et une nouvelle version de la technologie AMD PowerTune, dont nous parlerons plus en détail ci-dessous.

Radeon R9 290X

Les nouvelles fonctionnalités de DirectX 11.2 incluent des ressources de tuiles qui utilisent le matériel de mémoire virtuelle GPU d'Hawaï appelé textures partiellement résidentes (PRT). En utilisant la mémoire vidéo virtuelle, il est facile d'obtenir un support matériel efficace pour les algorithmes qui permettent aux applications d'utiliser d'énormes quantités de textures et de les diffuser dans la mémoire vidéo. PRT permet une utilisation plus efficace de la mémoire vidéo dans de telles tâches, et des techniques similaires sont déjà utilisées dans certains moteurs de jeux.

Alors que les capacités du GCN ont été étendues, l'objectif principal d'AMD dans la conception du nouveau GPU haut de gamme était d'améliorer l'efficacité énergétique de la puce, car Tahiti consommait déjà trop d'énergie et Hawaï comprenait plus d'unités de calcul. Voyons ce que les ingénieurs d'AMD ont réussi à faire pour mettre un produit compétitif sur le marché :

diag gpu petit


Le nouveau processeur graphique est logiquement divisé en quatre parties (Shader Engine), chacune contenant 11 unités de calcul agrandies (Compute Unit), comprenant des modules de texture, un processeur géométrique et un rastériseur, ainsi que plusieurs unités ROP. En d'autres termes, le schéma fonctionnel de la puce AMD la plus moderne est devenu encore plus similaire au schéma des puces NVIDIA, qui ont également une organisation similaire.

Au total, la puce graphique Hawaii comprend : 44 unités de calcul contenant 2816 processeurs de flux, 64 ROP et 176 TMU. Le GPU en question dispose d'un bus mémoire 512 bits composé de huit contrôleurs 64 bits, ainsi que de 1 Mo de cache L28. Il est produit sur la même technologie de traitement 6.2 nm que Tahiti, mais contient déjà 4.3 milliards de transistors (Tahiti en a XNUMX milliards).

Considérez un schéma fonctionnel du moteur de shader qui compose le GPU Hawaii. Il s'agit d'un gros bloc de la puce, qui contient quatre de ces moteurs :


Chaque Shader Engine comprend un processeur de géométrie et un rastériseur, qui sont capables de traiter une primitive de géométrie par horloge. Il semble que les performances géométriques d'Hawaï se soient non seulement améliorées, mais devraient être bien équilibrées par rapport aux GPU précédents d'AMD.

dx112

Un moteur de shader d'architecture GCN peut contenir jusqu'à quatre blocs Render Back-ends (RB) agrandis, qui comprennent chacun quatre blocs ROP. Le nombre d'unités de calcul dans le moteur de shader peut également être différent, mais dans ce cas, il y en a 11, bien que les caches pour les instructions et les constantes soient divisés pour quatre unités de calcul. Autrement dit, il serait plus logique d'inclure non pas 11, mais 12 unités de calcul dans le Shader Engine, mais il semble qu'un tel nombre n'était plus inclus dans les limites de consommation d'énergie d'Hawaï.


L'unité de calcul de l'architecture GCN comprend diverses unités fonctionnelles : des modules de récupération de texture (16 éléments), des modules de filtrage de texture (quatre éléments), une unité de prédiction de branche, un ordonnanceur, des unités de calcul (quatre vectorielles et une scalaire), un cache de premier niveau mémoire (16 Ko par unité de calcul), mémoire pour les registres vectoriels et scalaires et mémoire partagée (64 Ko par unité de calcul).


Puisqu'il y a quatre moteurs de shader dans le GPU d'Hawaï, il dispose au total de quatre unités de traitement de géométrie et de moteurs de rastérisation. En conséquence, le nouveau GPU haut de gamme d'AMD peut traiter jusqu'à quatre primitives géométriques par horloge. De plus, la mise en mémoire tampon des données géométriques a été améliorée à Hawaï et les caches pour les paramètres primitifs géométriques ont été augmentés. Dans l'ensemble, cela offre une augmentation significative des performances avec de gros volumes de calculs dans les shaders géométriques et l'utilisation active de la tessellation.

De plus, certaines modifications ont été apportées aux capacités de calcul du nouveau processeur, bien que graphique, mais toujours. La puce comprend deux moteurs DMA qui permettent d'utiliser pleinement les capacités du bus PCI Express 3.0, une bande passante bidirectionnelle de 16 Go / s est déclarée. La possibilité de calcul asynchrone, qui est réalisée à l'aide de huit (dans le cas de la puce Hawaii) Asynchronous Compute Engines (ACE), peut également être qualifiée de relativement nouvelle.

manteau


Les blocs ACE fonctionnent en parallèle avec le GPU et chacun d'eux est capable de gérer huit flux d'instructions. Une telle organisation fournit une planification et un fonctionnement indépendants dans un environnement multitâche, un accès aux données dans la mémoire globale et le cache L2, ainsi qu'une commutation de contexte rapide. Ceci est particulièrement important dans les tâches informatiques, ainsi que dans les applications de jeu lors de l'utilisation du GPU pour les graphiques et l'informatique générale. De plus, cette innovation pourrait théoriquement être un avantage lors de l'utilisation d'un accès de bas niveau aux capacités GPU à l'aide d'API telles que Mantle.

Revenons aux fonctionnalités d'Hawaï qui s'appliquent à l'informatique graphique. En raison de l'augmentation des exigences en matière de permis avec une propagation prévue UltraMoniteurs HD, il devient nécessaire d'augmenter les capacités de calcul des unités d'opérations raster - ROP. La puce Hawaii comprend 16 blocs Render Back End (RBE), soit deux fois plus que Tahiti. Seize RBE contiennent 64 ROP, capables de traiter jusqu'à 64 pixels par horloge, ce qui peut être très utile dans certains cas.

En ce qui concerne le sous-système de mémoire, Hawaii dispose de 1 mégaoctet de cache L16, qui est divisé en 64 sections de 33 Ko. Revendiqué comme une augmentation de 2% de la mémoire cache et une augmentation du débit interne d'un tiers. Le débit total des caches L1/L1 est déclaré égal à XNUMX To/s.

La mémoire est accessible via huit contrôleurs 64 bits, qui forment ensemble un bus 512 bits. Les puces mémoire de la Radeon R9 290X sont cadencées à 5.0 GHz, ce qui donne une bande passante mémoire totale de 320 Go/s, soit plus de 20 % de plus que la Radeon HD 7970 GHz. Dans le même temps, la surface de la puce occupée par le contrôleur mémoire a été réduite de 20 % par rapport au contrôleur 384 bits de Tahiti. 

Spécifications Radeon R9 290X

Nom Radeon R9 290X
noyau Hawaii
Technologie de processus (µm) 0.028
Transistors (millions) 6200
Fréquence centrale 1000
Fréquence mémoire (DDR) 5000
Type de bus et de mémoire GDDR5 512 bits
Bande passante (Gb/s) 320
Blocs de shaders unifiés 2816
Fréquence des unités de shader unifiées 1000
TMU par convoyeur 176
ROP 64
Taux de remplissage (Mpix/s) 64600
Taux de remplissage (Mtex/s) 176400
DirectX 11.2
Taille mémoire 4096
Interface PCI-E 3.0 x16

Par rapport à son prédécesseur Radeon HD 7970, les performances d'Hawaï face à la Radeon R9 290X augmentera d'environ 40 à 60 %.

Commentaires (0)