arzh-CNenfrdejakoplptesuk
Rechercher trouver 4120  discussion sociale  tg2 f2 lin2 in2 Icône X 3 y2  p2 Tik vapeur2

Radeon R9 290X

 La nouvelle puce graphique Hawaii au cœur de la carte graphique AMD Radeon R9 290X est basée sur l'architecture Graphics Core Next (GCN) que nous connaissons déjà, qui a été légèrement modifiée pour les capacités de calcul et pour prendre pleinement en charge toutes les fonctionnalités de DirectX 11.2, comme auparavant fait dans la puce Bonaire (Radeon HD 7790), qui est également devenue la base de la Radeon R7 260X. Les changements architecturaux à Bonaire et à Hawaï concernent des améliorations des capacités informatiques (prise en charge d'un plus grand nombre de threads exécutés simultanément) et une nouvelle version de la technologie AMD PowerTune, dont nous parlerons plus en détail ci-dessous.

Radeon R9 290X

Les nouvelles fonctionnalités de DirectX 11.2 incluent des ressources en mosaïque qui tirent parti des fonctionnalités de gestion de la mémoire virtuelle matérielle d'Hawaï. GPU, appelées textures partiellement résidentes (PRT). En utilisant la mémoire vidéo virtuelle, il est facile d'obtenir un support matériel efficace pour les algorithmes qui permettent l'utilisation d'énormes volumes de textures dans les applications et leur diffusion dans la mémoire vidéo. Le PRT permet d'augmenter l'efficacité de l'utilisation de la mémoire vidéo dans de telles tâches et des techniques similaires sont déjà utilisées dans certains moteurs de jeu.

Bien que les capacités du GCN aient été étendues, l'objectif principal d'AMD dans la conception du nouveau processeur haut de gamme GPU L'efficacité énergétique de la puce a été améliorée, car Tahiti consommait déjà trop d'énergie, et Hawaï incluait davantage d'unités de calcul. Voyons ce que les ingénieurs d’AMD ont réussi à faire pour proposer un produit compétitif sur le marché :

diag gpu petit


Le nouveau processeur graphique est logiquement divisé en quatre parties (Shader Engine), chacune contenant 11 unités de calcul agrandies (Compute Unit), comprenant des modules de texture, un processeur géométrique et un rastériseur, ainsi que plusieurs unités ROP. En d'autres termes, le schéma fonctionnel de la puce AMD la plus moderne est devenu encore plus similaire au schéma des puces NVIDIA, qui ont également une organisation similaire.

Au total, la puce graphique Hawaii comprend : 44 unités de calcul contenant 2816 processeurs de flux, 64 ROP et 176 TMU. À l'étude GPU dispose d'un bus mémoire de 512 bits composé de huit contrôleurs 64 bits, ainsi que de 1 Mo de cache L28. Il est fabriqué en utilisant la même technologie de processus 6.2 nm que Tahiti, mais contient 4.3 milliards de transistors (Tahiti en possède XNUMX milliards).

Considérez un schéma fonctionnel du moteur de shader qui compose le GPU Hawaii. Il s'agit d'un gros bloc de la puce, qui contient quatre de ces moteurs :


Chaque moteur de shader comprend un processeur de géométrie et un rastériseur, capables de traiter une primitive géométrique par cycle d'horloge. Il semble que les performances géométriques d’Hawaï se soient non seulement améliorées, mais devraient également être assez bien équilibrées par rapport aux itérations précédentes. GPU Sociétés AMD.

dx112

Un moteur de shader d'architecture GCN peut contenir jusqu'à quatre blocs Render Back-ends (RB) agrandis, qui comprennent chacun quatre blocs ROP. Le nombre d'unités de calcul dans le moteur de shader peut également être différent, mais dans ce cas, il y en a 11, bien que les caches pour les instructions et les constantes soient divisés pour quatre unités de calcul. Autrement dit, il serait plus logique d'inclure non pas 11, mais 12 unités de calcul dans le Shader Engine, mais il semble qu'un tel nombre n'était plus inclus dans les limites de consommation d'énergie d'Hawaï.


L'unité de calcul de l'architecture GCN comprend diverses unités fonctionnelles : des modules de récupération de texture (16 éléments), des modules de filtrage de texture (quatre éléments), une unité de prédiction de branche, un ordonnanceur, des unités de calcul (quatre vectorielles et une scalaire), un cache de premier niveau mémoire (16 Ko par unité de calcul), mémoire pour les registres vectoriels et scalaires et mémoire partagée (64 Ko par unité de calcul).


Étant donné qu'il y a quatre moteurs de shader dans le GPU Hawaii, il dispose d'un total de quatre unités de traitement de géométrie et de moteurs de rastérisation. En conséquence, le nouveau sommet GPU AMD peut traiter jusqu'à quatre primitives géométriques par cycle d'horloge. De plus, Hawaï a amélioré la mise en mémoire tampon des données géométriques et des caches plus grands pour les paramètres primitifs de géométrie. Dans l’ensemble, cela permet une augmentation significative des performances avec de grands volumes de calculs dans les shaders de géométrie et l’utilisation active de la tessellation.

De plus, certaines modifications ont été apportées aux capacités de calcul du nouveau processeur, bien que graphique, mais toujours. La puce comprend deux moteurs DMA qui permettent d'utiliser pleinement les capacités du bus PCI Express 3.0, une bande passante bidirectionnelle de 16 Go / s est déclarée. La possibilité de calcul asynchrone, qui est réalisée à l'aide de huit (dans le cas de la puce Hawaii) Asynchronous Compute Engines (ACE), peut également être qualifiée de relativement nouvelle.

manteau


Les unités ACE fonctionnent en parallèle avec le processeur de commandes graphiques et chacune est capable de gérer huit flux de commandes. Cette organisation fournit une planification et un fonctionnement indépendants dans un environnement multitâche, un accès aux données de la mémoire globale et du cache L2, ainsi qu'une commutation rapide du contexte. Ceci est particulièrement important dans les tâches informatiques, ainsi que dans les applications de jeu lors de l'utilisation GPU pour l'informatique graphique et générale. Cette innovation pourrait également théoriquement constituer un avantage lors de l’utilisation d’un accès de bas niveau aux capacités. GPU en utilisant des API telles que Mantle.

Revenons aux fonctionnalités d'Hawaï qui s'appliquent à l'informatique graphique. En raison de l'augmentation des exigences en matière de permis avec une propagation prévue UltraMoniteurs HD, il devient nécessaire d'augmenter les capacités de calcul des unités d'opérations raster - ROP. La puce Hawaii comprend 16 blocs Render Back End (RBE), soit deux fois plus que Tahiti. Seize RBE contiennent 64 ROP, capables de traiter jusqu'à 64 pixels par horloge, ce qui peut être très utile dans certains cas.

En ce qui concerne le sous-système de mémoire, Hawaii dispose de 1 mégaoctet de cache L16, qui est divisé en 64 sections de 33 Ko. Revendiqué comme une augmentation de 2% de la mémoire cache et une augmentation du débit interne d'un tiers. Le débit total des caches L1/L1 est déclaré égal à XNUMX To/s.

La mémoire est accessible via huit contrôleurs 64 bits, qui forment ensemble un bus 512 bits. Les puces mémoire de la Radeon R9 290X sont cadencées à 5.0 GHz, ce qui donne une bande passante mémoire totale de 320 Go/s, soit plus de 20 % de plus que la Radeon HD 7970 GHz. Dans le même temps, la surface de la puce occupée par le contrôleur mémoire a été réduite de 20 % par rapport au contrôleur 384 bits de Tahiti. 

Spécifications Radeon R9 290X

Nom Radeon R9 290X
noyau Hawaii
Technologie de processus (µm) 0.028
Transistors (millions) 6200
Fréquence centrale 1000
Fréquence mémoire (DDR) 5000
Type de bus et de mémoire GDDR5 512 bits
Bande passante (Gb/s) 320
Blocs de shaders unifiés 2816
Fréquence des unités de shader unifiées 1000
TMU par convoyeur 176
ROP 64
Taux de remplissage (Mpix/s) 64600
Taux de remplissage (Mtex/s) 176400
DirectX 11.2
Taille mémoire 4096
Interface PCI-E 3.0 x16

Par rapport à son prédécesseur Radeon HD 7970, les performances d'Hawaï face à la Radeon R9 290X augmentera d'environ 40 à 60 %.