jeugpu

tg2 f2 lin2 in2 tw2 y2  p2 Tik vapeur2
 

Caractéristiques de l'architecture Radeon X1800 XT

1192781795_49490
L'ATI RADEON X1800 est le premier processeur graphique au monde produit commercialement utilisant la technologie de traitement de 0.09 micron de TSMC.

ATI avait peu de marge de manœuvre avec les noms, et uniquement sur le segment plus ancien : seul le nom RADEON X900 restait vacant, alors que presque toutes les autres options étaient déjà prises, car, contrairement à NVIDIA, ATI Technologies dans le cas de la gamme RADEON X, opérait avec des nombres à trois chiffres dans les noms de leurs produits. Une issue a été trouvée; il s'est avéré simple et, en même temps, assez élégant - le nombre 1000 a été ajouté aux désignations numériques des nouveaux produits.Ainsi, les nouveaux processeurs graphiques ATI ont été nommés RADEON X1800, RADEON X1600 et RADEON X1300. À notre avis, c'est un mouvement plutôt réussi, laissant beaucoup de place pour d'autres manœuvres avec les noms, et indiquant également que nous avons une nouvelle génération d'architecture devant nous.

70083

Cette fois, c'est bien vrai : ATI et NVIDIA ont inversé les rôles. Si le NVIDIA G70 n'est rien d'autre qu'un NV40 sensiblement amélioré (évolution), alors le RADEON X1000 est en effet une toute nouvelle architecture qui n'a pas grand chose à voir avec les architectures ATI précédentes (révolution).
De plus, l'aînée de la famille, la puce RADEON X1800 (R520), s'est avérée plus complexe que la NVIDIA G70 - 320 contre 302 millions de transistors ! Dans le même temps, la RADEON X1600 (RV530), destinée aux segments moyens du marché, se compose de 157 millions de transistors, tandis que la RADEON X1300 (RV515) est devenue, selon les développeurs, la première puce d'entrée de gamme avec environ 100 millions de transistors à l'intérieur.

La raison de la complexité de l'architecture était un ensemble d'innovations dans la puce, y compris des fonctionnalités telles que :
Prise en charge du Shader Model 3.0 ;
Processeurs de shader améliorés avec un bloc spécial pour exécuter les instructions de branchement ;
Nouveau contrôleur de mémoire ;
Système de cache amélioré ;
Système amélioré de connexions internes des différents blocs de la puce.

Désormais, les différents modèles RADEON X1000 ne différaient pas seulement par le nombre de processeurs de pixels et de vertex, ce qui permettait d'atteindre un rapport prix/performance optimal. Comme d'habitude, les versions les moins performantes du nouveau GPU sont nommées en commençant par RV.

La famille RADEON X1000 sera représentée sur le marché par les modèles d'adaptateurs vidéo suivants :
RADEON X1800 XT (R520, 625/1500MHz, 16pp, 8vp, 256-bit, 256Mo/512Mo, );
RADEON X1800 XL (R520, 500/1000MHz, 16pp, 8vp, 256-bit, 256Mo,);
RADEON X1600 XT (RV530, 590/1380 MHz, 12 pp, 5 vp, 128 bits, 128/256 Mo) ;
RADEON X1600 XT (RV530, 500/780 MHz, 12 pp, 5 vp, 128 bits, 128/256 Mo) ;
RADEON X1300 PRO (RV515, 600/800 MHz, 4 pp, 2 vp, 128 bits, 256 Mo) ;
RADEON X1300 (RV515, 450/500 MHz, 4 pp, 2 vp, 128 bits, 128/256 Mo, );
RADEON X1300 HyperMemory (RV515, 450/1000MHz, 4pp, 2vp, 128-bit, 32MB, jusqu'à 128 MB HyperMemory, ).

Processeurs de pixels

Depuis qu'ATI a accordé une grande attention aux fonctions de répartition du travail entre différents périphériques d'exécution, la nouvelle architecture RADEON X1000 est devenue véritablement multithread, obtenant même un nom spécial - Ultra-Architecture filetée. L'analogie avec Intel Hyper-Threading est tout à fait appropriée ici, puisque les objectifs de ces technologies sont similaires : l'utilisation la plus efficace de la puissance disponible du processeur et la réduction maximale possible du temps d'inactivité des appareils exécutifs.

70044

L'architecture RADEON X1000 (R5xx) présente des similitudes avec les architectures RADEON 9000 (R3xx) et RADEON X800 (R4xx), ainsi qu'avec une toute nouvelle architecture utilisée dans le GPU Xbox 360, cependant, les nouveaux processeurs ATI contiennent un certain nombre de caractéristiques uniques qui n'ont pas d'analogues dans d'autres puces.

En particulier, les puces RADEON X1000 ont un commutateur intelligent intégré - une unité spéciale appelée Ultra-Threading Dispatch Processor, responsable de la répartition optimale de la charge entre les quads de processeurs de pixels (chaque quad se compose de quatre processeurs de pixels, chacun étant capable de traiter un shader pour un bloc de 2x2 pixels par horloge), ainsi que des modules de texture. En particulier, Ultra-Threading Dispatch Processor divise le travail associé aux mêmes pixel shaders (charge de travail de traitement des pixels) en petits groupes, ou threads (threads) de 4x4 pixels.

Ultra-Threading Dispatch Processor reconnaît quand les processeurs de pixels à l'intérieur des quads sont inactifs et leur attribue instantanément de nouvelles tâches. Cependant, dans le cas où des données non encore reçues sont nécessaires pour poursuivre l'exécution du shader, alors un tel thread est suspendu par le processeur d'arbitrage jusqu'à sa réception, libérant ainsi des ressources arithmétiques (Arithmetic Logic Unit, ALU) pour les autres threads et la latence de masquage, par exemple, la récupération de texture, à la fois dans le cache et en mémoire. Selon ATI, cette organisation du travail permet d'atteindre 90% d'efficacité d'utilisation des processeurs de pixels dans n'importe quel shader.

Étant donné que la commutation rapide entre les threads nécessite de sauvegarder les résultats intermédiaires de chacun, ATI utilise pour cela des registres spéciaux - le General Purpose Register Array - avec une connexion à haut débit aux processeurs de pixels, ce que nous avons déjà vu dans les processeurs graphiques précédents. On ne sait pas encore combien de registres les RADEON X1800, X1600 et X1300 ont et à quel point les nouvelles puces sont sensibles à la complexité des pixel shaders.

Selon la norme Shader Model 3.0, les boucles, les branches et les sous-programmes sont entièrement pris en charge par les nouvelles solutions ATI, et l'utilisation de flux control leur permet d'exécuter des shaders d'une longueur presque illimitée. Tous les calculs sont effectués par les processeurs de la famille RADEON X1000 au format FP 128 bits, ce qui élimine pratiquement la possibilité d'accumulation d'erreurs et, par conséquent, de détérioration de la qualité de l'image.

Le nombre de threads de code s'exécutant simultanément a été augmenté, et la taille de chacun, au contraire, a été réduite à 4x4 pixels, ce qui a permis d'atteindre une plus grande efficacité lors de l'utilisation du branchement dynamique, dont le principe est bien illustré par le schéma suivant :

70031

L'avantage de l'approche ATI est évident - avec une taille de branche plus grande, l'efficacité de la ramification dynamique diminue considérablement ; dans le cas du 64x64 pixels, son utilisation devient injustifiée. Le membre aîné de la famille, RADEON X1800 (R520) est capable d'exécuter jusqu'à 512 threads (threads) de code de shader simultanément, tandis que les modèles moins puissants sont limités à 128 threads.

Processeurs Vertex

La conception des processeurs de vertex RADEON X1000 est très similaire à celle de NVIDIA GeForce 7 - chaque processeur se compose de deux unités, vectorielle et scalaire, à la différence que les deux ALU du processeur de vertex G70 sont de 32 bits et l'ALU vectorielle du processeur RADEON X1000 similaire a un 128 bits Cet avantage permet d'utiliser une puce graphique pour émuler des processeurs centraux.

70047

Les nouveaux processeurs de vertex peuvent exécuter 2 instructions par horloge, et la longueur du shader peut atteindre 1024 instructions dans le cas normal et être presque infinie lors de l'utilisation du flux control. Bien sûr, les processeurs de vertex RADEON X1000 sont entièrement conformes aux spécifications Shader Model 3.0.

Contrôleur de mémoire

Le contrôleur mémoire inclus dans les nouveaux GPU ATI a été entièrement repensé. Désormais, le bus de mémoire interne du RADEON X1800 a une topologie en anneau et se compose de deux bus en anneau opposés de 256 bits, tandis que la topologie en anneau du RADEON X1600 se compose d'une paire de bus opposés de 128 bits.

70042

Le fait est que les jeux de barres en anneau qui font le tour de tout le cristal permettent de simplifier et d'optimiser le câblage des conducteurs à l'intérieur, en connectant les composants de la manière la plus courte possible. Cette solution, couplée à l'utilisation d'un commutateur lors des opérations d'écriture en mémoire, minimise les retards et la distorsion du signal. Grâce à la technologie Ring Bus, RADEON X1800/1600 peut facilement utiliser même la mémoire la plus haute fréquence, telle que GDDR4, ce qui, dans le cas d'une architecture traditionnelle, pourrait entraîner un fonctionnement instable en raison d'interférences causées par un câblage non optimal du conducteurs correspondants à l'intérieur du GPU.

La mémoire est connectée aux bus par l'intermédiaire de ce qu'on appelle des "arrêts d'anneau" (Ring Stop). Il existe quatre arrêts de ce type, chacun avec deux canaux d'accès mémoire de 32 bits de large. À titre de comparaison, dans la RADEON X850, la mémoire était connectée au contrôleur via quatre canaux 64 bits. Chaque Ring Stop peut transmettre, selon les instructions du contrôleur de mémoire, au client demandant les données.

Le principe de fonctionnement du sous-système de mémoire Ring Bus est assez simple. Le client envoie une demande de données au contrôleur de mémoire, situé au milieu de la puce. Le contrôleur de mémoire donne la priorité à chacune des requêtes selon un certain algorithme et donne la priorité à celle qui affecte le plus les performances, en envoyant la requête appropriée aux puces de mémoire et en transmettant ces données via le Ring Bus au Ring Stop le plus proche pour le client, qui transfère ensuite les données au client. Pour un accès optimal à la mémoire, le soi-disant Write Crossbar Switch est situé autour du contrôleur direct, ce qui vous permet de répartir uniformément les requêtes.

Des améliorations ont également été apportées à la technologie HyperZ - désormais, un algorithme plus avancé est utilisé pour déterminer les zones invisibles à découper. Il a augmenté l'efficacité de l'élimination des surfaces cachées de 50 % par rapport à la RADEON X850.

HDR

La nouvelle génération de processeurs graphiques ATI a reçu une prise en charge complète des modes d'affichage à plage dynamique élevée, connus collectivement sous le nom de HDR.

Lors du développement de la nouvelle architecture, ATI Technologies a essayé de prendre en compte toutes les lacunes, et les processeurs graphiques RADEON X1000 ont reçu les possibilités les plus larges pour travailler avec HDR, y compris la prise en charge de divers formats, y compris ceux non standard (personnalisés). De plus, la RADEON X1000 a pour la première fois la possibilité d'utiliser le HDR simultanément avec l'anticrénelage plein écran. Par rapport à NVIDIA GeForce 6/7, c'est un énorme pas en avant, mais les performances des nouveaux GPU seront-elles suffisantes pour assurer un confort de jeu dans ces modes ? La réponse à cette question ne peut être donnée que par les résultats des tests. Au moins maintenant, il est clair pourquoi le processeur graphique R520, le modèle haut de gamme de la nouvelle famille ATI, s'est avéré plus complexe que NVIDIA G70 - toutes les innovations architecturales ci-dessus ont été données aux développeurs pour une raison et ont exigé leur part de transistors sur un ébrécher. Résultat, malgré la présence de processeurs 16 pixels contre 24 pour le produit concurrent, le nombre total de transistors atteint 320 millions, ce qui fait du R520 le processeur graphique le plus complexe au monde.

ATI RADEON X1800 a été le premier processeur graphique produit commercialement au monde utilisant la technologie de traitement de 0.09 micron de TSMC. De plus, cette puce est de loin la plus complexe de l'industrie 3D - elle se compose de 320 millions de transistors, soit un peu plus que celle du concurrent le plus dangereux - NVIDIA G70. Bien que la complexité de la RADEON X1800 soit assez élevée, le processus technique plus fin a permis de fonctionner à des fréquences allant jusqu'à 625 MHz, ce qui était auparavant inaccessible.

Malgré le fait que le nombre de transistors qui composent la RADEON X1800 est le double du nombre de transistors de son prédécesseur, la RADEON X800, le nombre de processeurs pixel n'a pas été augmenté, et il en reste encore 16 dans la nouvelle famille. Au lieu d'augmenter leur nombre, ATI a équipé le nouveau GPU d'un bloc spécial, portant le nom Ultra-Threading Dispatch Processor, responsable de la répartition efficace de la charge entre les processeurs de pixels et de l'augmentation de leur efficacité. ATI a déclaré que cette approche permet d'atteindre une efficacité de 90% dans l'exécution de n'importe quel pixel shader.

 

Spécifications ATI Radeon X1800 XT

Nom Radeon X1800 XT
noyau R520
Technologie de processus (µm) 0.09
Transistors (millions) 321
Fréquence centrale 625
Fréquence mémoire (DDR) 750 (1500)
Type de bus et de mémoire GDDR3 256 bits
Bande passante (Gb/s) 48
Canalisations de pixels 16
TMU par convoyeur 1
textures par horloge 16
textures par passe 16
Convoyeurs Vertex 8
Ombrage de pixels 3.0
Nuanceurs de vertex 3.0
Taux de remplissage (Mpix/s) 10000
Taux de remplissage (Mtex/s) 10000
DirectX 9.0c
Anticrénelage (Max) MS-6x
Filtrage anisotrope (Max) 16x Qualité
Taille mémoire 256/512
Interface PCI-E
RAMDAC Assistance

Bien que la famille RADEON X1800 dans son ensemble ait mérité des éloges pour ses performances et ses fonctionnalités, elle était encore près d'un quart en retard par rapport à la GeForce 7800 GTX, qui a des fonctionnalités et des performances similaires.

FEAR

10_peur

Commentaires (0)