jeugpu     Rechercher trouver 4120

 tg2 f2 lin2 in2 Icône X 3 y2  p2 Tik vapeur2

Caractéristiques de l'architecture Radeon X800 XT

logo_b

Une nouvelle série de processeurs graphiques d'ATI, qui portait le nom interne "R420". Avec la sortie de la RADEON X800, ATI a décidé de diviser la gamme de cartes graphiques par performances et, finalement, par prix, d'une manière légèrement différente qu'auparavant.

Alors que les cartes vidéo basées sur la RADEON 9800 différaient de celles basées sur la RADEON 9800 PRO et la RADEON 9800 XT principalement par les fréquences d'horloge du processeur graphique et de la mémoire vidéo, les différents modèles de RADEON X800 diffèrent désormais également par le nombre de pipelines de pixels et de bus mémoire. largeur. Vous pouvez déterminer à quoi cela a conduit par ce petit tableau :

 

 

Modèle RADEON X800 XT Édition Platine RADEON X800 PRO RADEON X800 SE
Fréquence GPU 520 MHz 475 MHz 425
Nombre de convoyeurs 16 12 8
Type de mémoire GDDR3 GDDR3 DDR
Taille mémoire 256 MB 256 MB 128 MB
Fréquence mémoire 1120 MHz 900 MHz 700
Largeur de pneu Bit 256 Bit 256 Bit 128
prix conseillé 9 9 299 $

Comme on peut le voir sur le tableau, le R420 était capable de fonctionner à des fréquences nettement plus élevées que ses prédécesseurs ou même le NVIDIA NV40 (GeForce 6800/6800 Ultra)
Parmi de nombreuses autres raisons qui ont contribué à l'obtention de fréquences d'horloge aussi élevées, le fait que la RADEON X800 ait été fabriquée selon la technologie de processus de 0.13 micron avec des diélectriques à faible k et des composés de cuivre n'est pas la dernière place.

L'essence de la technologie low-k est l'utilisation d'un matériau isolant spécial à faible constante diélectrique - "Black Diamond" - cela vous permet de réduire considérablement les capacités parasites qui se produisent entre les conducteurs reliant les blocs fonctionnels du GPU situés sur le puce et obtenir un fonctionnement stable à des fréquences d'horloge plus élevées. La diminution de la constante diélectrique permet, entre autres, d'obtenir une réduction de la consommation d'énergie et du dégagement de chaleur du cristal. L'utilisation de composés de cuivre contribue au même objectif - le cuivre a une résistance électrique inférieure à celle de l'aluminium utilisé dans l'ancienne technologie de traitement de 0.15 micron.

Consommation d'énergie

C'est grâce à l'utilisation d'un processus technique aussi parfait que le niveau de consommation d'énergie et de dissipation thermique des nouveaux processeurs graphiques d'ATI n'a non seulement pas augmenté, mais a même diminué par rapport au niveau de consommation et de dissipation thermique des puces de la génération précédente. , R360.
La RADEON X800 PRO consommait environ 50 à 60 watts lorsqu'elle était chargée, tandis que le même chiffre pour la RADEON 9800 XT était de 65 à 75 watts.
Ainsi, la consommation électrique de la nouvelle gamme RADEON s'est avérée nettement inférieure à celle de la GeForce 6800 Ultraqui ne peut que se réjouir: il n'est pas nécessaire d'utiliser un bloc d'alimentation super puissant (et super cher) - comme niveau minimum autorisé, ATI a recommandé d'utiliser des alimentations de 300 watts, ce qui, vous voyez, est plus démocratique que 480 watts selon aux exigences de NVIDIA.

ATI R420 : 8, 12 ou 16 pipelines ?

Curieusement, dans un premier temps, ATI prévoyait de répondre à la nouvelle architecture de NVIDIA avec une solution à huit pipelines : c'était censé suffire. Cependant, plus tard, la conversation s'est tournée vers les convoyeurs à 12 pixels, et même plus tard, la société a décidé d'utiliser une artillerie lourde à 16 convoyeurs - apparemment, craignant que la frappe de représailles ne soit pas assez forte. Eh bien NVIDIA GeForce 6800 Ultra - en effet, une puce graphique très productive, qui dans tous les principaux paramètres surpasse de manière significative l'ancien leader, ATI RADEON 9800 XT, et huit ou même douze pipelines de pixels pour le nouveau processeur graphique d'ATI pourraient ne pas suffire à battre NV40 dans un combat loyal .

Jeu haute définition

Avec l'annonce de la nouvelle architecture X800 (R420) et d'une nouvelle série de processeurs graphiques, RADEON X800 XT et RADEON X800 PRO, ATI a introduit un nouveau concept : High Definition Gaming.

Le concept de HD Gaming doit son apparition à la diffusion de la TVHD - télévision haute définition - et des dispositifs d'affichage prenant en charge la norme HDTV.
La qualité d'image HDTV est difficile à comparer à la qualité d'image conventionnelle : ce n'est pas seulement une résolution plus élevée ou plus de détails, c'est un ordre de qualité différent. ATI a comparé l'avènement de la TVHD au passage du noir et blanc à la couleur : la plupart des gens qui ont vu la TVHD "en direct" auront du mal à revenir à une qualité normale.
ATI a évalué l'expérience de jeu HD sur les ordinateurs personnels de la même manière que l'expérience lors du passage de la qualité vidéo normale à la TVHD : fréquence d'images élevée stable dans les tailles d'écran les plus élevées, y compris 1600x1200 et 1920x1080, détails incroyables, un nouveau niveau de qualité d'image, des effets réalistes et des mondes vraiment vivants.

L'architecture du X800, capable d'incarner le HD Gaming, comprenait un certain nombre d'éléments à la fois totalement nouveaux et hérités de l'architecture précédente, mais améliorés. Les noms marketing des technologies ont été conservés, mais désormais à la place des indices numériques, ATI leur ajoute le suffixe « HD » :
SMARTSHADER HD - Processeurs de vertex et de pixels X800
SMOOTHVISION HD - algorithmes de filtrage anisotrope et d'anticrénelage plein écran
HYPER Z HD - technologies qui augmentent l'efficacité de l'utilisation de la bande passante disponible du bus mémoire
3Dc - une nouvelle méthode de compression qui compresse les cartes normales

Pipelines de pixels, shaders de pixels

Lorsque vous regardez les fonctionnalités de la RADEON X800, la première chose qui attire votre attention est l'augmentation des fréquences d'horloge et le nombre accru de pipelines de pixels dans les nouveaux processeurs graphiques d'ATI : 16 pour la RADEON X800 XT Platinum Edition et 12 pour la RADEON 9800PRO.
Cependant, il n'est pas tout à fait exact de dire que les RADEON X800 XT et X800 PRO avaient respectivement des pipelines de 16 et 12 pixels, malgré le fait que, par exemple, vous pouvez voir ces 800 pipelines sur le schéma fonctionnel simplifié de la RADEON X16 :

43110

Les pipelines de 16 pixels de la RADEON X800 ont été combinés en 4 groupes de 4 pipelines. En d'autres termes, la RADEON X800, en fait, n'avait pas 16 pipelines de pixels, mais seulement 4, mais chacun de ces pipelines de pixels "larges" ne fonctionnait pas avec des pixels uniques, mais avec des groupes composés de quatre pixels.

43104

En conséquence, la version XT de la RADEON X800 avait quatre pipelines de ce type, ce qui correspond à 16 pipelines de pixels "normaux", alors que la PRO n'en avait que trois : la RADEON X800 PRO était capable de produire 12 pixels par horloge.
Remarquablement, toutes les versions des GPU RADEON X800 sont physiquement identiques, toutes ont le nombre total de pipelines de pixels "larges", mais seule la RADEON X800 XT utilise les quatre pipelines. La RADEON X800 PRO avait l'un des pipelines désactivé, tandis que la RADEON X800 SE avait déjà deux pipelines désactivés. Cette pratique était très pratique pour ATI : lorsque les puces de toutes les versions de processeurs graphiques sont initialement les mêmes, en désactivant les pipelines dans lesquels des défauts ont été trouvés lors des tests, vous pouvez utiliser des puces défectueuses pour des solutions moins productives et réduire ainsi le nombre de puces qui aller gaspiller.

Ainsi, chacun des quatre pipelines "larges" RADEON X800 a traité quatre pixels - ils sont situés dans un bloc 2x2 (Quad). Dans le même temps, plusieurs (dizaines ou centaines) de blocs 2x2 pouvaient être en traitement - dans la file d'attente : une telle organisation du travail permettait de masquer la latence d'échantillonnage et de filtrage de texture, qui pouvait se mesurer en dizaines et centaines de cycles .

43106

Le nombre de registres temporaires disponibles pouvant être utilisés lors de l'exécution des shaders dans R420 a été augmenté par rapport à R3x0, passant de 12 à 32. Ainsi, R420 s'est avéré encore plus insensible à la complexité des shaders - les processeurs de pixels NV3x de NVIDIA ont considérablement perdu de leur efficacité lors de l'exécution shaders complexes qui nécessitent l'utilisation d'un grand nombre de registres temporaires.

La précision interne des calculs en virgule flottante dans les processeurs de pixels n'a pas changé lors de la transition vers la nouvelle architecture : RADEON X800 a pris en charge la représentation des données au format virgule flottante 16 bits et 32 ​​bits, mais tous les calculs sont effectués avec une précision de 24 bits.

43105

La puissance de traitement des processeurs pixel RADEON X800 a été considérablement augmentée par rapport à l'architecture précédente : le nombre d'unités logiques arithmétiques scalaires et vectorielles (ALU) a maintenant été doublé. Auparavant, les processeurs de pixels ATI, ayant une ALU vectorielle, une ALU scalaire et une unité d'adressage de texture, pouvaient exécuter jusqu'à trois instructions par horloge au total sur chaque pixel, dans la RADEON X800, le nombre d'ALU scalaires et vectorielles était doublé, et en conséquence, les processeurs de pixels pouvaient exécuter jusqu'à cinq instructions sur chaque pixel en un cycle d'horloge.

En plus de toutes les autres améliorations, les processeurs de pixels RADEON X800 ont désormais la possibilité d'exécuter des shaders plus longs : par rapport à la génération précédente, le nombre maximum d'instructions mathématiques scalaires et vectorielles est passé de 64 à 512, et le nombre d'instructions de texture de 32 à 512. Au total, le nombre maximum d'instructions de texture a été augmenté, ainsi que les instructions mathématiques scalaires et vectorielles augmentées de 160 à 1536.

Ayant des fonctionnalités étendues par rapport à l'architecture précédente, ATI RADEON X800, cependant, ne prenait pas en charge les transitions dynamiques et les cycles dans les pixel shaders. C'est pourquoi ATI n'a pas pu annoncer la prise en charge des shaders de pixels du modèle 3.0 - contrairement à 2.x, la prise en charge des transitions et des cycles dynamiques était une condition obligatoire pour les shaders 3.0.

Pipelines de vertex, shaders de vertex.

Tout d'abord, il convient de mentionner que le nombre de processeurs de vertex dans la RADEON X800 a été porté à six - les précédentes puces graphiques haut de gamme d'ATI n'avaient que 4 processeurs de vertex. En ajoutant à cela une augmentation significative des fréquences d'horloge des nouveaux processeurs graphiques, on imagine immédiatement une augmentation minime des performances géométriques lors du passage à la RADEON X800.

43109

Les processeurs de vertex RADEON X800, tout comme les processeurs de pixels, ne prenaient pas en charge les transitions dynamiques dans les shaders de vertex, ce qui, couplé à l'absence d'unités de récupération de texture dans les processeurs de vertex, a annulé les espoirs que RADEON X800 aurait un support matériel pour les shaders de vertex modèle 3.0.

Hyper Z HD

HyperZ HD est un développement ultérieur des idées d'un tampon Z tuilé hiérarchique implémenté dans tous les GPU ATI à partir de RADEON 256.
L'objectif principal d'HyperZ HD était d'exclure du traitement les pixels du polygone actuellement traité avec une efficacité maximale, qui dans l'espace de la scène sont derrière ceux déjà rendus plus tôt et ne seront donc pas inclus dans l'image finale.

Pour exclure efficacement des blocs entiers de pixels du traitement, la technologie HyperZ HD, en plus du tampon Z "normal", a utilisé des tampons Z basse résolution ou des tampons Z en mosaïque. Chaque valeur de ces tampons Z stocke la plus grande valeur Z sélectionnée parmi l'ensemble du bloc - tuile - de pixels.

VIDEOSHADER : vidéo et HDTV

Contrairement aux développeurs NVIDIA, qui ont équipé leur idée originale, le processeur graphique NV40, de capacités spéciales pour le traitement des flux vidéo, les ingénieurs d'ATI Technologies ont décidé à juste titre lors du passage à une nouvelle architecture qu'ils ne cherchaient pas le bien du bien, et ont tout laissé tel quel. . En d'autres termes, le mécanisme de travail avec la vidéo dans le R420 reste le même que dans la gamme R3x0/RV3x0. Cependant, cela ne signifie pas que les capacités de traitement vidéo du R420 sont faibles. Depuis l'époque de la RADEON 9700 PRO, les adaptateurs vidéo ATI ont pu utiliser les ressources de calcul des processeurs de pixels à cette fin - la technologie VIDEOSHADER - de sorte que la RADEON X800 est parfaitement adaptée au traitement vidéo. Avec l'aide de VIDEOSHADER, le GPU effectue le désentrelacement, la réduction du bruit, la conversion de l'espace colorimétrique, ainsi qu'une sorte de lissage d'image qui vous permet de supprimer les artefacts en bloc inhérents aux méthodes de compression MPEG-4/DivX.

Statistiques de charge CPU lors de l'utilisation de différents accélérateurs

42940

3Dc : nouvel algorithme de compression de carte normale

Avec l'avènement de la RADEON X800, ATI a introduit un nouvel algorithme de compression spécialement conçu pour compresser les cartes normales - 3Dc.
Les cartes normales sont un développement ultérieur des technologies de simulation de bosses et sont de plus en plus courantes. L'essence des cartes normales est de stocker des informations sur les irrégularités d'un objet sous forme de textures, où chaque élément de texture stocke trois composantes d'un vecteur perpendiculaire à la surface de l'objet en un point donné, c'est-à-dire le vecteur normal.
L'utilisation de cartes normales vous permet d'obtenir une image beaucoup plus détaillée et réaliste d'un objet sans augmenter le nombre de polygones qui décrivent cet objet. En conséquence, pour créer des cartes normales pour un objet, il suffit de créer un modèle high-poly et un modèle d'objet simplifié et, sur la base de la différence entre ces modèles, de créer une carte normale. À l'avenir, vous ne pourrez utiliser qu'un modèle simplifié, mais lors de l'utilisation d'une carte normale créée précédemment, l'apparence de l'objet, même lors de l'utilisation d'un modèle plus simple, sera proche de la vue d'origine :

43101

L'utilisation d'une nouvelle méthode de compression des cartes normales a permis de réduire la charge sur le bus mémoire lors de l'utilisation de cartes très détaillées ou, à l'inverse, tout en maintenant les volumes de données au même niveau, d'augmenter le détail des cartes normales.

Filtrage anisotrope

Les algorithmes mis à jour d'anticrénelage plein écran et de filtrage anisotrope implémentés dans la RADEON X800 ont été combinés par ATI sous le nom de SMOOTHVISION HD.
La RADEON X800 a reçu une version mise à jour de l'algorithme de filtrage anisotrope, qui permet de réduire la baisse des performances sans compromettre la qualité de l'image.

 

Spécifications ATI Radeon X800 XT

 

Nom Radeon X800 XT
noyau R423 / R420
Technologie de processus (µm) 0.13 (faible k)
Transistors (millions) 160
Fréquence centrale 500
Fréquence mémoire (DDR) 500 (1000)
Type de bus et de mémoire GDDR3 256 bits
Bande passante (Gb/s) 32
Canalisations de pixels 16
TMU par convoyeur 1
textures par horloge 16
textures par passe 16
Convoyeurs Vertex 6
Ombrage de pixels 2.0b
Nuanceurs de vertex 2.0b
Taux de remplissage (Mpix/s) 8000
Taux de remplissage (Mtex/s) 8000
DirectX 9.0b
Anticrénelage (Max) MS-6x
Filtrage anisotrope (Max) 16x
Taille mémoire 256
Interface PCI-E/AGP
RAMDAC Assistance

 

Ainsi, les processeurs graphiques de nouvelle génération d'ATI se sont révélés être de dignes concurrents de la nouvelle architecture de NVIDIA.

L'ancien modèle, RADEON X800 XT, surpasse GeForce 6800 Ultra là où il faut s'y attendre, c'est-à-dire dans la plupart des jeux modernes, à la fois avec une complexité géométrique élevée et avec une utilisation intensive de shaders de pixels complexes. Lorsque l'anticrénelage plein écran et le filtrage anisotrope sont activés, le rapport des résultats des tests de jeu change en faveur des nouveaux processeurs graphiques d'ATI - ils utilisent la technologie HyperZ HD efficace, qui réduit la charge sur le bus mémoire, et une haute performance méthode de filtrage anisotrope qui les rendait en quelque sorte moins avancés que la concurrence

Far Cry

6373

Commentaires (0)