Caractéristiques de l'architecture Radeon HD 3870
Ce n'est un secret pour personne aujourd'hui que la première génération de processeurs graphiques de masse prenant en charge DirectX 10, ainsi que les adaptateurs vidéo basés sur eux, se sont avérés extrêmement infructueux - tout d'abord, en termes de performances. Malgré l'architecture innovante, les ATI Radeon HD 2600 et Nvidia GeForce 8600 se sont mal comportées dans les jeux, cédant souvent aux solutions de la génération précédente, bien que pas si parfaites, mais sans goulots d'étranglement évidents sous la forme d'un petit nombre d'unités d'exécution, comme ainsi que des pilotes d'optimisation insuffisants. Une contrainte tout aussi importante était l'utilisation par les deux géants du marché graphique d'un bus mémoire 128 bits, qui est clairement incapable de saturer le GPU avec des données dans les jeux modernes, en particulier lors de l'utilisation de FSAA et de hautes résolutions.
Il semblait qu'AMD, l'actuel propriétaire de tous les actifs d'ATI Technologies, devrait se dépêcher avec "l'arme de représailles", surtout à la lumière de la position de plus en plus précaire de l'entreprise dans le secteur des graphiques 2006D grand public. Sous la direction d'AMD, le chiffre d'affaires d'ATI au deuxième trimestre de l'année civile 40 a chuté cette année de 2006 % par rapport au deuxième trimestre 19,1, tandis que la part de marché Radeon d'ATI est tombée à 27,6 % contre 670 % au moment de l'annonce de la fusion entre ATI et AMD. De toute évidence, AMD avait un besoin urgent de mesures pour rectifier la situation et se remettre sur les rails. L'annonce rapide du nouveau GPU RV19 et la mise en place de livraisons massives de solutions basées sur celui-ci pourraient n'être que de telles mesures, d'autant plus que le processeur a été testé avec succès en août de l'année dernière, cependant, Advanced Micro Devices a décidé de lancer une nouvelle ATI Radeon Ligne HD dans le cadre de l'annonce d'une nouvelle plate-forme de jeu nommée "Spider". À son tour, son lancement a été retardé à plusieurs reprises en raison de problèmes avec les processeurs AMD Phenom atteignant les vitesses d'horloge requises. En conséquence, l'annonce de la plate-forme a été retardée jusqu'au 2.30 novembre, et même à cette époque, les nouveaux processeurs AMD ne pouvaient atteindre que 670 GHz, et la division graphique continuait de subir des pertes. Cependant, revenons au RVXNUMX, qui, bien qu'avec un retard, mais quand même, a finalement vu le jour.
Auparavant, ATI Technologies a été critiqué à plusieurs reprises et à juste titre pour la confusion dans les noms de ses produits. Elle n'a pas changé ses habitudes même maintenant, étant une division d'Advanced Micro Devices. On s'attendait à ce que les adaptateurs vidéo basés sur RV670 s'appellent Radeon HD 2950, ce qui serait tout à fait logique du point de vue du bon sens - la nouvelle puce ne pouvait pas être qualifiée de révolutionnaire; c'était un développement évolutif naturel du R600. Au lieu de cela, le système de nommage a été complètement changé et la nouvelle famille s'appelle Radeon HD 3800, comme si elle était basée sur une nouvelle génération de GPU. La présence de la prise en charge de DirectX 10.1 n'était pas la base pour attribuer le statut de "solutions de nouvelle génération" aux nouveaux produits, cependant, ce qui est fait est fait, et les nouvelles cartes graphiques AMD ATI Radeon sont marquées comme suit :
ATI Radeon HD 3850
ATI Radeon HD 3870
Architecture ATI Radeon HD 3800
AMD est allé plus loin dans la maîtrise de processus techniques plus subtils que Nvidia - sa puce est devenue le premier GPU au monde à utiliser les normes de production de 55 nm, ce qui lui a permis de franchir en toute confiance la barre des 700 MHz, du moins dans l'ancien modèle Radeon HD 3800. complexité de la puce, apparemment en optimisant l'architecture interne de la puce et en simplifiant la topologie du contrôleur de mémoire en anneau, puisque le nombre de blocs fonctionnels RV670 correspond à R600. C'est le premier cas depuis longtemps où un nouveau GPU ATI est à la traîne d'un GPU Nvidia de classe similaire en termes de nombre de transistors. De ce point de vue, ATI a réussi à redevenir un leader technologique, mais à quoi ressemblent les nouveautés par rapport à la GeForce 8800 GT ?
Tout d'abord, l'ATI Radeon HD 3800 surpasse la Nvidia GeForce 8800 GT dans l'horloge de base, qui est cependant compensée par un plus petit nombre d'unités fonctionnelles, telles que TMU. Un avantage significatif dans le nombre d'unités d'exécution, comme nous le savons déjà, n'est pas essentiellement tel, et ce n'est pas seulement et pas tant que les ALU des puces Nvidia fonctionnent à une fréquence plus élevée: l'architecture VLIW implémentée dans Radeon HD nécessite une attention particulière optimisations du pilote pour assurer une parallélisation efficace du code de shader. Sinon, s'il n'est pas possible de charger toutes les ALU avec des instructions indépendantes, les performances des processeurs de shaders superscalaires Radeon HD chutent fortement ; dans le pire des cas, seulement 1 ALU sur 5 faisant partie de chacun des 64 processeurs de ce type peut être utilisée. Ironiquement, c'est AMD/ATI Technologies qui a le plus de problèmes d'optimisation logicielle, car il n'a pas accès au code des jeux développés dans le cadre du programme "The Way It's Meant To Be Played" de Nvidia avant leur sortie officielle. Souvent, cet état de fait affecte directement les performances des solutions graphiques AMD/ATI dans les jeux, et, bien sûr, pas pour le mieux.
Si vous vous concentrez uniquement sur le schéma fonctionnel du RV670, il ne sera pas possible de détecter les différences par rapport au R600. Ils se situent à un niveau plus profond, ils doivent donc être discutés plus en détail. Les différences notables entre RV670 et R600 incluent la prise en charge de DirectX 10.1 (Shader Model 4.1) et un processeur vidéo UVD matériel à part entière, similaire à celui inclus dans l'ATI Radeon HD 2600.
Comme le R600, chaque processeur de shader RV670 se compose de six blocs - cinq ALU et un bloc pour l'exécution des instructions de contrôle de flux telles que les branches, la vérification des correspondances, les boucles et les appels de sous-programmes. De plus, il contient un ensemble de registres à usage général
Sur les cinq ALU, quatre sont simples, capables d'exécuter une instruction FP MAD par horloge, et la cinquième ALU peut également exécuter des instructions complexes telles que SIN, COS, LOG, EXP, etc. Cette architecture est extrêmement flexible et hautement évolutive, mais son point faible est sa dépendance aux optimisations logicielles. Bien que les cœurs graphiques ATI Radeon HD incluent un gestionnaire de tâches spécial, son efficacité dépend directement de l'efficacité du compilateur de code de shader, qui fait partie des pilotes. Le fait est que l'architecture superscalaire atteint la plus grande efficacité lorsque toutes les ALU sont occupées à effectuer des opérations indépendantes, ce qui est assez difficile à réaliser, car dans les applications 3D, de nombreuses opérations dépendent des résultats des précédentes.
Les processeurs de texture et de trame architecturaux d'ATI Radeon HD 3800 ne diffèrent pas non plus des blocs similaires d'ATI Radeon HD 2900. Ce sont des appareils complexes, nous ne pouvons donc parler que de leur équivalence aux TMU et ROP traditionnels. Au total, le RV670 dispose de quatre grands processeurs de texture, chacun contenant les blocs suivants à l'intérieur :
8 unités d'adressage de texture
20 blocs d'échantillonnage de texture
4 unités de filtrage de texture
Chacun des processeurs raster RV670 contient :
4 blocs de travail avec canal alpha et brouillard
8 blocs de travail avec des tampons Z et stencil
4 unités de mélange
16 unités de traitement multi-échantillonnage
Ainsi, il équivaut approximativement à 4 ROP classiques et peut traiter quatre pixels par cycle, pour un total de 16, puisqu'il existe au total quatre processeurs de ce type. Dans le cas où l'on travaille avec un Z-buffer, c'est-à-dire des pixels qui ne contiennent pas de données de couleur, les performances sont doublées et sont de 32 pixels par horloge. Comme les unités de texture, les processeurs raster du RV670 ont subi des modifications assez importantes pour prendre en charge les fonctionnalités DirectX 10.1.
Le contrôleur mémoire RV670 a été amélioré et la bande passante mémoire est utilisée beaucoup plus efficacement par la nouvelle puce, ce qui lui permet de rivaliser à armes égales avec le R600. Cependant, en pratique, on ne constate qu'une diminution de la largeur du bus mémoire externe de 512 à 256 bits, ainsi qu'une diminution de la largeur totale des bus internes en anneau du contrôleur de 1024 à 512 bits. Des changements plus subtils, le cas échéant, nous sont malheureusement cachés, et nous ne pouvons pas dire si les performances comparables déclarées du RV670 et du R600 sont leur résultat, ou le résultat d'une utilisation inefficace des capacités du sous-système de mémoire de ce dernier. On penche pour la deuxième option, car en conditions réelles de jeu la présence d'un bus mémoire externe 512 bits avec une bande passante supérieure à 100 Go/s n'apportait souvent aucun avantage à l'ATI Radeon HD 2900 XT.
L'ATI RV670 est également le premier GPU de bureau au monde à offrir les mêmes capacités avancées de gestion de l'alimentation que les cœurs graphiques mobiles d'ATI. Grâce à la technologie ATI PowerPlay, la nouvelle puce est capable de contrôler de manière flexible ses fréquences, sa tension d'alimentation et même de désactiver les blocs inutilisés lorsque le cœur est légèrement chargé. Contrairement aux autres GPU de bureau, les fonctionnalités d'économie d'énergie du RV670 sont intégrées au matériel pour fournir une réponse de charge plus rapide et éliminer les erreurs de détection du GPU.
Dans l'histoire d'ATI Technologies, il y a déjà eu des cas où l'entreprise a pris en charge une norme qui n'avait pas été largement diffusée auparavant. Par exemple, l'ATI Radeon 8500 prenait en charge la spécification Pixel Shader 1.4, qui faisait partie de DirectX 8.1. Ces spécifications étaient beaucoup plus flexibles que les PS1.0/1.1/1.3 supportées par les puces Nvidia et permettaient des effets spéciaux de meilleure qualité, mais c'est précisément à cause d'un support limité qu'elles n'ont pas été largement adoptées par les développeurs de jeux pendant le cycle de vie du jeu. ATI Radeon 8000. Un sort similaire est arrivé au support Shader Model 2.0b implémenté dans la famille ATI Radeon X700/X800/X850, ainsi que Shader Model 2.0a promu par Nvidia dans la famille GeForce FX. DirectX 9 Shader Model 3.0 n'a commencé à gagner une distribution significative qu'après l'apparition des ports de jeu des consoles de jeu Microsoft Xbox 360 et Sony PlayStation 3, ce qui était clairement en dehors du cycle de vie de la GeForce 6 et des premières GeForce 7.
DirectX 10.1 était le premier et le dernier sous-ensemble de DirectX 10. Il a été officiellement inclus dans Windows Vista avec la sortie du Service Pack 1
Principales innovations de DirectX 10.1 :
Prise en charge des tableaux de cubemaps : vous permet d'atteindre une vitesse acceptable lors de l'utilisation de l'illumination globale de la scène en accédant à plusieurs cubemaps en une seule passe de rendu. Cette méthode d'éclairage global comprend le calcul de l'éclairage diffus indirect, des réfractions, des ombres douces et un calcul plus précis des réflexions.
Amélioration du rendu différé et des techniques FSAA : prise en charge des modes de fusion indépendants pour chaque MRT, prise en charge obligatoire de MSAA 4x, prise en charge de l'écriture de masques de couverture de pixels à partir du shader, sélection d'échantillons de motifs, échantillonnage à partir du tampon d'échantillonnage multiple, prise en charge des filtres de détection de pixels qui nécessitent un anti -crénelage.
Augmentation du nombre de registres de vertex shader : les nouvelles spécifications prévoient 32 registres au lieu de 16 dans les spécifications DirectX 10.
Prise en charge de Gather4 : Semblable à la fonction Fetch4 de l'ATI Radeon X1000, permet de récupérer un bloc de 4 pixels (2x2) pour une texture à un seul composant. Sert à accélérer le travail avec les cartes d'ombres et à améliorer la qualité des ombres.
Techniques de fusion et de filtrage améliorées : prise en charge de l'instruction LOD qui renvoie le niveau de détail pour une récupération de texture filtrée, prise en charge de INT16 pour la fusion et FP32 pour le filtrage (INT8 et FP16 dans DirectX 10)
Le GPU RV670 impressionne par sa taille de noyau - malgré le fait qu'il se compose de 666 millions de transistors, sa superficie n'est que de 192 millimètres carrés (13.7x14 mm.). Cela montre clairement de quoi le nouveau procédé 55 nm est capable. À l'exception du logo ATI et de la date de fabrication, le noyau ne contient aucune information significative pour l'utilisateur final. Notre copie a été faite la 39ème semaine de 2007, qui tombait du 23 au 29 septembre. Étant donné que les processeurs graphiques ATI Radeon HD ne déclarent pas de fréquences d'horloge différentes pour différentes parties de la puce, malgré le fait que différents domaines fonctionnent à 26 fréquences différentes, il est d'usage d'indiquer uniquement la fréquence "principale" de la puce ; pour la Radeon HD 3870, il est de 775 MHz. L'emballage en cristal est dépourvu de cadre de protection, par conséquent, lors de l'installation et du démontage du système de refroidissement, il convient de veiller à ne pas ébrécher le noyau.
En termes de configuration de bloc, il n'y a aucune différence avec l'ATI Radeon HD 2900 XT : la puce contient 320 ALU regroupées en 64 unités de calcul superscalaires de 5 ALU chacune. En même temps, 4 ALU dans chacun de ces blocs sont capables d'exécuter des instructions simples telles que MAD (Multiply + Add), et la cinquième, plus complexe, peut également exécuter des instructions transcendantales telles que SIN, COS, LOG, EXP, etc. De plus, chaque processeur de calcul contient un bloc de contrôle de branche chargé d'exécuter des instructions de contrôle de flux (comparaisons, boucles, appels de sous-programmes, etc.). La seule différence avec le R600 dans ce cas est la prise en charge des fonctionnalités avancées de DirectX 10.1 (Shader Model 4.1)
Spécifications ATI Radeon HD 3870
Nom | Radeon HD 3870 |
noyau | RV670 |
Technologie de processus (µm) | 0.055 |
Transistors (millions) | 666 |
Fréquence centrale | 775 |
Fréquence mémoire (DDR) | 1125 (2250) |
Type de bus et de mémoire | GDDR4 256 bits |
Bande passante (Gb/s) | 72 |
Blocs de shaders unifiés | 320 |
Fréquence des unités de shader unifiées | 775 |
TMU par convoyeur | 16 (total) |
ROP | 16 |
textures par horloge | 16 |
textures par passe | 16 |
Modèle de nuanceur | 4.1 |
Taux de remplissage (Mpix/s) | 12400 |
Taux de remplissage (Mtex/s) | 12400 |
DirectX | 10.1 |
Anticrénelage (Max) | MS-24x |
Filtrage anisotrope (Max) | 16x |
Taille mémoire | 512 |
Interface | PCI-E 2.0 |
RAMDAC | MONITORING |
Bien que les cartes graphiques ATI Radeon HD 3870 et ATI Radeon HD 3850 aient de bonnes performances, le positionnement de la HD 3870 laissait un arrière-goût très désagréable. En fait, au lieu de rivaliser avec GeForce 8800 GT 512 Mo et Radeon HD 3870, nous avons eu la réticence d'AMD à concurrencer Nvidia. ATI n'était toujours pas en concurrence en termes de vitesse, mais en termes de prix.
Need for Speed Pro Street