enfrdepluk
Rechercher trouver 4120  discussion sociale  tg2 f2 lin2 in2 Icône X 3 y2  p2 Tik vapeur2

Caractéristiques de l'architecture Radeon HD 3870

4574242

Ce n'est plus un secret pour personne aujourd'hui que la première génération de processeurs graphiques produits en série prenant en charge DirectX 10, ainsi que les adaptateurs vidéo basés sur ceux-ci, se sont révélés extrêmement infructueux - principalement en termes de performances. Malgré l'architecture innovante, les ATI Radeon HD 2600 et Nvidia GeForce 8600 sont loin d'être les meilleures dans les jeux, souvent inférieures aux solutions de la génération précédente, bien que moins parfaites, mais sans goulots d'étranglement évidents sous la forme d'un petit nombre d'actionneurs, ainsi que des pilotes d'optimisation insuffisants. Un facteur limitant tout aussi important était l'utilisation par les deux géants du marché graphique d'un bus mémoire de 128 bits, clairement incapable de saturer les données. GPU dans les jeux modernes, en particulier lors de l'utilisation de FSAA et de hautes résolutions.

Il semblait qu’AMD, l’actuel propriétaire de tous les actifs d’ATI Technologies, devrait se dépêcher d’utiliser « l’arme de représailles », surtout à la lumière de la position de plus en plus précaire de l’entreprise dans le secteur des graphiques 2006D grand public. Sous la direction d'AMD, le chiffre d'affaires d'ATI au deuxième trimestre 40 de cette année a chuté de 2006 % par rapport au deuxième trimestre 19,1, tandis que la part de marché des Radeon d'ATI est tombée à 27,6 %, contre XNUMX % au moment de l'annonce de l'ATI-AMD. fusionnement. De toute évidence, AMD avait besoin de toute urgence de mesures pour corriger la situation et se remettre sur les rails. Annonce rapide du nouveau GPU Le RV670 et la mise en place d'une fourniture massive de solutions basées sur celui-ci pourraient bien être de telles mesures, d'autant plus que le processeur a été testé avec succès en août de l'année dernière. Cependant, Advanced Micro Devices a décidé de lancer une nouvelle gamme d'ATI Radeon HD dans le cadre de l'annonce d'une nouvelle plateforme de jeu nommée "Spider". À son tour, son lancement a été reporté à plusieurs reprises en raison de problèmes avec les processeurs AMD Phenom atteignant les vitesses d'horloge requises. En conséquence, l'annonce de la plate-forme a été reportée au 19 novembre, et même à cette époque, les nouveaux processeurs AMD n'ont pu atteindre que la barre des 2.30 GHz, et la division graphique a continué de subir des pertes. Mais revenons au RV670 qui, bien que retardé, a finalement vu le jour.

Auparavant, ATI Technologies avait été critiquée à plusieurs reprises et à juste titre pour la confusion dans les noms de ses produits. Même aujourd’hui, elle n’a pas changé ses habitudes, étant une division d’Advanced Micro Devices. On s'attendait à ce que les adaptateurs vidéo basés sur RV670 s'appellent Radeon HD 2950, ​​​​ce qui serait tout à fait logique du point de vue du bon sens - la nouvelle puce ne pouvait pas être qualifiée de révolutionnaire ; c'était un développement évolutif naturel du R600. Au lieu de cela, le système de dénomination a été complètement modifié et la nouvelle famille s'est appelée Radeon HD 3800, comme si elle était basée sur GPU nouvelle génération. La présence du support de DirectX 10.1 n'est pas une base pour attribuer le statut de « solutions de nouvelle génération » aux nouveaux produits, cependant, ce qui est fait est fait, et les nouvelles cartes graphiques AMD ATI Radeon sont étiquetées comme suit :

114110

ATI Radeon HD 3850
ATI Radeon HD 3870

Architecture ATI Radeon HD 3800

AMD est allé plus loin dans la maîtrise de processus techniques plus subtils que Nvidia - sa puce est devenue le premier processeur graphique au monde utilisant les normes de production de 55 nm, ce qui a permis de franchir en toute confiance la barre des 700 MHz, du moins dans l'ancien modèle Radeon HD 3800. Dans le même temps, plusieurs ont réussi à réduire la complexité de la puce, très probablement en optimisant l'architecture interne de la puce et en simplifiant la topologie du contrôleur de mémoire en anneau, puisqu'en termes de nombre de blocs fonctionnels RV670 correspond à R600. C'est la première fois depuis longtemps qu'un nouveau GPU ATI est en retard sur le GPU Nvidia de classe similaire en termes de nombre de transistors. De ce point de vue, ATI a réussi une fois de plus à devenir un leader technologique, mais comment les nouveaux produits se comparent-ils à la GeForce 8800 GT ?

Tout d'abord, l'ATI Radeon HD 3800 surpasse la Nvidia GeForce 8800 GT dans l'horloge de base, qui est cependant compensée par un plus petit nombre d'unités fonctionnelles, telles que TMU. Un avantage significatif dans le nombre d'unités d'exécution, comme nous le savons déjà, n'est pas essentiellement tel, et ce n'est pas seulement et pas tant que les ALU des puces Nvidia fonctionnent à une fréquence plus élevée: l'architecture VLIW implémentée dans Radeon HD nécessite une attention particulière optimisations du pilote pour assurer une parallélisation efficace du code de shader. Sinon, s'il n'est pas possible de charger toutes les ALU avec des instructions indépendantes, les performances des processeurs de shaders superscalaires Radeon HD chutent fortement ; dans le pire des cas, seulement 1 ALU sur 5 faisant partie de chacun des 64 processeurs de ce type peut être utilisée. Ironiquement, c'est AMD/ATI Technologies qui a le plus de problèmes d'optimisation logicielle, car il n'a pas accès au code des jeux développés dans le cadre du programme "The Way It's Meant To Be Played" de Nvidia avant leur sortie officielle. Souvent, cet état de fait affecte directement les performances des solutions graphiques AMD/ATI dans les jeux, et, bien sûr, pas pour le mieux.

114092

Si vous vous concentrez uniquement sur le schéma fonctionnel du RV670, il ne sera pas possible de détecter les différences par rapport au R600. Ils se situent à un niveau plus profond, ils doivent donc être discutés plus en détail. Les différences notables entre RV670 et R600 incluent la prise en charge de DirectX 10.1 (Shader Model 4.1) et un processeur vidéo UVD matériel à part entière, similaire à celui inclus dans l'ATI Radeon HD 2600.

Comme le R600, chaque processeur de shader RV670 se compose de six blocs - cinq ALU et un bloc pour l'exécution des instructions de contrôle de flux telles que les branches, la vérification des correspondances, les boucles et les appels de sous-programmes. De plus, il contient un ensemble de registres à usage général

114093

Sur les cinq ALU, quatre sont simples, capables d'exécuter une instruction FP MAD par horloge, et la cinquième ALU peut également exécuter des instructions complexes telles que SIN, COS, LOG, EXP, etc. Cette architecture est extrêmement flexible et hautement évolutive, mais son point faible est sa dépendance aux optimisations logicielles. Bien que les cœurs graphiques ATI Radeon HD incluent un gestionnaire de tâches spécial, son efficacité dépend directement de l'efficacité du compilateur de code de shader, qui fait partie des pilotes. Le fait est que l'architecture superscalaire atteint la plus grande efficacité lorsque toutes les ALU sont occupées à effectuer des opérations indépendantes, ce qui est assez difficile à réaliser, car dans les applications 3D, de nombreuses opérations dépendent des résultats des précédentes.

Les processeurs de texture et de trame architecturaux d'ATI Radeon HD 3800 ne diffèrent pas non plus des blocs similaires d'ATI Radeon HD 2900. Ce sont des appareils complexes, nous ne pouvons donc parler que de leur équivalence aux TMU et ROP traditionnels. Au total, le RV670 dispose de quatre grands processeurs de texture, chacun contenant les blocs suivants à l'intérieur :

8 unités d'adressage de texture
20 blocs d'échantillonnage de texture
4 unités de filtrage de texture

114094

Chacun des processeurs raster RV670 contient :
4 blocs de travail avec canal alpha et brouillard
8 blocs de travail avec des tampons Z et stencil
4 unités de mélange
16 unités de traitement multi-échantillonnage
Ainsi, il équivaut approximativement à 4 ROP classiques et peut traiter quatre pixels par cycle, pour un total de 16, puisqu'il existe au total quatre processeurs de ce type. Dans le cas où l'on travaille avec un Z-buffer, c'est-à-dire des pixels qui ne contiennent pas de données de couleur, les performances sont doublées et sont de 32 pixels par horloge. Comme les unités de texture, les processeurs raster du RV670 ont subi des modifications assez importantes pour prendre en charge les fonctionnalités DirectX 10.1.

Le contrôleur mémoire RV670 a été amélioré et la bande passante mémoire est utilisée beaucoup plus efficacement par la nouvelle puce, ce qui lui permet de rivaliser à armes égales avec le R600. Cependant, en pratique, on ne constate qu'une diminution de la largeur du bus mémoire externe de 512 à 256 bits, ainsi qu'une diminution de la largeur totale des bus internes en anneau du contrôleur de 1024 à 512 bits. Des changements plus subtils, le cas échéant, nous sont malheureusement cachés, et nous ne pouvons pas dire si les performances comparables déclarées du RV670 et du R600 sont leur résultat, ou le résultat d'une utilisation inefficace des capacités du sous-système de mémoire de ce dernier. On penche pour la deuxième option, car en conditions réelles de jeu la présence d'un bus mémoire externe 512 bits avec une bande passante supérieure à 100 Go/s n'apportait souvent aucun avantage à l'ATI Radeon HD 2900 XT.

L'ATI RV670 est également le premier GPU de bureau au monde à offrir les mêmes capacités avancées de gestion de l'énergie que les cœurs graphiques mobiles d'ATI. Grâce à la technologie ATI PowerPlay, la nouvelle puce peut contrôler de manière flexible ses fréquences, sa tension d'alimentation et même désactiver les blocs inutilisés lorsque la charge sur le cœur est légère. Contrairement aux autres ordinateurs de bureau GPU, la prise en charge des fonctions d'économie d'énergie dans le RV670 est implémentée au niveau matériel, ce qui fournit une réponse plus rapide aux changements de charge et élimine les erreurs dans la détermination du fonctionnement du GPU.

Dans l'histoire d'ATI Technologies, il y a déjà eu des cas où l'entreprise a pris en charge une norme qui n'avait pas été largement diffusée auparavant. Par exemple, l'ATI Radeon 8500 prenait en charge la spécification Pixel Shader 1.4, qui faisait partie de DirectX 8.1. Ces spécifications étaient beaucoup plus flexibles que les PS1.0/1.1/1.3 supportées par les puces Nvidia et permettaient des effets spéciaux de meilleure qualité, mais c'est précisément à cause d'un support limité qu'elles n'ont pas été largement adoptées par les développeurs de jeux pendant le cycle de vie du jeu. ATI Radeon 8000. Un sort similaire est arrivé au support Shader Model 2.0b implémenté dans la famille ATI Radeon X700/X800/X850, ainsi que Shader Model 2.0a promu par Nvidia dans la famille GeForce FX. DirectX 9 Shader Model 3.0 n'a commencé à gagner une distribution significative qu'après l'apparition des ports de jeu des consoles de jeu Microsoft Xbox 360 et Sony PlayStation 3, ce qui était clairement en dehors du cycle de vie de la GeForce 6 et des premières GeForce 7.

DirectX 10.1 est devenu le premier et le dernier sous-ensemble de DirectX 10. Il a été officiellement inclus dans Windows Vista avec Service Pack 1

Principales innovations de DirectX 10.1 :

Prise en charge des tableaux de cubemaps : vous permet d'atteindre une vitesse acceptable lors de l'utilisation de l'illumination globale de la scène en accédant à plusieurs cubemaps en une seule passe de rendu. Cette méthode d'éclairage global comprend le calcul de l'éclairage diffus indirect, des réfractions, des ombres douces et un calcul plus précis des réflexions.
Amélioration du rendu différé et des techniques FSAA : prise en charge des modes de fusion indépendants pour chaque MRT, prise en charge obligatoire de MSAA 4x, prise en charge de l'écriture de masques de couverture de pixels à partir du shader, sélection d'échantillons de motifs, échantillonnage à partir du tampon d'échantillonnage multiple, prise en charge des filtres de détection de pixels qui nécessitent un anti -crénelage.
Augmentation du nombre de registres de vertex shader : les nouvelles spécifications prévoient 32 registres au lieu de 16 dans les spécifications DirectX 10.
Prise en charge de Gather4 : Semblable à la fonction Fetch4 de l'ATI Radeon X1000, permet de récupérer un bloc de 4 pixels (2x2) pour une texture à un seul composant. Sert à accélérer le travail avec les cartes d'ombres et à améliorer la qualité des ombres.
Techniques de fusion et de filtrage améliorées : prise en charge de l'instruction LOD qui renvoie le niveau de détail pour une récupération de texture filtrée, prise en charge de INT16 pour la fusion et FP32 pour le filtrage (INT8 et FP16 dans DirectX 10)

Le GPU RV670 impressionne par sa taille de noyau - malgré le fait qu'il se compose de 666 millions de transistors, sa superficie n'est que de 192 millimètres carrés (13.7x14 mm.). Cela montre clairement de quoi le nouveau procédé 55 nm est capable. À l'exception du logo ATI et de la date de fabrication, le noyau ne contient aucune information significative pour l'utilisateur final. Notre copie a été faite la 39ème semaine de 2007, qui tombait du 23 au 29 septembre. Étant donné que les processeurs graphiques ATI Radeon HD ne déclarent pas de fréquences d'horloge différentes pour différentes parties de la puce, malgré le fait que différents domaines fonctionnent à 26 fréquences différentes, il est d'usage d'indiquer uniquement la fréquence "principale" de la puce ; pour la Radeon HD 3870, il est de 775 MHz. L'emballage en cristal est dépourvu de cadre de protection, par conséquent, lors de l'installation et du démontage du système de refroidissement, il convient de veiller à ne pas ébrécher le noyau.

En termes de configuration de bloc, il n'y a aucune différence avec l'ATI Radeon HD 2900 XT : la puce contient 320 ALU regroupées en 64 unités de calcul superscalaires de 5 ALU chacune. En même temps, 4 ALU dans chacun de ces blocs sont capables d'exécuter des instructions simples telles que MAD (Multiply + Add), et la cinquième, plus complexe, peut également exécuter des instructions transcendantales telles que SIN, COS, LOG, EXP, etc. De plus, chaque processeur de calcul contient un bloc de contrôle de branche chargé d'exécuter des instructions de contrôle de flux (comparaisons, boucles, appels de sous-programmes, etc.). La seule différence avec le R600 dans ce cas est la prise en charge des fonctionnalités avancées de DirectX 10.1 (Shader Model 4.1)

 

Spécifications ATI Radeon HD 3870

Nom Radeon HD 3870
noyau RV670
Technologie de processus (µm) 0.055
Transistors (millions) 666
Fréquence centrale 775
Fréquence mémoire (DDR) 1125 (2250)
Type de bus et de mémoire GDDR4 256 bits
Bande passante (Gb/s) 72
Blocs de shaders unifiés 320
Fréquence des unités de shader unifiées 775
TMU par convoyeur 16 (total)
ROP 16
textures par horloge 16
textures par passe 16
Modèle de nuanceur 4.1
Taux de remplissage (Mpix/s) 12400
Taux de remplissage (Mtex/s) 12400
DirectX 10.1
Anticrénelage (Max) MS-24x
Filtrage anisotrope (Max) 16x
Taille mémoire 512
Interface PCI-E 2.0
RAMDAC MONITORING

 

Bien que les cartes graphiques ATI Radeon HD 3870 et ATI Radeon HD 3850 aient de bonnes performances, le positionnement de la HD 3870 laissait un arrière-goût très désagréable. En fait, au lieu de rivaliser avec GeForce 8800 GT 512 Mo et Radeon HD 3870, nous avons eu la réticence d'AMD à concurrencer Nvidia. ATI n'était toujours pas en concurrence en termes de vitesse, mais en termes de prix.

Need for Speed ​​Pro Street

210708143a3c