jeugpu     Rechercher trouver 4120

 tg2 f2 lin2 in2 Icône X 3 y2  p2 Tik vapeur2

Fonctionnalités de l'architecture Radeon 9700 Pro

_radeon9700pro_banner

Le 7 août 2002, ATI a annoncé une nouvelle puce - ATI RADEON 9700 PRO. La principale qualité de la nouvelle puce est la prise en charge matérielle complète des exigences dictées par les spécifications DirectX9 de Microsoft.
Fait révélateur, la puce a été annoncée bien avant la sortie de la version finale de DirectX9. La nouvelle puce d'ATI surclassait nettement les autres puces de jeu 3D existantes à l'époque, tant en termes de complexité que de caractéristiques techniques, et pendant que NVIDIA réfléchissait au nouveau processus technologique et préparait la sortie du NV30, il avait toutes les chances de devenir le seul leader. dans le monde des graphismes de jeux.

Voici les principales caractéristiques de la puce d'ATI :
Informations générales:
Technologie de fabrication - 0.15 microns;
Nombre de transistors - ~110 millions ;
Type de paquet - FCPGA ;
Fréquence d'horloge - 325 MHz dans la version ATI RADEON 9700 PRO ;
Bus mémoire - SDRAM DDR 256 bits ;
La quantité maximale de mémoire vidéo - 256 Mo;
Fréquence d'horloge de la mémoire vidéo - 620 (310 DDR) MHz dans la version ATI RADEON 9700 PRO ;
Prise en charge d'AGP 2X (3.3v), 4X (1.5V), 8X (0.8v) et Universal AGP 3.0 (2X/4X/8X);
Prise en charge des spécifications PC2002.
Partie 3D :
Huit pipelines de pixels qui répondent aux exigences de la spécification DirectX 9 pixel shader version 2.0 (technologie SMARTSHADER 2.0 d'ATI);
Une unité de récupération de texture par processeur de pixel ;
Prise en charge du filtrage de texture bilinéaire, trilinéaire, anisotrope et une combinaison de filtrage de texture trilinéaire et anisotrope ;
Quatre pipelines de vertex qui répondent aux exigences de la spécification DirectX 9 vertex shader version 2.0 (technologie SMARTSHADER 2.0 d'ATI);
Prise en charge de l'anti-aliasing plein écran par multi-échantillonnage avec 2, 4 et 6 sous-pixels (technologie SMOOTHVISION 2.0 d'ATI);
Prise en charge de la tessellation polygonale, de la tessellation continue et adaptative, des patchs N, des cartes de déplacement (technologie TRUFORM 2.0 d'ATI) ;
Prise en charge de la technologie d'amélioration de l'efficacité de la bande passante mémoire (technologie HyperZ III d'ATI).
Partie 2D :
Utilisation de pixel shaders pour le traitement vidéo (technologie VIDEOSHADER d'ATI);
Filtrage des artefacts de compression MPEG4/DivX (technologie ATI FULLSTREAM) ;
Décompression matérielle DVD, désentrelacement adaptatif, compensation de mouvement ;
Sortie d'image au format composant YPrPb ;
Deux contrôleurs CRT ;
Deux RAMDAC 400 MHz intégrés ;
Émetteur-récepteur TMDS intégré avec une fréquence de conversion de 165 MHz ;
Diagramme:

14347

Les caractéristiques de la nouvelle puce d'ATI inspiraient le respect - c'était un véritable "monstre": plus de 100 millions de transistors, une fréquence d'horloge de 300 MHz, un bus mémoire de 256 bits, des pipelines de 8 pixels et 4 vertex, une compatibilité DirectX9.

Canalisations de pixels.

Tout d'abord, il est frappant de constater que pour le RV250 "réduit", c'était la norme, mais, semble-t-il, ne pouvait pas être considéré comme normal pour un accélérateur de jeu de classe "haut de gamme" - les pipelines ATI RADEON 9700 pixels n'avaient qu'un seul module de texture chacun. Cependant, une telle construction de pipelines de pixels ATI R300 est tout à fait justifiée. L'ATI RADEON 9700 avait deux fois plus de pipelines de pixels par rapport aux cartes vidéo, ce qui réduisait le problème de la vitesse de texturation insuffisante - le moteur à huit cylindres R300 avait assez de puissance pour se montrer digne. -deuxièmement, les modules de texture R300 ont pu échantillonner huit échantillons de texture par horloge - 4 échantillons chacun à partir de deux niveaux MIP adjacents, et effectuer un filtrage trilinéaire "gratuit" en termes de consommation de cycle de puce.
Troisièmement, la présence de deux modules de texture ou plus dans le pipeline de pixels entraînerait une augmentation de la quantité de données lues à partir des textures par horloge d'un facteur de deux ou plus, et nécessiterait une augmentation du volume des caches. Sinon, même son bus mémoire 300 bits ne suffirait pas pour le R256 - dans sa forme actuelle, chacun des pipelines de pixels du R300, par exemple, lors de l'application d'une texture 32 bits par horloge, demandait jusqu'à 256 bits de données ( 8 échantillons de texture de 32 bits chacun), les huit pipelines au total - 2048 bits.

HyperZ III

Pour revendiquer le leadership parmi les accélérateurs de jeu haut de gamme, il ne suffit pas d'avoir un taux de remplissage élevé et un large bus mémoire. Il est nécessaire d'utiliser efficacement les ressources de la puce graphique et du bus mémoire.
L'ATI RADEON 9700 a implémenté la technologie propriétaire d'ATI, HyperZ III. La tâche de cette technologie est d'éviter le traitement inutile des pixels qui ne sont évidemment pas soumis au rendu, c'est-à-dire ceux qui sont plus éloignés de l'observateur que ceux déjà dessinés. Par exemple, dans le cas où l'un des polygones est partiellement ou totalement recouvert par un autre, alors la partie des pixels du polygone éloigné, recouverte par le polygone proche, ne peut pas être dessinée. Ainsi, la puce graphique s'est débarrassée d'une quantité importante de travail inutile, en même temps, l'efficacité de l'utilisation de la bande passante de la mémoire vidéo disponible a également augmenté.

Z hiérarchique

Implémentation simplifiée d'un Z-buffer hiérarchique.
L'idée d'un Z-buffer hiérarchique est assez simple : en plus du Z-buffer lui-même, une pyramide de "Z-buffers basse résolution" est organisée, organisée comme des niveaux MIP de texture.
Chacun de ces nouveaux tampons est divisé par deux horizontalement et verticalement par rapport au Z-buffer précédent. Dans ce cas, chaque valeur Z du tampon de résolution inférieure doit être écrite dans la plus grande des 4 valeurs Z correspondantes du tampon de résolution supérieure précédent.
ATI RADEON 9700 utilisait une pyramide de trois niveaux de tampons Z - le tampon Z habituel, qui sert de base à cette pyramide, et deux autres niveaux, ayant des dimensions horizontales et verticales, réduites par rapport au tampon Z standard, respectivement , par quatre et huit fois :

14363

Ainsi, alors que chaque valeur du Z-buffer standard correspond à un pixel dans l'image, les valeurs des niveaux suivants de la pyramide stockent les plus grandes valeurs Z des zones contenant respectivement 4x4 et 8x8 pixels.

Rapide Z Effacer

Nettoyage rapide du tampon Z.
Après construction et affichage de l'image, les informations contenues dans le Z-buffer ne sont plus pertinentes et doivent être effacées. En termes simples - entre les images, vous devez réinitialiser le Z-buffer.
RADEON 9700, selon ATI, réinitialise le tampon Z, en écrivant non pas des valeurs individuelles, mais des blocs 8x8 - 64 valeurs à la fois.
Une telle mise à zéro du Z-buffer peut être directement mise en œuvre, ayant un Z-buffer hiérarchique en service. Pour initialiser toute la pyramide des tampons Z, il suffit d'écrire les valeurs initiales uniquement dans le tampon Z de la résolution la plus basse - puis, lors de la construction d'un cadre, la pyramide des tampons Z sera automatiquement maintenue à Date. Ainsi, soit dit en passant, l'hypothèse précédemment énoncée selon laquelle le Z-buffer "supérieur" de la pyramide des Z-buffers basse résolution sur l'ATI RADEON 9700 correspond indirectement à des blocs de 8x8 pixels.

Compression Z

Compression des données lues à partir du Z-buffer ou écrites dans le Z-buffer. L'effet de la compression Z-buffer sans perte est le résultat de Hierarchical Z. En plus de supprimer les pixels qui ne peuvent pas être traités, Hierarchical Z réduit efficacement le nombre de lectures et d'écritures de valeurs Z-buffer, qui représentent une grande proportion du total. flux de données transmis sur le bus mémoire.

Nouveau contrôleur de mémoire

L'ATI RADEON 9700 dispose d'un contrôleur mémoire "divisé" en 4 canaux - cela nous est familier depuis l'époque de NVIDIA GeForce3 :

14349

En fait, dans ce cas, le contrôleur mémoire est composé de 4 contrôleurs indépendants avec une largeur de bus de 64 bits chacun. Dans ce cas, la largeur totale du bus mémoire est de 256 bits.

Nouvel algorithme de filtrage de texture anisotrope

Lors du développement de la nouvelle puce, l'équipe d'ingénierie d'ATI a pris en compte toutes les remarques faites sur la qualité du filtrage de texture anisotrope sur les puces précédentes - l'impossibilité de le combiner avec un filtrage de texture trilinéaire et les mauvaises performances de l'algorithme sur les surfaces inclinées.
Le nouvel algorithme de filtrage de texture anisotrope, étant une version améliorée de l'ancien algorithme "rapide" d'ATI, fonctionnait beaucoup mieux sur les surfaces inclinées et, enfin, permettait d'utiliser une combinaison de filtrage trilinéaire et anisotrope.

VISION LISSE 2.0

La nouvelle technologie d'anti-aliasing plein écran, SMOOTHVISION 2.0, implémentée dans l'ATI RADEON 9700 PRO, était l'une des variétés de multi-échantillonnage. Contrairement à SMOOTHVISION sur ATI RADEON 8500, 9000 / PRO, le suréchantillonnage avec des sous-pixels disposés sur une grille ordonnée (Ordered Grid Super Sampling, OGSS), ATI RADEON 9700 PRO, lorsque SMOOTHVISION 2.0 était activé, calculait les sous-pixels uniquement aux limites des polygones, sans effectuer d'autres opérations inutiles travailler pour les pixels situés dans les "intérieurs" des triangles. C'est, maintenant, enfin, l'idée du multi-échantillonnage, qui est apparue pour la première fois dans NVIDIA GeForce3, s'est avérée être implémentée dans la puce ATI.

VIDÉOSHADER

La possibilité d'utiliser des pixel shaders pour le traitement des flux vidéo a été nommée VIDEOSHADER par ATI.
Grâce au support de VIDEOSHADER, ATI RADEON 9700 s'est débarrassé (ce qui signifie qu'il devient un peu plus simple, plus fiable et moins cher) de certains blocs conçus spécifiquement pour travailler avec la vidéo, et a utilisé à la place des pixel shaders.

HYDRAVISION

Ce mot nous est familier depuis l'apparition d'ATI RADEON VE. La technologie HYDRAVISION ATI appelle le support des configurations multi-moniteurs.
À cet égard, ATI RADEON 9700 n'a pas eu de changements révolutionnaires - comme les puces précédentes, R300 a pris en charge la sortie d'image sur deux moniteurs analogiques, un analogique + un numérique, un moniteur analogique + TV, un moniteur numérique + TV.

Shaders de pixels

Les shaders de pixels DirectX9 version 2.0 sont devenus beaucoup plus complexes. Les nouvelles spécifications dictaient les exigences matérielles suivantes :
Utilisation des données de 16 textures lors de l'exécution du shader ;
32 opérations d'adressage ;
64 opérations arithmétiques ;
16 registres à usage général ;
16 registres pour le stockage des constantes.

ATI RADEON 9700, comme il se doit pour un accélérateur compatible DirectX9, respectait pleinement ces exigences.
A titre de comparaison, voici les spécifications des pixel shaders version 1.4, dont le support matériel est implémenté dans ATI RADEON 8500, 9000/PRO (R200, RV250) :
Utilisation des données de 6 textures lors de l'exécution du shader ;
2*6 opérations d'adressage ;
2*8 opérations arithmétiques ;
6 registres à usage général ;
8 registres pour stocker des constantes

14358

ATI RADEON 9700 vertex pipelines, vertex shaders version 2.0

Les shaders de vertex de la nouvelle version diffèrent également considérablement de la spécification de shader de vertex 1.1.
Les programmes exécutés par les vertex pipelines d'un accélérateur compatible Direct9 - les vertex shaders - sont devenus encore plus proches de la compréhension habituelle des programmes : ils ont désormais la capacité de contrôler le flux de commandes : boucles, sauts conditionnels et inconditionnels, appels de sous-programmes.

Plus de commandes, plus de registres :
Dans la nouvelle spécification du vertex shader, la longueur du programme est passée de 128 à 256 instructions, le nombre de registres à usage général - de 8 à 16, le nombre de registres pour stocker les constantes - de 96 à 256.

Alors que NVIDIA GeForce4 Ti et ATI RADEON 8500 ont chacun deux shaders de vertex, la nouvelle puce d'ATI a quatre processeurs de vertex fonctionnant en parallèle.

14359

14360

 

Spécifications ATI Radeon 9700 PRO

 

Nom Radeon 9700 PRO
noyau R300
Technologie de processus (µm) 0,15
Transistors (millions) 105
Fréquence centrale 325
Fréquence mémoire (DDR) 310 (620)
Type de bus et de mémoire DDR-256 bits
Bande passante (Gb/s) 19,8
Canalisations de pixels 8
TMU par convoyeur 1
textures par horloge 8
textures par passe 16
Convoyeurs Vertex 4
Ombrage de pixels 2.0
Nuanceurs de vertex 2.0
Taux de remplissage (Mpix/s) 2600
Taux de remplissage (Mtex/s) 2600
DirectX 9.0
Anticrénelage (Max) MS-6x
Filtrage anisotrope (Max) 16x
Taille mémoire 128 MB
Interface AGP 8x
RAMDAC 2x400 MHz

Au moment de sa sortie, l'ATI RADEON 9700 PRO est devenue la puce de jeu la plus performante qui existait à cette époque. Fait révélateur, les performances de l'ATI RADEON 9700 PRO étaient si élevées que ce n'était pas la carte vidéo qui devenait souvent la " point faible" dans le système, mais le processeur.

Unreal Tournament 2003

924

Commentaires (0)