jeugpu     Rechercher trouver 4120

 tg2 f2 lin2 in2 Icône X 3 y2  p2 Tik vapeur2

GeForce 6800 Ultra caractéristiques architecturales

En avril 2004, nVidia a présenté le nouveau GPU NV40. Le nouveau processeur graphique NV30, censé aider l'entreprise à écraser ATI Technologies, qui dominait le secteur des solutions compatibles DirectX 9, n'a pas réussi à mettre NVIDIA en tête. L'architecture mûrie dans les laboratoires NVIDIA, qui dépasse les exigences de la norme DirectX 9, s'est avérée très lourde en nombre de transistors et très vulnérable dans la forme sous laquelle elle a vu le jour face aux GeForce FX. 5800 Ultra. Les lacunes de l'architecture du processeur graphique, ainsi que l'utilisation de la mémoire GDDR2 haute fréquence et d'un bus d'accès à la mémoire vidéo 128 bits, ont conduit au fait que le nouveau produit de NVIDIA a montré des résultats bien inférieurs dans de nombreuses tâches que le RADEON 9700 PRO d'ATI.
 
geforce_go_6_series_031 

NVIDIA a rapidement corrigé son erreur en publiant une version améliorée du NV30, le GPU NV35, qui s'est avéré beaucoup plus viable. Néanmoins, l'amertume de la défaite avec le NV30 s'est avérée grande - la société a arrêté la production du NV30, n'ayant produit que quelques dizaines de milliers de ces processeurs, puis a supprimé toute mention du NV30 du site Web de l'entreprise.

Un an s'est écoulé. Pendant ce temps, la société a sorti un certain nombre de nouvelles solutions plutôt réussies, le NV35 a été remplacé par le NV38. La ligne de pilotes Detonator a été oubliée et remplacée par les pilotes ForceWare, avec lesquels, grâce à l'utilisation d'un compilateur de code de shader spécial, les performances des adaptateurs vidéo NVIDIA dans les jeux utilisant des shaders de pixels DirectX 9 ont été considérablement améliorées. Le meilleur choix pour les passionnés reste les adaptateurs vidéo basés sur les processeurs graphiques d'ATI Technologies - RADEON 9800 PRO, puis RADEON 9800 XT.

Bien sûr, pendant tout ce temps, l'équipe d'ingénieurs de développement NVIDIA n'est pas restée les bras croisés - la société essayait de se venger de son concurrent. Des rumeurs sur le monstre GPU NV40 ont commencé à apparaître bien avant qu'il ne soit incorporé pour la première fois dans le silicium. Nous avons parlé de seize pipelines de rendu, de la prise en charge des shaders de pixels et de vertex version 3.0 et d'autres innovations. Les rumeurs circulant étaient très diverses, allant jusqu'à des "informations fiables" selon lesquelles le nouveau produit utilisera une mémoire GDDR3 fonctionnant à une fréquence de 1600 MHz, tandis que la fréquence principale sera jusqu'à 600 MHz

Cette fois, la société a agi avec plus de prudence et de minutie, faisant de son mieux pour éviter que la situation ne se reproduise avec le NV30. Il est curieux que la décision ait été prise d'abandonner complètement les lettres "FX" dans les noms des futurs adaptateurs vidéo basés sur NV40 - ils ont été renommés GeForce 6800 Ultra et GeForce 6800.

nv_031

Lors du développement du processeur graphique de nouvelle génération, NVIDIA n'a pas pu s'empêcher de tenir compte de l'expérience antérieure - la situation où les performances des processeurs graphiques d'un concurrent s'avèrent être plus élevées dans presque toutes les catégories de prix, malgré la supériorité technologique formelle de NVIDIA, n'a ne convient en rien à l'entreprise. Par conséquent, en plus d'étendre davantage les fonctionnalités et d'introduire la prise en charge des shaders du modèle 3.0, la plus grande attention lors de la création du NV40 a été accordée à l'amélioration des performances et, surtout, au renforcement des points initialement faibles de l'architecture CineFX.

Pipelines de pixels NVIDIA GeForce 6800/6800 Ultra En ce qui concerne le NV40 et l'architecture CineFX 3.0, il était impossible de parler de pipelines de pixels au sens traditionnel. À partir du NV30 et de l'architecture CineFX, les GPU de NVIDIA au lieu de plusieurs pipelines de pixels "indépendants" avaient un pipeline de pixels "large", dans lequel plusieurs pixels sont traités en même temps. NV40 hérite de l'architecture NV3x, mais en même temps, bien sûr, il a eu des améliorations et des ajouts significatifs.

Le pipeline de pixels NV40 a été "étendu" d'un facteur 4 par rapport au pipeline NV35 - maintenant 16 pixels peuvent être traités simultanément et la vitesse de sortie maximale est de 16 pixels par horloge. Lors de la superposition de plusieurs textures, la vitesse de sortie des pixels diminue - par exemple, lors de la superposition de deux textures, le traitement des mêmes 16 pixels prendra deux cycles, c'est-à-dire que la vitesse de sortie diminuera à 8 pixels par cycle. Lorsque vous travaillez avec un tampon Z ou un tampon de motif, le pipeline de pixels du NV40, comme le NV35, "accélère". La multiplication par quatre des performances globales a également affecté le travail dans de telles conditions: le GPU était désormais capable de produire un maximum de 32 valeurs Z par horloge. Ainsi, le NV40 avait beaucoup de "force brute": on peut sans risque parler d'un taux de remplissage quadruplé par rapport au NV35.

Parallèlement à «l'expansion» du pipeline de pixels, NVIDIA a également augmenté la puissance de traitement du processeur de pixels. Premièrement, le nombre de registres temporaires disponibles - le point le plus faible des processeurs de pixels des puces de la série GeForce FX, associé aux caractéristiques structurelles du pipeline de pixels NV3x et NV40 - a été augmenté, et désormais des shaders de pixels complexes, lors du calcul avec plein La précision 32 bits ne devrait pas mettre le processeur de pixels à genoux.
Deuxièmement, apparemment, le nombre d'ALU (unités logiques arithmétiques) à part entière qui effectuent des opérations sur les composants de pixels a été doublé dans NV40. Plus précisément, deux types d'ALU NV35 FP, «à part entière» et «simplifiées», qui ont remplacé les ALU entières NV30, se sont transformées en ALU «à part entière» qui effectuent des opérations de toute complexité à la même vitesse. Voici comment NVIDIA a montré l'avantage de CineFX 3.0 avec deux fois plus d'ALU par rapport aux architectures "traditionnelles":

419151

Ainsi, les ALU NV40 pouvaient effectuer jusqu'à 8 opérations sur les composants d'un pixel en un cycle, et si l'on tient compte du fait que le pipeline NV40 traitait 16 pixels simultanément, alors au total, il s'avère que le NV40 avait 32 à part entière ALU à virgule flottante, et ils peuvent effectuer jusqu'à 128 opérations sur des composants de pixels par cycle.

Ombrage de pixels 3.0
La prise en charge du modèle 40 de pixel shaders, qui est apparu dans le NV3.0, signifiait tout d'abord la prise en charge des cycles dynamiques et des branches dans les pixel shaders. Maintenant, la décision de savoir quelle branche du shader sera exécutée pour tel ou tel pixel a été prise juste pendant l'exécution du shader - les variables dont les valeurs déterminent la progression de l'exécution du shader peuvent changer sans être des constantes prédéterminées, tout comme le cas avec des branches et des boucles statiques.
De toute évidence, lorsque les shaders 2.0 ont été exécutés, la nouvelle fonctionnalité de NV40 ne s'est manifestée d'aucune façon, seules les caractéristiques de vitesse du processeur de pixels étaient importantes ici.

NVIDIA HPDR - les images deviennent plus réalistes
Les GPU de NVIDIA de la génération précédente ne prenaient pas en charge la sortie d'informations du pixel shader vers plusieurs tampons simultanément (cibles de rendu multiples) et le rendu vers un tampon avec une représentation des données au format à virgule flottante (FP Render Target). La famille de puces d'ATI prenait initialement en charge ces fonctions, se différenciant favorablement des processeurs graphiques NVIDIA.

Le NV40 prend enfin entièrement en charge les cibles de rendu multiples et la cible de rendu FP, ce qui a permis aux spécialistes du marketing de la société d'introduire un nouveau terme : NVIDIA HPDR. Derrière cette abréviation, qui signifie High-Precision Dynamic-Range, se cache la possibilité de construire des scènes avec une plage dynamique élevée d'éclairage (HDRI, High Dynamic Range Images).

NVIDIA a utilisé le format OpenEXR 16 bits développé par Industrial Light and Magic (ILM). Dans la description OpenEXR 16 bits, un bit était affecté au signe de l'exposant, cinq bits à la valeur de l'exposant et dix bits pour représenter les mantisses des coordonnées de couleur chromatique (u, v), cinq bits par coordonnée . La plage dynamique de la présentation est de neuf ordres de grandeur, de 6.14*10^-5 à 6.41*10^4.

Série Sam 2 HDR

4838627771 


Le processus de création et d'affichage d'une image HDR à l'aide du GPU NV40 a été divisé en 3 phases :
Light Transport - calcule une scène avec une plage dynamique élevée d'éclairage et stocke des informations sur les caractéristiques de la lumière pour chaque pixel dans un tampon en utilisant le format de données à virgule flottante - OpenEXR.
NVIDIA a souligné que le NV40 prenait en charge le travail avec des données présentées au format virgule flottante à toutes les étapes de la construction d'une scène HDR, ce qui garantissait une perte de précision minimale :
- calculs dans les shaders à virgule flottante,
- filtrage de texture en virgule flottante,
- les opérations avec des buffers qui utilisent la représentation des données au format virgule flottante.
Tone Mapping - Convertit une image à plage dynamique élevée au format LDRI RGBA ou sRGB.
Correction des couleurs et du gamma - conversion d'une image dans l'espace colorimétrique d'un périphérique d'affichage - moniteur CRT ou LCD, etc.

Ainsi, avec l'avènement des technologies NV40 et HPDR, les images à plage dynamique élevée, un pas de plus vers l'arrivée des graphismes photoréalistes dans les mondes de jeux, sont devenues disponibles non seulement pour les propriétaires de cartes vidéo ATI, mais également pour les fans de NVIDIA.

Vertex Pipelines, Vertex Shaders 3.0
Après avoir renforcé le processeur de pixels NV40, NVIDIA n'a pas oublié la "force géométrique" des nouvelles GeForce. Les nouvelles puces graphiques avaient deux fois plus de pipelines de vertex - six contre trois pour la NVIDIA GeForce FX 5950 Ultra. Les nouveaux jeux avaient des modèles de plus en plus complexes, le nombre de polygones dans les scènes augmentait, de sorte que les performances à double pic des nouveaux GPU de NVIDIA n'étaient pas sans appel.
Parallèlement à l'augmentation des performances, la fonctionnalité des processeurs de vertex dans NV40 a également augmenté - dans le nouveau processeur graphique, NVIDIA a annoncé une prise en charge complète des shaders de vertex du modèle 3.0. Comme pour les shaders de pixels, la longueur des shaders de vertex était désormais pratiquement illimitée (en fait limitée par les spécifications de shader DirectX Model 3.0), tandis que les shaders peuvent avoir des branches et des boucles vraiment dynamiques - décider quel code sera exécuté pour un sommet particulier ou un autre est pris à droite lors de l'exécution du shader, et non au stade de la compilation.

Diviseur de flux de fréquence Vertex Une autre caractéristique intéressante dont les processeurs de vertex NV40 étaient dotés. En utilisant ce «diviseur de fréquence», les processeurs de vertex NV40 pourraient lire les données des flux et mettre à jour les paramètres d'entrée du shader de vertex non pas pour chaque vertex traité, comme auparavant, mais moins souvent, avec une fréquence qui peut être modifiée.

NVIDIA donne un exemple d'utilisation de cette fonctionnalité : en lisant les données d'un flux à une certaine fréquence, qui détermine, par exemple, l'animation, vous pouvez, sur la base du même ensemble de données qui détermine la géométrie d'un modèle, par exemple, un soldat , créez une armée entière de soldats qui ne seront pas exactement les mêmes "clones" - chacun sera différent des autres, ayant une apparence et une animation uniques.

UltraOmbre II
Annoncée pour la première fois dans le GPU NV35, la technologie UltraShadow, ayant reçu l'index "2" dans le nom, est passé au NV40. L'essence de la technologie n'a pas changé: lors du calcul des ombres dynamiques à l'aide du tampon de modèle, il était possible de spécifier les valeurs limites Z (limites de profondeur), au-delà desquelles les ombres des sources lumineuses ne seront pas calculées. Ainsi, il a été possible d'économiser sur les calculs et d'améliorer les performances dans les scènes en utilisant le calcul des ombres en temps réel.
Действие UltraShadow II a été illustré par Nvidia avec un schéma : il montre les valeurs limites (zmin et zmax), au-delà desquelles le template buffer n'est pas calculé :

419161

La possibilité de définir des conditions aux limites pour le calcul des ombres, associée à la capacité bien connue du NV40 à "accélérer" lors du calcul du tampon de modèle et du tampon Z, c'est-à-dire de ne pas produire 16, mais 32 valeurs par horloge, l'a fait possible de compter sur l'apparition d'un sérieux avantage de NV40 sur les concurrents dans les jeux, le calcul largement utilisé des ombres dynamiques à l'aide du tampon de modèle. 
Un exemple de jeu qui utilise le calcul dynamique des ombres, ou, qui plus est, dont le gameplay est littéralement "construit" sur les ombres, est Doom3.

Processeur vidéo programmable
L'ordinateur domestique s'est longtemps positionné comme une plate-forme universelle de divertissement, ce qui signifie qu'il était inutile pour les développeurs de séparer les processeurs graphiques destinés à être utilisés dans les ordinateurs personnels selon des classes de tâches typiques - toute la gamme de puces est dotée du plus ensemble fonctionnel complet.
Le NV40 disposait d'un processeur vidéo programmable conçu pour encoder/décoder les flux vidéo et effectuer diverses opérations sur ceux-ci. Auparavant, S3 l'avait annoncé avec son VPU DeltaChrome. En outre, les adaptateurs vidéo ATI RADEON 9500/9600/9700/9800 peuvent également décoder la vidéo en utilisant la puissance des processeurs de pixels. Le processeur vidéo NV40, NVIDIA VP, avait les caractéristiques suivantes :
Prise en charge du désentrelacement adaptatif
Mise à l'échelle et filtrage de haute qualité
Suppression des artefacts de bloc
Encodeur TV intégré
Conversion d'espace colorimétrique
Conversion de fréquence d'images
Correction gamma
Suppression de bruit
Prise en charge de la TVHD (modes 720p, 1080i, 480p, CGMS)
Synchronisation matérielle des flux audio et vidéo
Prise en charge de l'encodage et du décodage MPEG-1/2/4
Prise en charge du décodage WMV9/H.264

Anti-aliasing plein écran : un nouveau niveau de qualité
L'une des différences significatives entre les processeurs graphiques de la famille R3x0 d'ATI et les puces de la série GeForce FX de NVIDIA était une approche différente de la mise en œuvre de l'anticrénelage plein écran. GeForce FX de NVIDIA prenait en charge le multi-échantillonnage, le sur-échantillonnage et leurs combinaisons en utilisant la disposition traditionnelle des sous-pixels sur une grille orthogonale ordonnée (grille ordonnée), tandis que les GPU d'ATI utilisent le multi-échantillonnage avec une disposition des sous-pixels sur une grille tournée.

419181

La méthode d'anticrénelage plein écran, qui utilise la disposition des sous-pixels sur une grille tournée, au même coût, a fourni une bien meilleure qualité de lissage des bords des polygones par rapport à la méthode utilisant la disposition traditionnelle des sous-pixels.

Après l'échec du NV30, nVidia a tout mis en œuvre pour regagner le terrain perdu. Et la société a réussi à le faire avec la sortie de la carte vidéo NV40, également connue sous le nom de GeForce 6800. La carte était très efficace et beaucoup plus productive que la FX 5900, également en raison du nombre considérable de transistors (222 millions). La NV45, qui s'appelait aussi GeForce 6800, n'était rien de plus qu'une NV40 avec un pont AGP vers PCI Express, ce qui permettait à la carte de prendre en charge la nouvelle norme d'interface et, en plus, le SLI. La technologie SLI a permis de combiner deux cartes graphiques PCI Express GeForce 6. La puce contenait 222 millions de transistors et était fabriquée avec une technologie de traitement de 0,13 micron. Les besoins en énergie à cette époque étaient tout simplement colossaux - un bloc d'alimentation d'une puissance de 480 W ou plus était nécessaire et deux lignes électriques libres.

Spécifications NVIDIA GeForce 6800 Ultra

 

Nom GeForce 6800 Ultra
noyau NV40/NV45
Technologie de processus (µm) 0.13
Transistors (millions) 222
Fréquence centrale 400
Fréquence mémoire (DDR) 550 (1100)
Type de bus et de mémoire GDDR3 256 bits
Bande passante (Gb/s) 35,2
Canalisations de pixels 16
TMU par convoyeur 1
textures par horloge 16
textures par passe 16
Convoyeurs Vertex 6
Ombrage de pixels 3.0
Nuanceurs de vertex 3.0
Taux de remplissage (Mpix/s) 6400
Taux de remplissage (Mtex/s) 6400
DirectX 9.0c
Anticrénelage (Max) SS&MS - 8x
Filtrage anisotrope (Max) 16x
Taille mémoire 256
Interface AGP/PCI-E
RAMDAC Assistance

Avec la sortie, nVidia a enfin réussi à sortir du marécage douloureux de la gamme NV30 et à sortir un accélérateur graphique vraiment avancé qui fera battre plus vite le cœur de tout joueur NVIDIA - NV40 est une puce qui, par tradition, est devenue l'ancêtre d'une nouvelle famille de puces graphiques de NVIDIA. Après avoir établi de solides relations avec les développeurs de jeux et de logiciels dans le processus d'adaptation de l'architecture NV30, la société a développé le prochain processeur graphique, le NV40, non plus "au hasard", mais en tenant compte des exigences et des souhaits des développeurs. représentant GeForce 6800 Ultra - l'accélérateur de jeu le plus rapide de cette époque, a pu littéralement faire exploser les jeux de l'époque et les jeux sortis ultérieurement.

Far Cry

water_fix1

Commentaires (0)