enfrdepluk
Rechercher trouver 4120  discussion sociale  tg2 f2 lin2 in2 Icône X 3 y2  p2 Tik vapeur2

GeForce GT 9600

Le 21 février 208, la société canadienne a officiellement présenté la carte graphique 9600 GT. Il a été conçu pour placer le 8600 GTS dans le segment moyen de gamme dans la catégorie de prix jusqu'à 0 à un "repos mérité".Le nouveau noyau G94 ne diffère de son ancien "frère" G92 que par des changements quantitatifs ou significatifs. En termes de caractéristiques quantitatives, la 9600 GT dispose de 64 processeurs universels en stock, soit deux fois plus que "l'ancienne" 8600 GTS, et deux fois moins que la GeForce 8800 GTS (G92) ou la GeForce 8800 GTX. Cette fois, espérons qu'il n'y aura pas un tel écart de performances par rapport aux anciennes solutions, comme c'était le cas entre le 8800 et le 8600.
Итак, новоиспеченное ядро G94 состоит из 505 млн транзисторов (для сравнения: у G86 их было 210 млн, у G92 — 754 млн, у G80 — 681 млн). Оно работает на номинальной частоте 650 MHz для NVIDIA GeForce 9600 GTS. Графический процессор использует унифицированную шейдерную архитектуру, которая превосходно себя зарекомендовала в чипах G80/84/92. Идея унификации функциональных блоков GPU заключается в следующем: ранее они разделялись на вершинные и шейдерные, а теперь универсальные блоки способны обрабатывать любые виды инструкций без существенных потерь в производительности. Это позволит динамически изменять производительность ядра за счет перераспределения ресурсов для нужной в данный момент задачи. В итоге у нас получается полная загрузка чипа, и как следствие повышается производительность.
1992621 

В случае G94 мы видим элементарную редукцию — 4 шейдерных блока, в каждом из которых сосредоточены по 16 потоковых процессоров (Streaming Processor) и 8 текстурных блоков (TMU). Всего получается 64 потоковых процессора и 32 текстурных модуля. Все процессоры G94, как и в предыдущих чипах, работают с повышенными относительно GPU тактовыми частотами. В частности, для 9600 GT она равняется 1650 MHz. Напоследок отметим блоки записи в кадровый буфер (ROP), которых в данном случае 4 (на диаграмме синие блоки рядом с кэшем L2). В работе и концепции построения потоковых процессоров (SP) NVIDIA не вносила никаких поправок со времен чипов G84.

Pour chaque groupe de quatre processeurs de flux, il existe deux adresseurs de texture TA et deux modules de filtre de texture TF. Par conséquent, désormais, chaque unité de texture, en raison de l'augmentation du nombre d'adresses de texture calculées, pourra traiter deux fois plus d'échantillons que, par exemple, dans le G80. Chaque unité de shader a son propre cache L1. Il peut stocker non seulement des textures, mais aussi, en raison de l'unification des blocs eux-mêmes, divers types de données. Tous les processeurs de flux (SP) sur lesquels repose l'architecture G94 sont scalaires. Pourquoi pas vectoriel ? La raison réside dans le fait que, sur la base de recherches sur les programmes de shader, les développeurs NVIDIA ont découvert que l'architecture vectorielle utilise des ressources informatiques de manière peu économique lorsque des instructions complexes sont traitées, par exemple, des instructions scalaires et vectorielles simultanément (d'une manière générale, des calculs scalaires sur des processeurs vectoriels sont exécutés de manière très inefficace). À la lumière de la tendance récente vers une transition croissante de l'informatique vectorielle à l'informatique scalaire, la stratégie des développeurs NVIDIA, peut-être, devient claire. Eh bien, que faire du code de programme vectoriel ? Tout est très simple : elles sont converties en opérations scalaires directement par la puce G94 elle-même. Comme déjà mentionné, la GeForce 9600 dispose de 4 unités d'écriture de tampon de trame (ROP). Ils n'ont subi aucune modification par rapport à l'architecture G92 et prennent en charge les méthodes d'anti-aliasing suivantes : multi-échantillonnage, sur-échantillonnage et anti-aliasing adaptatif.

Spécifications NVIDIA GeForce 9600 GT

Nom GeForce GT 9600
noyau G94 (D9P)
Technologie de processus (µm) 0.065
Transistors (millions) 505
Fréquence centrale 650
Fréquence mémoire (DDR) 900
Type de bus et de mémoire GDDR3 256 bits
Bande passante (Gb/s) 57.60
Blocs de shaders unifiés 64
Fréquence des unités de shader unifiées 1625
TMU par convoyeur 32
ROP 16
Modèle de nuanceur 4.0
Taux de remplissage (Mpix/s) 10400
Taux de remplissage (Mtex/s) 20800
DirectX 10.0
Taille mémoire 512/1024
Interface PCI-E 2.0