NVIDIA explique pourquoi 0,5 Go de VRAM GeForce GTX 970 fonctionne à une vitesse de 1/7

NVIDIA explique pourquoi 0,5 Go de VRAM GeForce GTX 970 fonctionne à une vitesse de 1/7

NVIDIA a confirmé et expliqué le flux de conception de la GeForce GTX 970 qui rend les derniers 512 Mo de la VRAM de la carte incroyablement lents.

L'explication, accompagnée d'un diagramme d'architecture soigné, a été fournie par Jonah Alben, Senior VP de l'ingénierie GPU chez NVIDIA. Nous savons déjà que la GTX 970 est une version dégradée du GPU de référence GTX 980. Alben a expliqué que les principales différences entre les deux cartes sont la désactivation de 3 processeurs de streaming (SM) sur les 16 SM de la GTX 980 et la désactivation d'un bloc sur les 8 blocs de cache de niveau 2.

Chaque SM comprend 128 cœurs CUDA, ce qui fait que 13 SM correspondent aux 1664 cœurs CUDA spécifiés par NVIDIA dans le manuel de la carte. Cependant, le fait de n'avoir que 7 blocs de cache L2 signifie que la GTX 970 ne dispose que de 1792 Ko de cache L2, soit 12,5% de moins que le chiffre de 2048 Ko communiqué par NVIDIA aux évaluateurs de matériel. M. Alben a reconnu que cette information était erronée et a expliqué qu'il s'agissait d'un "malentendu entre l'équipe d'ingénieurs et l'équipe technique des relations publiques".

Pour être honnête, la taille du cache L2 de la GeForce GTX 970 n'est pas mentionnée dans les spécifications matérielles communiquées au grand public.

Pour bien comprendre le problème de vitesse de la VRAM, nous devons entrer dans les détails techniques de l'architecture Maxwell de NVIDIA. L'architecture Maxwell de référence divise sa VRAM de 4 Go en 8 blocs VRAM de 512 Mo, chacun contrôlé par une unité L2/MC. Afin de maximiser la vitesse, chaque donnée écrite dans la VRAM est divisée en 8 parties qui sont envoyées aux 8 unités L2/MC pour être écrites simultanément. Mais dans la GTX 970, la 7ème unité L2/MC est en fait responsable de 2 blocs VRAM, ce qui signifie qu'elle prend deux fois plus de temps que les autres unités pour écrire, les laissant inactives pendant 50% du temps.

Pour résoudre ce problème, NVIDIA a divisé la mémoire de la GeForce GTX 970 en deux pools : un pool de 3,5 Go et un pool de 0,5 Go. Le premier pool est contrôlé par 7 unités L2/MC travaillant en parallèle et fonctionne donc à pleine vitesse, tandis que le second pool est contrôlé par une seule unité L2/MC, ce qui signifie que sa vitesse d'accès est un septième de celle du plus grand pool.

L'explication fournie par Alben est en accord avec les résultats du benchmark qui montrent que les derniers 0,5 Go de GeForce GTX 970 VRAM sont accessibles à 20 Go/s alors que le reste de la mémoire de la carte est accessible à 150 Go/s.

Mais M. Alben insiste sur le fait que cet impact sur les performances ne peut être observé que dans les benchmarks synthétiques et qu'il n'a que peu ou pas d'impact dans les scénarios de jeu réels. Il explique que les pools de mémoire sont conçus de manière à ce que le système d'exploitation soit pleinement conscient de leurs différences de vitesse et que le pool VRAM de 0,5 Go, plus lent, n'est utilisé que pour stocker les données auxquelles on accède rarement.

Selon les laboratoires de performances de NVIDIA, l'impact sur les performances du pool de mémoire plus lent de la GeForce GTX 970 se situe entre 4% et 6% dans les jeux réels.

logo megagames
L'expérience gaming hardcore
Le point de référence pour les trainers, mods, jeux et insights dédiés aux vrais gamers.