Changement de stratégie oblige, quand Nvidia annonce une nouvelle carte, il met désormais davantage l'accent sur sa puissance de calcul que sur ses performances graphiques. A l'occasion de sa conférence GPU Technology Conference, à San Francisco en Californie, le constructeur a ainsi présenté son nouveau GT300 et son architecture Fermi, non pas comme un simple GPU mais comme un processeur adapté au HPC (High performance computing, calcul haute performance). Le GT300, conçu avec un procédé en 40 nm, n'héberge pas moins de 3 milliards de transistors. C'est près de 40% de transistors en plus que le RV870 des cartes de DirectX 11 de la série Radeon HD 5800 qu'AMD vient juste d'annoncer. La carte accueille 512 coeurs Cuda (Compute unified device architecture) organisés en 16 groupes de 32. C'est plus du double du contenu des cartes GT200. Nvidia annonce des performances en virgule flottante pour son nouveau produit huit fois plus importantes que pour ces anciens GT200. L'architecture Fermi organise ses 16 cartes processeurs de 32 coeurs Cuda autour d'un cache de niveau 2 de 768k qu'elles partagent. Un meta-scheduler -le GigaThread- distribue des groupes de threads (instructions élémentaires) au scheduler de chacun des 32 processeurs. Ces « dual-warp schedulers » sont en réalité capables de distribuer deux vagues de 32 threads par cycle d'horloge. Les 512 coeurs Cuda de Fermi utilisent par ailleurs un calcul en virgule flottante plus performant que l'architecture des précédentes architectures de Nvidia. Ils sont en particulier capables d'exécuter des calculs arithmétiques en double précision, une technique essentielle, par exemple, pour le calcul haute performance des applications de simulation.