Les cartes Radeon HD 2000 sont équipées de la première génération de puces graphiques exploitant l'architecture parallèle TeraScale. C'est en réalité une architecture déjà utilisée dans la puce graphique de la Xbox 360, Xenos. La HD 2900 XT, premier modèle de cette série, combine donc l'architecture parallèle avec les capacités de l'architecture précédente des R500 (les Radeon X1900). Il est assez difficile de comparer une carte Radeon avec une carte GeForce, car même si l'architecture est identique, elle n'a pas été conçue de la même manière. Alors que Nvidia s'appuie sur une architecture unifiée dite scalaire, ATI s'appuie sur une architecture vectorielle.
Il est vrai que le nombre de processeurs de flux (stream processors) de la HD 2900 XT est bien supérieur à celui des puces G80 qui animent les GeForce 8800 : 320 unités contre 128, mais ce serait encore une erreur de comparer simplement ce nombre. En étant vectorielles, les unités de shaders (ou stream processors) sont unifiées par groupe (alors que chez les scalaires, ce n'est pas le cas). Les R600 HD 2900 qui ont 320 unités de shaders ont en fait 80 unités de shaders par groupe de 4 SIMD + 16 Shaders Processors + 5 Stream Processors, ce qui fait donc 320 unités au total réparties par groupe par 5 blocs de processeurs de flux contenant 4 SIMD de 64 unités de calcul (donc 320 pour la version haut de gamme). Malgré cette particularité, les HD 2000 ne se montrent pas aussi performantes que l'on espérait, et la GeForce 8800 GTX se montre largement supérieure, du fait peut-être que le scalaire est plus efficace sur le vectoriel, mais aussi par le nombre trop faible d'unités TMU et de ROP : seulement 16 unités comparées aux 32 TMU et 24 ROP des G80. Un autre défaut est la consommation élevée des HD 2900, dépassant les 200 watts pour la version haut de gamme, la HD 2900 XT.
Radeon HD 3000
Les cartes Radeon HD 3000 sont issues des HD 2000, mais avec les défauts corrigés. La HD 3870 se montre meilleure que la HD 2900 XT et même à la hauteur de la 8800 GTX. Grâce aux corrections effectuées et à la gravure plus fine de la puce (55 nm), la série des HD 3000 aura 2 cartes bi-GPU : les Radeon HD 3850 X2 et HD 3870 X2, qui se montreront avec des performances plus que raisonnables, mais surtout une consommation très bien maitrisée. De plus, les HD 3000 sont également la première série de cartes graphiques à prendre en charge le PCI Express 16x 2.0. Elles prendront en charge également le version 10.1 de DirectX. Les Radeon HD 3000 sont également la première série des Radeon à prendre en charge les calculs FP64 (Double précision 64 bits).
Les Radeon HD 3800 ont un ratio de puissance entre les calculs à virgule flottante simple et double précision qui est de 1/5, c'est-à-dire que la puissance théorique de calcul en double précision est égale à 1/5 de la puissance théorique de calcul en simple précision. Ce ratio vient de l'architecture de la puce et du nombre de processeurs de flux capables d’effectuer ces opérations. Ainsi, la RV670 qui possède en tout 320 processeurs de flux a cette organisation : 64 unités sont capables d'effectuer de la double précision, tandis que les 256 restantes ne peuvent faire que de la simple précision. Bien sur, les 64 unités concernées sont également capables d'effectuer de la simple précision.
Exemple : Un programme demande d'effectuer des calculs en simple précision, les 320 processeurs de flux seront donc en activité sans problème. Un autre programme exige de la double précision, seuls 64 seront en activité.