ATI Radeon 2000 family architecture – architettura della famiglia 2000 – ATI Radeon HD 2900XT

Bene bene, per cominciare un saluto a tutti. Continuiamo per ora a parlare di schede video… per non sembrare di parte parliamo un po’ di ATI che di recente è stata assorbita da AMD e che si è proposta sul mercato con la nuova famiglia 2000. Noi in questo articolo parleremo di quest’architettura ed analizzeremo i suoi punti chiave con riferimento alla scheda che per ora è l’unica di questa famiglia presente sul mercato, ovvero la Ati Radeon HD 2900 XT (tra poco dovremmo vedere anche la comparsa della 2400 e della 2600).

 

Diciamo anzitutto che questa scheda doveva uscire molto prima, e, purtroppo si è trovata a competere con NVidia 6 mesi dopo rispetto alle aspettative. Questo naturalmente ne ha decretato la sconfitta… Se però si guarda il rapporto prezzo qualità ATI risulta migliore rispetto ad Nvidia, e la 2900 ne è la conferma…

Entriamo ora nel vivo dell’articolo, parlando di cosa fa questa scheda e come…

Anche nella 2900XT sono state introdotte le directX10. Non mi dilungherò a parlare di queste librerie dato che è già stato fatto in articoli precedenti. Anche ATI come NVidia disse che la transazione sui processori unificati per il processamento degli shader sarebbe avvenuta solamente se ve ne era la reale necessità. Vediamo che questa necessità si è sentita, un po’ per tentare di preparare l’architettura delle future schede, un po’ per seguire la rivale nelle regole di mercato. C’è anche da dire che per entrambi i produttori questo passaggio non è avvenuto in un colpo solo ma seguendo diversi scalini. Nel caso di ATI è stato introdotto un dispacher universale per i processori che si occupano dei pixel (chiamato Ultra Threaded Dispatch Processor) con la sua famiglia X1000, sul fronte NVidia invece si facevano funzionare diverse parti della scheda a diverse frequenze nella famiglia 7…

Anche sul fronte della grafica integrata come quella SiS o Intel non si esclude la presenza futura di unified shaders…

L’origine di questa architettura è nata dal progetto Xenon di Xbox 360, anche se il primo produttore a realizzarlo su una scheda video è stata NVidia. Il punto fondamentale della nascita di quest’architettura è quello di creare un modello che sia il più possibile scalabile, e che solamente tramite dei tagli ai componenti si possano definire le schede per le varie fasce di utenza (bassa – media – alta).

 

Qui abbiamo lo schema delle parti logiche della scheda:

 

 

Come abbiamo già detto il cuore di questo modello è l’ultra threded dispatch processor, che stando alle specifiche fornite da ATI è in grado di sincronizzare migliaia di processi. Questa funzionalità è stata introdotta causa la notevole quantità di dati e istruzioni che nelle moderne schede video sono indispensabili per dare immagini il più possibile reali.

Gli stream processor sono divisi in 4 blocchi SIMD ognuno dei quali contiene 16 stream processor, per un totale di 48. Ognuno di essi è realizzato con 5 ALUs. Tutte e cinque sono in grado di effettuare un’operazione Floating point MAD per ogni ciclo di clock, una invece può anche fare operazioni trascendentali (SIN, COS, LOG, EXP…).

I texture processor sono stati messi al di fuori della pipeline di esecuzione (come nella x1000), e compaiono nel disegno come 4 blocchi piuttosto larghi, ognuno dei quali consiste in 8 texture address processors, 4 texture filter units, 20 texture samplers. Al contrario di NVidia, qui nessun blocco ha la propria cache: tutti sfruttano una cache comune L1, una cache comune L2 e una vertex cache anch’essa comune.

La parte di rendering dell’R600 è stato implementato da 4 processori piuttosto complessi in grado di effettuare le comuni operazioni di rastering: AntiAliasing, Anisotropic filtering, blending (mescolamento delle texture).

 

Balzano algi occhi delle differenze sostanziali di ATI rispetto ad NVidia:

  1. Al contrario di NVidia, ATI non ha inserito un alto numero di processori con compiti standard e un alto numero di controller, ma ha preferito inserire una quantità minore di circuiti di questo o quel tipo. D’altra parte si prevede che NVidia insisterà con la sua scheda almeno fino alla fine del 2008, data la quantità rigida di processori di esecuzione, mentre ATI sarà costretta a reinvestire in R&D (ricerca e sviluppo).
  2. Realizzare 4 parti dedicate alle texture significa farle molto potenti. Questo indubbiamente non va bene se l’applicazione è sbilanciata su un tipo particolare di texture dove la grande maggioranza dei transistor non viene toccata, andando così incontro ad un collo di bottiglia. Tuttavia, implementare più circuiti significava creare un dispatcher molto complesso… diciamo quindi che si è guardato un buon rapporto prestazioni complessità.

Il dispatcher è stato progettato in modo che assegni le risorse in modo omogeneo, stando attenti affinché nessuna parte venga lasciata idle (ovviamente sempre che ci sia da fare il compito di un certo circuito). Rispetto a quello della serie 1000 questo dispatcher è molto più complesso e efficiente. Per compararli diciamo che quello dell’ R580 – X1900 poteva gestire 512 processi simultaneamente da 16 pixel ognuno, questo invece della serie HD2900 può gestirne diverse migliaia ma da 5 pixel ciascuno.

 

 

Un’altra importante differenza del dispatcher è quella che non distribuisce le risorse nell’ambito texture e pixel, ma anche in quello vertex e geomerical dinamicamente. E’ da dire comunque che alcuni compiti sono stati tolti, per esempio quello di convertire i comandi esterni in comandi eseguibili dall’hardware (questo compito è del comand processor) oppure quello di creare le diverse code dei vertex geometrical e pixel shader (questo compito è del setup engine).

 

Altra cosa che stupisce è la differenza tra un shader processor ATI o NVidia serie 8000 (il primo è molto più complicato). Ricordiamo che nell’R500 in ogni pixel processor ci stavano 2 ALU scalari e 2 vettoriali e una branch execution unit (per i salti). Ogni ciclo di clock veniva impiegato per eseguire 4 istruzioni più un salto. Il nuovo processore integra 5 ALU FP MAD (multiply ADD), capaci ognuna di 1 istruzione per clock. Al totale delle operazioni si aggiunge un’operazione trascendentale (se presente) calcolata dall’ALU dedicata. Esiste poi una sesta unità dedicata ai branch (introdotta dall’R520 e che controlla il ciclo delle istruzioni come i loop), i grado di lavorare in simbiosi con il dispatcher per accelerare dinamicamente l’esecuzione del codice.

 

Come si vede dalla figura ogni sotto unità ha accesso a dei registri general purpose (ovvero dei registri in cui ci può stare di tutto). Tuttavia il modo con cui i dati vengono trasferiti e il numero di questi registri è per ora rimasto un segreto. Possiamo solo dire che maggiore è il numero di registri maggiore è la quantità di calcoli che si possono realizzare senza dipendere da entità esterne. Ricordiamo che all’interno dei 128 stream pocessor di NVidia (di cui l’architettura reale rimane un mistero) si possono effettuare 2 operazioni scalari MAD + MUL per ciclo. Per questo le architetture non sono totalmente comparabili… Il totale delle operazioni è simile solo perché considerato a diversi range di frequenza che generano 520 GigaFlops per NVidia, 475 per ATI (entrambi stimati ).

 

Per quanto riguarda il numero di TMU è rimasto lo stesso della 1950 XTX ovvero 16 (peccato poiché era cosiderato il suo collo di bottiglia). Se confrontiamo con NVidia le texure units di quest’ultima sono 64… per quanto riguarda le texture address units abbiamo 4 processori con 8 per ognuno in ATI e 8 processori con 4 per ognuno in NVidia (da voci non confermate sembrerebbe che il filtraggio delle texture sia leggermente più veloce in NVidia nonostante la quantità simile di componenti dedicati).

 

 

Il texture processor del Radeon HD 2000 è una parte integrata implementata come segue:

 

  • 8 texture address units to calculate the address to sample
  • 20 texture samplers
  • 4 texture filter units

Il nuovo texture processor supporta il filtraggio di texture FP32 che nella serie x1000 non era supportata; supporta inoltre texture in formato 8192×8192 e RGBE 9:9:9:5 come imposto dalle DirectX10. Un merito a ATI per la qualità del filtro anisotropo che è davvero eccezionale.

 

Per migliorare i tempi di latenza è stata ingrandita la cache che ora monta un quantitativo di 256kB per la 2900 (R600) e 128kB per la 2600 (RV630). Per la 2400 (RV610) non si hanno molte informazioni: si sa che usa una cache condivisa per i vertex e per le texture ma non si sa a quanto ammonti.

 

Nonostante le texture siano un po’ lente nell’essere processate, si possono avere notevoli prestazioni grazie all’intelligenza del dispatcher e di alcuni algoritmi particolari come ad esempio il Fetch4 (questo algoritmo in particolare accelera di 4 volte il campionamento di indirizzi adiacenti).

 

Vediamo meglio come funzionano nell’R600 le diverse texture mapping units.

 

Come già detto il controller è cambiato totalmente in un modo rivoluzionario. La prima generazione di ring bus controllers (ovvero i controllori ad anello che parlano a turno tramite token) aveva per le versioni più potenti un bus ampio 256 bit. La nuova versione usa 4 bus di questo tipo insieme per un totale di 1024 bit. E’ cambiato molto anche il modo di effettuare il controllo sul ring bus, in particolare si è passati da un controllo centralizzato della famiglia x1000 ad un controllo totalmente distribuito per la HD 2000.

 

 

Come si può vedere dal disegno il bus ha 4 stop per ogni anello dove arrivano e partono le informazioni da e verso il core e da e verso la memoria. Il quinto stop serve per connettere il dispositivo con l’interfaccia PCI-E, richiesta dall’architettura dell’HyperMemory (ovvero quella particolare architettura per la quale la memoria della scheda video viene sostituita da quella del pc in un certo quantitativo – equivalente nella logica al turbocache di NVidia). I bus vanno sempre in un verso e non in full duplex, tuttavia è possibile usare 2 bus in una direzione e 2 in un’altra come indicato nel disegno per simulare una full duplex. Al momento non sono a conoscenza se sia possibile cambiare dinamicamente il verso dei buses… Il bus che da sull’esterno è il più grande attualmente in commercio e vanta 512bit (anche per avere un maggiore traffico con la memoria nel caso di bisogno).

 

Apro una partentesi…Questa cosa fa un po’ pensare, nel senso che ATI porge molti dati sul bus (il discorso è lo stesso per NVidia anche se per i suoi 384 bits)… ma questo traffico che scopo ha ? O la scheda non è abbastanza ricca di memoria (accidenti non ha abbastanza !!!) oppure l’iniziativa è stata presa per condividere in parte i calcoli con la CPU e quindi l’obiettivo era quello di usare come deposito temporaneo la ram per il calcolo distribuito… Io sono propenso a questa seconda ipotesi, infatti sembra che i prodotti come la Quadro o la FireGl destinati ad un mercato di workstation professionali della computer graphics in realtà non vengano più costruiti con degli standard propri (non almeno in modo sostanziale) ma usino gli stessi dei modelli desktop. Dato che per un’azienda è molto più semplice realizzare prodotti simili per poi differenziarli in seguito anzi che costruire due tipi diversi di scheda dall’inizio, ecco il motivo di bus così ampi… Chiudo la parentesi….

 

Parliamo ora delle Render back-end o in altri termini delle ROPs. Esse sono 4 e si occpuano di fare il raster dell’immagine applicando filtri come antialiasing, blending, processare le informazioni di alcuni buffer come quelli color e stancil (quest’ultimo è un buffer extra che viene aggiunto nelle moderne architetture video per dare una mano nella rendering pipeline, mantenendo informazioni particolari come quelle delle ombre). Deve essere anche in grado di comunicare con l’alpha bus e buffer (che hanno il compito di comunicare le informazioni riguardanti la trasparenza). Per inciso la trasparenza viene realizzata a livello di software o di hardware tramite immagini in bianco e nero con diverse sfumature di grigio che indicano in che modo quella particolare parte dell’immagine deve essere opaca rispetto alla visibilità completa che di default è la parte bianca o invisibile che è la parte nera.

 

Ogni processor (4 in totale) contiene 4 alpha channel subunits, 8 depth / stencil subunits, 4 blending subunits, e 16 subunits programmabili per l’antialiasing.

 

 

Detto terra terra, se non guardiamo ai diversi compiti che i diversi circuiti svolgono possiamo dire che si hanno in totale 16 ROPs. Altrimenti guardando più in dettaglio:

 

  • 4 subunits per operare calcoli su alpha channel(per lo più trasparenza) e nebbia
  • 8 subunits per eseguire calcoli sulla profondità dei pixel (non di colore ma fisica, intesa anche come Z) e stencil buffers (ombre)
  • 4 blending subunits (il mescolarsi della texture)
  • 16 subunits for multisampling (per togliere gli spigoli dovuti alla griglia rettangolare di pixel)

Per compensare la mancanza di ROP ATI ha preferito farle lavorare lavorare a una frequenza superiore rispetto alla sua rivale NVidia: 740 MHz Radeon HD 2000, 576MHz GeForce 8800 GTX, 513 MHz GeForce 8000 GTS.

 

Anche ATI come NVidia nonostante il filtro FSAA desse buoni risultati ha deciso di implementarne un altro che sfruttasse al massimo le directX10. Da questo studio è nato il CFAA. Quest’ultimo si divide in tre tipi differenti di AntiAliasing:

 

  • CFAA con wide tent filter
  • CFAA con narrow tent filter
  • CFAA con adaptive edge detect capability

Detto in parole povere questo nuovo modo di filtrare è basato sull’allargamento del sampling. Nel primo caso con un ellisse piuttosto piccola, nel secondo con un ellisse più grande. Qui riportiamo le immagini dei primi due filtri e il riferimento ad un sampling normale (MSAA):


 

L’ultimo filtro è un ulteriore passata in grado di distinguere i bordi grazie al contrasto e di applicare di conseguenza l’antialising. E’ da verificare che questo sia veramente una buona cosa… in effetti se da una parte rende l’immagine gradevole se ha molti dettagli, la rende terribilmente offuscata se i dettagli differiscono poco in contrasto (ad esempio una stanza piuttosto buia)… speriamo che sia stato svolto un buon lavoro 😉

 

Anche dal punto di vista dell’alta risoluzione è stato fatto un grosso passo avanti, gestendo contemporaneamente più DVI in full HD. Sono stati inseriti inoltre altri filtri nativi di encoding – decoding per i filmati in alta definizione con un occhio di riguardo anche al sonoro (nelle passate generazioni non era possibile gestire più flussi audio su diversi DVI). Sulla scheda per questo viene montato un connettore in grado di distinguere i flussi audio (ma non era una scheda video ? xD ) e di trasformare il DVI in HDVI.

 

Qui avete una panoramica dei codec e del connettore:

Non manca nemmeno la tecnologia AVIVO per i contenuti multimediali:

Da notare che ATI supporta sia H.264 che VC-1, che NVidia non fa. Purtroppo non è stato possibile comparare pureVideo HD con Avivo HD, per una mancanza della gestione dell’accelerazione AVIVO HD nel Catalyst…

 

 

Dobbiamo dire che con i prossimi modelli 2400 e 2600 si vedranno delle ulteriori parti dedicate proprio all’alta definizione (deinterlacciamento con contrasto marcato, scaling verticale e orrizzontale, correzione del colore).

 

E’ stato implementato un nuovo sistema (chiamato tessellate) di creazione delle immagini a livello hardware (usato anche da NVidia) in grado di risparmiare lavoro ai disegnatori con poligoni. Questo sistema infatti capisce dove i poligoni scarseggiano e quindi vanno aggiunti… Era noto che la Microsoft aveva richiesto un supporto hardware a questo tipo di operazione, ma non è ancora noto se e quando il sistema di ATI sarà compatibile con quello delle DirectX (avete sotto lo schema). Sembra però che questo sia molto simile a quello implementato sulla XBox 360 (compatibile DirectX9)…

 

 

Tanto per farvi capire che stiamo andando verso l’impossibile osservate la seguente immagine: la parte di sinistra è quella disegnata, quella centrale è dopo il passaggio tessellate e l’ultima è l’immagine con la texture applicata…

 

 

Ovviamente anche questo circuito ha la sua logica… Per questioni di tempo vi lascio solo il funzionamento base:

 

Ora direi che qualche confronto tra modelli non guasta… Eccovi serviti:

 

 

Qui possiamo vedere il design della scheda con e senza il dissipatore:

 

 

 

Poiché il bus esterno è di 512 bit, c’è stato bisogno di un restyling della scheda; i tecnici ATI sono comunque riusciti a stare nelle dimensioni della famiglia precedente. Da questo punto di vista, la scheda appare piuttosto compatta e non un mostro come la 8800 GTX di NVidia… Dopo molti anni di verifiche sembra che ATI abbia raggiunto con questa scheda un ottimo livello di dissipazione, molto simile dal punto di vista estetico a quello di NVidia, tranne per il classico colore rosso di ATI. I componenti sono molto vicini tra loro e non ci sono spazi vuoti: occupano gran parte della scheda il controllore del bus a 512 bit e il regolatore di tensione. Anche in questa scheda viene utilizzato un regolatore di tensione digitale (fece la sua comparsa nella x1950 pro) che però permette di trattare tensioni molto più alte rispetto al suo predecessore (si parla di un consumo intorno ai 140 – 160W). A differenza del classico regolatore, quello digitale opera ad una frequenza anche di alcuni MHz; non fa inoltre uso di condensatori elettrolitici. Il cuore del sistema sono due regolatori PWM ad alta frequenza (Volterra VT1115M) in grado di operare a 1,3 MHz. Gli elementi pilotati da questi controller non sono dei classici transistor MOS, ma dispositivi appositamente studiati (ovvero degli agglomerati complessi) con interfaccia digitale. Giudicando dal numero di induttori, il curcuito di regolazione di tensione usa sette fasi: in questo è possibile assegnare ad un singolo controllore più circuiti da controllare. Nel caso specifico questi sette segnali sono così distribuiti: 3 vengono controllati dal controllore superiore e 4 da quello inferiore. Sei di questi hanno utilizzi nei graphic processor, l’ultimo è invece assegnato alla memoria. Non si esclude la possibilità però che vi sia una fonte di energia a sette fasi e dei controllori di tensione per VDD e VDDQ.

 

———————————————————————————————

Dato che non tutti conoscono il significato di questi termini inserisco un piccolo GLOSSARIO.

Quando si parla di tensioni elettriche si parla di:

Tensioni positive:
Vcc– Tensione di alimentazione di un BJT ( Bipolar Junction Transistor ).
Vdd– Tensione di alimentazione di un FET (Field Effect Transistor).

Tensioni negative / masse:
Vee– Tensione negativa di un BJT (Bipolar Junction Transistor).
Vss– Tensione negativa di un FET (Field Effect Transistor).

Le lettere c,d,e,s derivano dai piedini dei transistor che sono Collector (collettore), Drain, Emitter (emettitore) and Source (esistono inoltre la base e il gate).

Nel caso specifico di ATI le tesioni sono le seguenti:

VDDC: Voltaggio della GPU

MVDDC: Voltaggio del Memory Core Logic

MVDDQ: Tensione di memoria assicurata agli amplificatori dell’uscita della memoria della scheda video.

VTT: Voltaggio del Termination Tracking della scheda video.

Altri termini che si possono incontrare sono:

VCore: Voltaggio che di solito è riferito alla CPU (potrebbe essere anche della GPU). Di solito non è riferito al Northbridge.
VDD: Specialmente nelle schede grafiche è il voltaggio del Northbridge o degli input buffer o dei core logic chip delle memorie

VDDQ: E’ il voltaggio in uscita dai buffer

VTT: Tracking Termination Voltage. Comparato con una tensione di riferimento permette di capire se il segnale è alto o basso (Hi/Lo)
VMem: Tensione di alimentazione delle memorie
VDDR, VDimm: Stessa cosa però fornita dalla scheda madre

VRef: è la tensione di riferimento (detta anche di soglia). Di solito è pari alla metà del VDDQ

VGPU: Tensione di alimentazione della Graphic Processor Unit

———————————————————————————————

 

L’alimentazione esterna è affidata a due connettori ma a differenza della GeForce sono a 8 pin. La compatibilità con i connettori a 6 pin è garantita ma non consigliata poichè alcune funzioni di controllo di temperature voltaggi ecc. in fase di overclocking all’interno del catalyst potrebbero non essere disponibili. Non abbiamo dei dati relativi a come il voltaggio è distribuito sui connettori ma si ipotizza metà per uno. Da dei test risulta che la portata di questi connettori può arrivare anche a 225W, per questo si è abbastanza sicuri che i connettori non cambieranno nelle prossime schede dato che la potenza necessaria fornita da quelli attuali è più che sufficiente anche per futuri utilizzi. Dati i circuiti impiegati ci si sente abbastanza sicuri nell’affermare che un overclock è possibile (e anche un overvolt – mi raccomando avete per le mani una scheda che costa un pochino -), e anzi è stato previsto anche in fase di costruzione (basse frequenze e voltaggi di serie per alcuni componenti).

 

Questa scheda sfoggia un bel adattatore di cui abbiamo già parlato; sono presenti inoltre un connettore VIVO/YPbPr a 9 piedini (incompatibile con S-Video) e due connettori dual-link DVI-I. Il primo grazie al connettore è in grado di fornire anche audio AC3 con l’interfaccia HDMI. Sfortunatamente per i maniaci dell’audio lo stream è di soli 16 bit (anzi che di 24 come le schede semiprofessionali) a 48KHz (i maniaci arrivano anche a 96…). Si pensa comunque che le cose possano cambiare tramite l’applicazione di driver particolari (AMD tuttavia non ha spiaccicato una parola a riguardo).

 

 

Per quanto riguarda la dissipazione come si vede la ventola è di tipo radiale (detta anche centrifugal o blower) che prende l’aria dalla parte centrale del case, la butta all’interno degli spazi sopra i componenti (tramite le pipe) e la fa fuoriuscire all’esterno tramite la griglia sopra i dual DVI. Questo tipo di ventola sta riscontrando un gran successo rispetto alle classiche ventole, pricipalmente perché garantisce un flusso continuo e abbastanza potente e perché non genera turbolenze (entro certi limiti)…

 

Un sistema di raffreddamento uguale è utilizzato anche da NVidia (con gli heatsink ovvero dissipatori di calore molto lunghi e le alette molto vicine). Differente da NVidia questo sistema di raffreddamento usa i copper heatsink (ovvero i dissipatori in rame) che abbassano le temperature in modo migliore (per questo anche se il dissipatore è più piccolo rispetto a quello di NVidia dissipa più calore per unità di spazio) ma purtroppo contribuiscono ad un aumento generale del peso…

 

Vi sono poi le heatpipe che hanno il compito di distribuire il flusso d’aria fredda lungo tutto il dissipatore. La base più fredda è a contatto con una struttura in acciaio che ne consente l’assemblaggio con 4 viti. Vi è il classico grasso termico grigio per collegare le diverse parti. Il PCB è protetto da una piastra sul resto per impedirne piegamenti accidentali. C’è poi un ulteriore strato di alluminio ed è quello dove sono disegnate le fiamme sotto il quale stanno i chip delle memorie. La velocità della ventola è controllata da un controller che esegue calcoli continui in base alla temperatura (come al solito insomma per diminuirne la rumorosità se non necessaria).
Uno sguardo al rumore di questa scheda (sottrarre 36dBA presenti in laboratorio al momento del test).

 

 

 

Uno sguardo anche ai consumi (che belle stufette 😀 ):

 

 

Ok ok ho capito volete vedere qualche immagine :D. Eccovi accontentati:

 

CFAA 4x vs. MSAA 2x

Half-Life 2

Radeon HD 2900 XT

Radeon X1950 XTX

GeForce 8800 GTX

CFAA 4x

MSAA 2x

MSAA 2x

Elder Scrolls: Oblivion

Radeon HD 2900 XT

Radeon X1950 XTX

GeForce 8800 GTX

CFAA 4x

MSAA 2x

MSAA 2x

 

————————————-

 

MSAA 4x vs. MSAA 4x

Half-Life 2

Radeon HD 2900 XT

Radeon X1950 XTX

GeForce 8800 GTX

MSAA 4x

MSAA 4x

MSAA 4x

Elder Scrolls: Oblivion

Radeon HD 2900 XT

Radeon X1950 XTX

GeForce 8800 GTX

MSAA 4x

MSAA 4x

MSAA 4x

 

————————————–

 

CFAA 6x vs. MSAA 6x

Half-Life 2

Radeon HD 2900 XT

Radeon HD 2900 XT

Radeon X1950 XTX

CFAA 6x w. Narrow tent

CFAA 6x w. Wide tent

MSAA 6x

Elder Scrolls: Oblivion

Radeon HD 2900 XT

Radeon HD 2900 XT

Radeon X1950 XTX

CFAA 6x w. Narrow tent

CFAA 6x w. Wide tent

MSAA 6x

 

———————————————

 

CFAA 8x vs. MSAA 8x vs. CSAA 8x vs. CSAA 8xQ

Half-Life 2

Radeon HD 2900 XT

GeForce 8800 GTX

CFAA 8x

CSAA 8x

MSAA 8x

CSAA 8xQ

Elder Scrolls: Oblivion

Radeon HD 2900 XT

GeForce 8800 GTX

CFAA 8x

CSAA 8x

MSAA 8x

CSAA 8xQ

 

———————-

CFAA 12x vs. CFAA 16x vs. CSAA 16x vs. CSAA 16xQ

Half-Life 2

Radeon HD 2900 XT

GeForce 8800 GTX

CFAA 12x

CSAA 16x

CFAA 16x

CSAA 16xQ

Elder Scrolls: Oblivion

Radeon HD 2900 XT

GeForce 8800 GTX

CFAA 12x

CSAA 16x

CFAA 16x

CSAA 16xQ

————————————————

 

Ecco qualche esempio di filtraggio anisotropo

 

Anisotropic Filtering

Radeon HD 2900 XT

Radeon X1950 XTX

GeForce 8800 GTX

Default Quality

High Quality

High Quality

 

Qualche grafico di performance:

 

 

 

 

 

Scene Fill Rate

 

 

Pixel Shader Performance

 

 

 

 

 

Per correttezza riporto anche i risultati ottenuti con XBitMark che risultano più favorevoli a ATI rispetto che quelli fatti con 3DMark.

 

 

Ribadisco che durante la stesura mi sono tenuto obiettivo, in modo da offrirvi i dati reali delle schede video (sia con la 8800 GTX che con la 2900XT), e permettervi la scelta ottimale per il vostro utilizzo quotidiano (ovviamente qui stiamo parlando del top ma penso di avervi dato gli strumenti per capire le differenze anche con le altre fasce di utenza).

 

Con questo saluto tutti i lettori che sono arrivati fin qui a leggere senza stufarsi, e come al solito appuntamento al prossimo articolo !

 

 

(fonte xbitlabs)

by Hochwart

Annunci

~ di Hochwart su giugno 29, 2007.

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...

 
%d blogger hanno fatto clic su Mi Piace per questo: