Nvidia GeForce GTX 590 3 GB: Nvidia vastaa 1024 CUDA-ytimen voimin
Artikkelin kirjoittaja: Teemu Laitila
Nvidia GeForce GTX 590 3 GB: Nvidian vastaus 1024 CUDA-ytimen voimin
GeForce GTX 590: Nvidia vastaa
Tänään yksi teknologiamaailman huonoiten pidetyistä salaisuuksista astuu viimein kunnolla julkisuuteen. Vai kolme viikkoa AMD:n Radeon HD 6990:n julkistuksen jälkeen, Nvidia haastaa tuoreen johtajan GeForce GTX 590 3 GB -mallillaan. Nvidian mukaan kortti olisi voitu tuoda markkinoille jo yli kuukausi sitten. Mutta tiedämme, että Nvidia päätti viivästyttää julkaisua ja tehdä viimeisiä säätöjä pitkälle maaliskuuhun. Tuloksena on näytönohjain, jonka suunnittelussa on tietoisesti painotettu tyylikkyyttä, heti sen jälkeen kun AMD hakkasi meitä päähän korvia särkevällä tuuletusratkaisullaan.
Hiljaisen jäähdytyksen tavoittelu saattaa kuulostaa epätoivoiselta, ottaen huomioon, että Nvidian Fermi-pohjaiset GPU:t ovat surullisenkuuluisia kuumuudestaan ja tehonkulutuksestaan. Ajatus piirilevystä, jossa on kaksi Fermi-GPU:ta ja joka ei pidä kovempaa meteliä kuin AMD:n kahden Cayman-piirin ohjain kuulostaa uskomattomalta. Silti se on juuri se, mitä Nvidia väittää tehneensä.
Sen saavuttaminen ei ollut helppo tehtävä. Kompromisseja jouduttiin tekemään. Nvidia käyttää esimerkiksi samaa keskelle asennettuun tuulettimeen perustuvaa jäähdytystekniikkaa, josta AMD:tä kritisoitiin. Grafiikkapiirien kellotaajuuksia jouduttiin laskemaan, jota lämpötila pysyisi aisoissa. Pienemmistä kelloista huolimatta kortti käyttää silti enemmän tehoa kuin mikään mitä olemme tähän mennessä testanneet.
Se on silti hiljainen. Hullun hiljainen. Hiljaisin dual-GPU-näytönohjain, jota olen testannut sitten ATI:n Rage Fury Maxx –mallin (onko esimerkki tarpeeksi kaukaa historiasta?) Nvidia siis onnistui tehtävässään hiljaisuuden suhteen. Jäljelle jää kuitenkin kysymys: oliko Nvidian pakko antaa periksi nopeudessa vain näyttääkseen AMD:lle, että kuumatkin kortit voivat olla hiljaisia?
Konepellin alla: kaksi kokonaista GF110-piiriä
Aiemmissa Nvidian kanssa käymissäni keskusteluissa kävi selväksi, että yhtiö halusi käyttää kahta GF110-piiriä eikä se halunnut leikellä niitä. Jos olet lukenut GeForce GTX 580 ja GF100: Niin kuin Nvidia tarkoitti pelaamisen –artikkelin, saatat muistaa että kokonaiset GF110-piirit sisältävät neljä Graphics Processing Cluster -yksikköä, joista jokainen sisältää neljä Streaming Multiprocessor -yksikköä. Jokaisesta SM-yksiköstä löytyy 32 CUDA-ydintä, eli niitä on yhteensä 512 kappaletta GPU:ta kohden. Jokainen SM sisältää myös neljä tekstuuriyksikköä, eli 64 per siru. Jokaisesta SM-yksiköstä löytyy myös yksi Polymorph Engine, joka kuitenkaan ei aiempien kokemusten mukaan ole erityisen tehokkaasti skaalautuva keino lisätä rinnakkaisuutta geometriassa.
GPU:n taustaosiot sisältävät kuusi ROP-osiota joista jokainen suoltaa ulos kahdeksan 32-bittistä kokonaislukupikseliä kerrallaan, mikä tekee 48 pikseliä kellojaksoa kohti. 384-bittinen muistiväylä muodostuu kuudesta 64-bittisestä väylästä, joiden päistä löytyy 256 MB GDDR5-muistia. Se tekee yhteensä 1,5 GB muistia GPU:ta kohti ja siitä päästään GeForce GTX 590:n 3 GB muistimäärään.
Nvidia on liittänyt GTX 590:n GF110-piirit toisiinsa omalla NF200-siltapiirillään, joka multiplexoi yhden 16-kaistaisen PCI Express 2.0 –väylän kahdeksi 16-kaistaiseksi väyläksi jakaen sen GPU:iden välillä.
|
GeForce GTX 590 |
GeForce GTX 580 |
Radeon HD 6990 |
Radeon HD 6970 |
Radeon HD 6950 |
---|---|---|---|---|---|
Valmistuprosessi |
40 nm TSMC | 40 nm TSMC | 40 nm TSMC |
40 nm TSMC |
40 nm TSMC |
Sirun koko |
2 x 520 mm² | 520 mm² | 2 x 389 mm² | 389 mm² | 389 mm² |
Transistoreita |
2 x 3 miljardia | 3 miljardia | 2 x 2.64 miljardia |
2.64 miljardia |
2.64 miljardia |
Ytimen kellotaajuus |
607 MHz |
772 MHz | 830 MHz |
880 MHz |
800 MHz |
Stream-prosessorit / CUDA-ytimet |
1024 |
512 |
3072 |
1536 |
1408 |
Laskentateho |
2.49 TFLOPS |
1.58 TFLOPS |
5.1 TFLOPS |
2.7 TFLOPS |
2.25 TFLOPS |
Tekstuuriyksiköt |
128 |
64 |
192 |
96 |
88 |
Tekstuurien täyttönopeus |
77.7 Gtex/s |
49.4 Gtex/s |
159.4 Gtex/s |
84.5 Gtex/s |
70.4 Gtex/s |
ROPs |
96 |
48 |
64 |
32 |
32 |
Pikselien täyttönopeus |
58.3 Gpix/s |
37.1 Gpix/s |
53.1 Gpix/s |
28.2 Gpix/s |
25.6 Gpix/s |
Näyttömuisti |
2 x 1.5 GB GDDR5 |
1.5 GB GDDR5 |
2 x 2 GB GDDR5 |
2 GB GDDR5 |
2 GB GDDR5 |
Muistin kellotaajuus |
853 MHz |
1002 MHz |
1250 MHz |
1375 MHz |
1250 MHz |
Muistikaista |
2 x 163.9 GB/s (384-bit) |
192 GB/s (384-bit) | 2 x 160 GB/s (256-bit) |
176 GB/s (256-bit) |
160 GB/s (256-bit) |
Enimmäistehonkulutus |
365 W |
244 W |
375 W |
250 W |
200 W |
Millaisia muutoksia tapahtui GeForce GTX 480 –mallissa käytetyn GF100-piirin ja GeForce GTX 580 –mallissa käytetyn uudemman GF110-piirin välillä? Aiemmasta artikkelista:
Ensiksikin grafiikkaydin itsessään on pitkälti sama. Tämä ei muistuta ollenkaan GF100:n ja GF104:n välillä tapahtunutta muutosta, jossa Shader Multiprocessor –yksiköt sijoiteltiin uudestaan paremman suorituskyvyn saavuttamiseksi kuluttajahintaluokassa (eli saavutettiin enemmän tehoa teksturointiin). Kuten edeltäjässään, tässäkin mallissa painotetaan raakaa laskentakykyä. GF110 sisältää itse asiassa vain kaksi uutta ominaisuutta: täyden nopeuden FP16-suodatus ja paranneltu Z-puskurointi.
GF110 pystyy suorittamaan FP16-tekstuurisuodatuksen yhden kellojakson aikana (kuten myös GF104), kun GF100 käytti siihen kaksi kellojaksoa. Tekstuurirajoittuneissa ohjelmissa tämä saattaa näkyä parempana suorituskykynä. Z-puskuroinnin parannukset parantavat suorituskykyä niissä peleissä, joissa tapahtuu paljon tarpeetonta näkymättömien kappaleiden renderöintiä parantamalla muistikaistan tehokasta käyttöä. Nvidian mukaan näillä parannuksilla saavutetaan noin 14 prosentin tehonlisäys kellojaksoa kohti.
Näiden muutosten lisäksi kyseessä on edelleen TSMC:n 40 nm:n valmistusprosessin tuotos, joka sisältää karkeasti ottaen kolme miljardia transistoria. 520 neliömillimetrin pinta-alallaan GF110 on huomattavasti suurempi kuin AMD:n Cayman-piirit, joiden pinta-ala on vain 389 neliömillimetriä sisältäen 2,64 miljardia transistoria.
On hienoa, että Nvidia on saanut kaikki käytössä olevat resurssit sisällytettyä kahteen kertaan GeForce GTX 590 –ohjaimeen. GeForce GTX 580 –mallissa käytetään kuitenkin 772 MHz:n kellotaajuutta ytimen osalta ja 1002 MHz:n muistien osalta, kun taas GTX 590:n tapauksessa kelloja on jouduttu laskemaan 607 MHz:n ja 853 MHz:n.
Näiden muutosten jälkeen tämän kortin suorituskyky ei yllä niihin lukemiin, joita kahdelta Nvidian nopeimmalta yhden GPU:n lippulaivamallilta voisi odottaa. Se saattaa olla silti riittävästi. AMD julkaisi Radeon HD 5970:n nimenomaan GeForce GTX 570:n kilpailijaksi, 580 jäi täysin omaan luokkaansa suorituskykynsä puolesta. Vaikka Radeon HD 6990 onnistuu lähes tuplaamaan yhtiön nopeimman yhden GPU:n kortin tehot, GeForce GTX 590:n ei tarvitse yltää samaan ollakseen kilpailukykyinen 700 dollarin hintaluokassa, johon AMD oman korttinsa sijoitti.
Tiedämme jo millaisiin toimiin AMD:n piti ryhtyä saavuttaakseen ”maailman nopein näytönohjain” arvonimen. Miten Nvidia vastaa haasteeseen?
Kommentoi artikkelia
Kirjaudu sisään