Mitä DirectCompute tarkoittaa pelaajien kannalta?
Artikkelin kirjoittaja: Teemu Laitila | 1 kommentti
Olemme jo pitkän aikaa yrittäneet saada AMD:tä esittelemään meille GPU-laskentaa ja sen todellisia käyttökohteita pelimaailmassa. Viimeinkin yhtiö vastasi pyyntöihimme ja tarjosi apuaan DirectCompute-laskennan merkityksen avaamisesta pelaajien kannalta..
Olemme jo pitkään lähestyneet laite- ja ohjelmistovalmistajia aikomuksena ottaa selvää OpenCL- ja DirectCompute-tekniikoiden merkityksestä tosielämän käyttötilanteissa. Tähän mennessä tulokset ovat kuitenkin jääneet melko pintapuolisiksi eikä kertyneistä tiedoista ole juuri ollut raportoitavaa. Olemme toki ajaneet Metro 2033:n testejä käyttäen DirectCompute-pohjaista syvyysterävyyssuodinta. Ainut testeistä syntyvä johtopäätös on kuitenkin ollut "kylläpä suorituskyky laskee ryminällä".
Tilanne on kuitenkin viimeinkin muuttumassa. Yhä useammassa pelissä hyödynnetään DirectCompute-laskentaa jollain tapaa. Tässä artikkelissa käydään läpi neljä eri peliä: Battlefield 3, DiRT 3, Civilization 5 ja tietysti Metro 2033. Toisin kuin useimmissa Tom's Hardwaren testeissä, tällä kertaa pääasiallisena tutkimuskohteena ei ole raaka laskentateho tai tiettyjen komponenttien testaus. Saimme testiin paljon apua AMD:lta, joka tarjosi teknistä neuvontaa sekä avusti yhteistyötä eri sovelluskehittäjien kanssa, joten testissä keskitytään lähinnä AMD:n omiin APU-suorittimiin, joita verrataan erillisiin näytönohjaimiin. Tarinan taustalla on kuitenkin suurempi ajatus kuin ruudunpäivitysnopeuksien mittaus. Haluamme tarkastella millaisilla tekniikoilla tulevaisuudessa mahdollistetaan täysin uusi realismin taso, josta ei ole voitu edes haaveilla ennen GPU-pohjaisten laskentatekniikoiden kehittämistä.
Pelkkä laitteistoversion päivittäminen ei johda peleissä enää samoihin tuloksiin, jollaisia nähtiin takavuosina, kertoo AMD:n kehittäjäsuhteita hoitava Neal Robinson. Aiemmin sovelluskehittäjien ei juuri tarvinnut uudelleen suunnitella ohjelmistojaan, koska pelkät laitteiston päivitykset pitivät nopeudet kasvussa ja suorituskyky monesti jopa kaksinkertaistui sukupolvien välillä. Nykyään tekniikkaa kuitenkin kehitetään kasvattamalla ytimien määrää verrattuna aiempaan kehityskulkuun, jossa nopeuslisä saavutettiin yksittäisten ytimien tehoja kasvattamalla. Se tarkoittaa sitä, että kehittäjien on tehtävä muutoksia ohjelmistoihinsa, jotka saattavat vaatia suuriakin muutoksia entisiin arkkitehtuureihin. Heterogeeninen laskenta on tulevaisuudessa avainasemassa ja sen avulla kehittäjät pääsevät hyödyntämään viimeisenkin pisaran prosessorin tehosta.
Robinsonin arvio heterogeenisen laskennan tulevaisuudesta tuntuu uskottavalta ainakin kun puhutaan Adobe Premiere Pro CS5:n kaltaisista sovelluksista (ja erityisesti sen CUDA-tuellisesta Mercury-moottorista) ja videon transkoodauksesta. Molemmat rinnakkaislaskentaan nojaavat tehtävät hyötyvät suuresti kun ne optimoidaan käyttämän näytönohjainten laskentatehoja. Tähän mennessä emme kuitenkaan ole nähneet oikeita esimerkkejä DirectCompute- tai Open CL -tekniikoiden hyödyntämisestä peleissä. Peleissä molemmat rajapinnat antavat kehittäjille uusia työkaluja todellisuuden mallintamiseen. Olemme edelleen kiinnostuneita siitä, miten uusimmat pelit hyödyntävät heterogeenisen laskennan tekniikoita ja mitä tulemme näkemään tulevaisuudessa. Näihin kysymyksiin vastaaminen edellyttää keskustelua kehittäjien itsensä kanssa.
Ennen syventymistä tarkempiin vastauksiin käydään läpi muutama asia suorituskykyyn liittyen. Kuten aiemmissa testeissä on nähty, nykyisillä APU-suorittimilla on selvät rajansa. Me olemme testanneet Metroa, Battlefieldiä ja DiRT 3:sta ja jokaisen pelin kohdalla suorituskyky oli vain välttävää 1024x768 resoluutiolla ja vähimmäismäärällä yksityiskohtia. Tilanne ei tule paranemaan sillä, että osa OpenCL- ja DirectCompute-laskennasta sysätään näytönohjaimen vastuulle. Sen sijaan se saattaa kuitenkin mahdollistaa tilanteen, jossa yhä useampi peli pyörii pelattavalla tasolla APU-pohjaisella kannettavalla.
Kannattaa kuitenkin muistaa, että seuraavan parin kuukauden aikana Intel julkaisee uuden prosessorisukupolven ja AMD:n Trinity-pohjaiset APU:t ovat myös tuloillaan. Uusien sukupolvien myötä suorituskyky tulee kasvamaan ja parempi tuki molemmille laskentatekniikoille tulee parantamaan pelien ulkonäköä entisestään.
Olemme jo pitkään lähestyneet laite- ja ohjelmistovalmistajia aikomuksena ottaa selvää OpenCL- ja DirectCompute-tekniikoiden merkityksestä tosielämän käyttötilanteissa. Tähän mennessä tulokset ovat kuitenkin jääneet melko pintapuolisiksi eikä kertyneistä tiedoista ole juuri ollut raportoitavaa. Olemme toki ajaneet Metro 2033:n testejä käyttäen DirectCompute-pohjaista syvyysterävyyssuodinta. Ainut testeistä syntyvä johtopäätös on kuitenkin ollut "kylläpä suorituskyky laskee ryminällä".
Tilanne on kuitenkin viimeinkin muuttumassa. Yhä useammassa pelissä hyödynnetään DirectCompute-laskentaa jollain tapaa. Tässä artikkelissa käydään läpi neljä eri peliä: Battlefield 3, DiRT 3, Civilization 5 ja tietysti Metro 2033. Toisin kuin useimmissa Tom's Hardwaren testeissä, tällä kertaa pääasiallisena tutkimuskohteena ei ole raaka laskentateho tai tiettyjen komponenttien testaus. Saimme testiin paljon apua AMD:lta, joka tarjosi teknistä neuvontaa sekä avusti yhteistyötä eri sovelluskehittäjien kanssa, joten testissä keskitytään lähinnä AMD:n omiin APU-suorittimiin, joita verrataan erillisiin näytönohjaimiin. Tarinan taustalla on kuitenkin suurempi ajatus kuin ruudunpäivitysnopeuksien mittaus. Haluamme tarkastella millaisilla tekniikoilla tulevaisuudessa mahdollistetaan täysin uusi realismin taso, josta ei ole voitu edes haaveilla ennen GPU-pohjaisten laskentatekniikoiden kehittämistä.
Pelkkä laitteistoversion päivittäminen ei johda peleissä enää samoihin tuloksiin, jollaisia nähtiin takavuosina, kertoo AMD:n kehittäjäsuhteita hoitava Neal Robinson. Aiemmin sovelluskehittäjien ei juuri tarvinnut uudelleen suunnitella ohjelmistojaan, koska pelkät laitteiston päivitykset pitivät nopeudet kasvussa ja suorituskyky monesti jopa kaksinkertaistui sukupolvien välillä. Nykyään tekniikkaa kuitenkin kehitetään kasvattamalla ytimien määrää verrattuna aiempaan kehityskulkuun, jossa nopeuslisä saavutettiin yksittäisten ytimien tehoja kasvattamalla. Se tarkoittaa sitä, että kehittäjien on tehtävä muutoksia ohjelmistoihinsa, jotka saattavat vaatia suuriakin muutoksia entisiin arkkitehtuureihin. Heterogeeninen laskenta on tulevaisuudessa avainasemassa ja sen avulla kehittäjät pääsevät hyödyntämään viimeisenkin pisaran prosessorin tehosta.
Robinsonin arvio heterogeenisen laskennan tulevaisuudesta tuntuu uskottavalta ainakin kun puhutaan Adobe Premiere Pro CS5:n kaltaisista sovelluksista (ja erityisesti sen CUDA-tuellisesta Mercury-moottorista) ja videon transkoodauksesta. Molemmat rinnakkaislaskentaan nojaavat tehtävät hyötyvät suuresti kun ne optimoidaan käyttämän näytönohjainten laskentatehoja. Tähän mennessä emme kuitenkaan ole nähneet oikeita esimerkkejä DirectCompute- tai Open CL -tekniikoiden hyödyntämisestä peleissä. Peleissä molemmat rajapinnat antavat kehittäjille uusia työkaluja todellisuuden mallintamiseen. Olemme edelleen kiinnostuneita siitä, miten uusimmat pelit hyödyntävät heterogeenisen laskennan tekniikoita ja mitä tulemme näkemään tulevaisuudessa. Näihin kysymyksiin vastaaminen edellyttää keskustelua kehittäjien itsensä kanssa.
Ennen syventymistä tarkempiin vastauksiin käydään läpi muutama asia suorituskykyyn liittyen. Kuten aiemmissa testeissä on nähty, nykyisillä APU-suorittimilla on selvät rajansa. Me olemme testanneet Metroa, Battlefieldiä ja DiRT 3:sta ja jokaisen pelin kohdalla suorituskyky oli vain välttävää 1024x768 resoluutiolla ja vähimmäismäärällä yksityiskohtia. Tilanne ei tule paranemaan sillä, että osa OpenCL- ja DirectCompute-laskennasta sysätään näytönohjaimen vastuulle. Sen sijaan se saattaa kuitenkin mahdollistaa tilanteen, jossa yhä useampi peli pyörii pelattavalla tasolla APU-pohjaisella kannettavalla.
Kannattaa kuitenkin muistaa, että seuraavan parin kuukauden aikana Intel julkaisee uuden prosessorisukupolven ja AMD:n Trinity-pohjaiset APU:t ovat myös tuloillaan. Uusien sukupolvien myötä suorituskyky tulee kasvamaan ja parempi tuki molemmille laskentatekniikoille tulee parantamaan pelien ulkonäköä entisestään.
kommentti 1
Mielenkiitoinen artikkeli. Mutta noita ei dx11 kortteja on vielä aika tavalla markkinoilla, joten ei liene vielä useampaan vuoteen isoja uudistuksia tulossa?