Mielipide: AMD:n, Intelin ja Nvidian seuraavat kymmenen vuotta

Artikkelin kirjoittaja: Teemu Laitila | 0 kommenttia

Entäs Intel?


Vaikka Pentium 4 oli yksi Intelin parhaiten myyneistä prosessoreista, sen NetBurst-arkkitehtuuri oli myös poikkeuksellisesti vasta toisella sijalla teknologian kehityksessä. Intel menetti tuolloin sekä markkinaosuutta että mainetta AMD:n paremmille Athlon-prosesoreille. Haifan suunnittelukeskuksesta lähteneen Pentium M –mallin sekä myöhempien Core-mallien myötä Intel on taas saavuttanut johtoaseman prosessoritekniikassa. Core-arkkitehtuuri on itse asiassa jo vuonna 1995 julkaistun P6 "Pentium Pro" tekniikan jälkeläinen, mikä on äärimmäisen vaikuttavaa.



Suunnittelun kannalta Intel ei ole panostanut kaikkia resurssejaan vain yhden alustan varaan. Intel onkin yksi harvoista yhtiöistä, jolla on kaksi tehokasta ja tuottoisaa CPU-arkkitehtuuria. Tällä tarkoitan tietenkin Itaniumia. Kahden vuosikymmenen kehitystyön ja vuosikymmenen markkinoillaolon jälkeen Itanium itse asiassa alkaa tuottaa Intelille. P6-arkkitehtuurin kehittäneestä Intelin Haifan-suunnittelukeskuksesta monet avainasemissa työskennelleet insinöörit siirtyivät itse asiassa Itaniumin pariin. Yhdistettynä HP:n PA-RISC insinööreihin, Itanium-projektilla oli käytössään useita maailman parhaita insinöörejä.




Jo ennen Itaniumin julkistusta Intel linjasi PowerPointeissaan x86-arkkitehtuurin tulevaisuutta: suurempia kellotaajuuksia uusien valmistusprosessien avulla, parannuksia mikroarkkitehtuuriin, CPU:n ja alustan kehitystä ja väyliä paremmalla suorituskyvyllä. Käytännössä se tarkoitti suurempia välimuisteja, korkeampia kellotaajuuksia ja lisää kaistanleveyttä väylille ja useampia prosessoriytimiä, eli kaikkia niitä asioista, joita tämän päivän Nehalem-prosessoreiden suuremissa L3-välimuisteissa, QPI:ssä ja skaalautuvissa ytimien määrissä on nähty. Yhtiöllä oli kaikki suunnitelmat selvillä jo 20 vuotta sitten ja Intellillä tiedettiin, että raja tulee vastaan ennen pitkää. Tämän päivän prosessoreiden lämpötiheys on jo suurempi kuin ydinreaktoreissa ja Mooren laissa pitäytyminen muuttuu huomattavasti vaikeammaksi, kun saavutetaan 5 nm:n valmistusprosessit.

Itanium-arkkitehtuuri syntyi yli kaksi vuosikymmentä sitten juuri sen vääjäämättömästi lähestyvän päivän varalle. Toisin kuin huomattavan suuren osan sirustaan muuhun kuin varsinaiseen laskentaan luovuttavat nykyiset prosessorit, Itanium perustui ajatukselle, että piisirulle tulisi sijoittaa ainoastaan varsinaista laskentaa suorittavat komponentit. Sen sijaan että prosessori pyrkisi vain muutaman kellojakson aikana päättämään tehtävien ajastuksesta reaaliaikaisesti, nämä tehtävät voitaisiin suorittaa jo etukäteen ohjelmistotasolla kääntämisen aikana sekä ohjelmistokehityksessä, kun päätökseen voidaan käyttää enemmän aikaa ja monimutkaisempia algoritmeja. Prosessorit voisivat tällöin luopua perinteisistä jonoista ja ottaa käyttöön Very Long Instruction Word (VLIW) –tekniikan, jossa prosessorille syötetään suorituskyvyn ylläpitämiseksi yhden kellojakson aikana suuria määriä ohjeita kerralla. Kyseessä oli eeppisten mittasuhteiden idea, joten tekniikkaa kutsuttin EPICiksi (Explicitly Parallel Instruction Computing).

Ikävä kyllä HP:n ja Intelin aloittaessa Itanium-projektia, sen toimintaan vaadittavaa kääntäjätekniikka ei ollut edes viellä olemassa. Siitä muodostui itse asiassa huomattavasti vaikeampi projekti, kuin osattiin odottaakaan. Se johti useiden vuosien hitaaseen myyntiin ja huonoon suorituskykyyn. Alkuperäinen Itanium julkaistiin kaksi vuotta aikataulusta jäljellä ja vielä vuosikymmen myöhemmin se vaikutti lähinnä prototyyppiasteen tuotteelta. Itanium 2 julkaistiin taas kaksi vuotta Intelin uudistetusta aikataulusta jäljessä, mutta se kuitenkin toi Itanium-projektin tuoton plussan puolelle. Itanium 3, "Tukwila" on nyt kolme vuotta aikataulusta jäljessä.

Vaikka se onkin myöhässä, se ei tarkoita, että Tukwila olisi epäonnistunut. Intelillä on yli 1000 insinööriä työskentelmässä Itaniumin parissa ja on tärkeää erottaa toisistaan VLIW-itaniumin ydin, sekä ne käytännön toteutuksen ongelmat, joiden perusteella Itaniumia on kutsuttu massiiviseksi epäonnistumiseksi. Itanium ei ole ikinä kyennyt kilpailemaan suoranaisella suorituskyvyllä Opteron tai Xeon –prosessoreiden kanssa. Perinteisillä mittareilla ei kuitenkaan voi edes verrata arkkitehtuuriin sisällytettyjä luotettavuutta parantavia ominaisuuksia, kuten suoraan ytimeen rakennettua lock-step-tekniikkaa, joka käytännössä vastaa RAID-tekniikka prosessoreille. Lock-step-tekniikkalla kaksi prosessoria voidaan synkronoida suorittamaan samoja tehtäviä kellojakson tarkkuudella ja sen jälkeen varmistamaan tulosten samankaltaisuus tai jopa vertaamaan tuloksia toisen prosessorikannan antamiin tuloksiin. HP:n Integrity NonStop-järjestelmät saavuttavat 99, 99999% valmiusajan verrattuna IBM:n palvelinten 99,999%. Vaikka ero tuntuu pieneltä, se tarkoittaa vuositasolla joko IBM:n viiden minuutin vikatilanteita tai Itaniumin saavuttamaa kolmen sekunnin vuositasoa. Tuo ero on tärkeä joillekin yrityksillä ja se on syynä sille, miksi Itanium on kannattava. Ainoastaan markkinoiden puute estää Inteliä valmistamasta halvemman hintaluokan Itaniumia ilman näitä ominaisuuksia.

En usko Itaniumien siirtyvän Xeoneiden tai Opteroneiden markkinoille ihan lähiakoina. Itaniumin omat markkinat luultavasti kasvavat vielä seuraavan vuosikymmenen aikana yhä useampien sairaaloiden siirtyessä sähköisiin potilastietojärjestelmiin ja digitaalisiin kuvantamistekniikoihin. Ne ovat juuri sellaisia organisaatioita, jotka arvostavat 99,999999% valmiusaikaa. Seuravaa Itanium-versio sisältää tuen QPI:lle, samalle linkkitekniikalle jota käytetään tämän päivän Nehalemeissa. Se mahdollistaa perinteisten x86 Xeonien ja Itaniumien käytön samassa järjestelmässä.

Mooren laki ei välttämättä kaadu vielä meidän elinaikanamme. Kun saavutetaan 5 nm:n kokoluokka, elektronien kulku alkaa käydä ennustamattomaksi. Tekniikka ei voi kutistua enää pienemmäksi, joten käännettävä katseet kvanttilaskentaan ja päällekkäisiin siruihin. VLIW/IA64 tulee olemaan valmis paljon ennen kvanttilaskentaa, mutta päällekkäisillä siruilla voidaan saavuttaa tehokas jäähdytys ja tiivisti pakatut transistorit.

Intelin investoinnint Itaniumiin saattavat tuoda hyötyjä myös Larrabeen tulevissa versioissa. Vaikka Larrabeen säikeiden rinnakkaisuus eroaakin Itaniumin VLIW-tekniikan vastaavasta. Silti esimerkiksi kääntäjissä kehitettyä tekniikkaa voidaan hyödyntää molemmissa tapauksissa. Nvidian CUDA-kääntäjä on itse asiassa kehitetty alun perin Itanium-projektia varten rakennetun Open64-kääntäjän pohjalta. Kaikki tämä huomioiden voidaan sanoa, että Intel on siinä kadehdittavassa asemassa, että sillä on yksi parhaita kuluttajaluokan arkkitehtuureita, kuten Core i3/i5/i7 ja yksi parhaita serverikäyttöön suunnitelluista Itaniumin tapauksessa.

Kommentoi artikkelia