Vastaus: PS3:sta uutta tietoa eDomessa
Kannattaa huomata, että kaikki tämä asia on vielä vahvistamatonta spekulaatiota ja valistunutta arvailua, koska patentteja kummempaa tietoa ei PS3:sta ole kovin paljon herunut.
sawe sanoi:
Nvidian mukaan kortti sisältää enemmän ominaisuuksia kuin 6- sarja, ja on myös tehokkaampi, eli transistorimäärän täytyy olla suurempi kuin nykyisissä 6- sarjan piireissä.
Kuinka rakentaa moiset ominaisuudet konsolimaisesti eli edullisesti, Nvidian nykyisiäkään transistorimääriä kun ei halvalla tuoteta ?
Vastaus: PS3 ei ole PC.
Itse voisin spekuloida, että grafiikkapiiri ei välttämättä ole transistorimäärältään merkittävästi suurempi kuin nykyiset PC:n megamyllyt. PS3 todennäköisesti on arkkitehtuuriltaan vielä kauempana perinteisestä PC:stä kuin PS2. Hyvin mahdollisesti grafiikkapiiri ei PS2:n tyyliin sisällä ollenkaan geometriaprosessointia, koska muualla laitteessa on enemmän kuin tarpeeksi tehoa sitä varten, ja sen muistiratkaisukin on melko varmasti erilainen. Tietysti seuraavan sukupolven konsolien odotetaan pyörittävän myös HDTV-resoluutioita, mutta se suurinkin HDTV-resoluutio eli 1920x540 (per piirtokenttä) on pikselimäärältään vain vähän päälle puolet joidenkin PC:llä harrastamasta 1600x1200:sta, joten kaikkea ei tarvitse viedä äärimmäisyyksiin käyttötarkoitukseen "riittävän" nopeuden saamiseksi.
Koneen kokonaistehot ainakin teoreettisesti kasvaa 1000- kertaisesti PS2:n verrattuna.
Kuinka jäähdyttää hurjan tehon tuottama massiivinen lämpö hiljaisesti ?
Vastaus: PS3 ei ole PC.
Tämähän on sitten se väite jolle on paljon naureskeltu. Valitettavasti asioihin perehtymättömät ihmiset usein olettavat kaiken toimivan PC-pohjalta, ja että 1000-kertainen teho 300MHz:n myllyyn verrattuna vaatisi 300GHz. Näinhän se ei kuitenkaan toimi. Kovin harva tuntuu nykyään edes muistavan, että suuremman sisäisen rinnakkaisuutensa vuoksi 60MHz:n Pentium oli selvästi nopeampi kuin 100MHz:n 486, kellotaajuus ei ole koskaan ollut yksinään ratkaisevaa.
Tännekin linkitettiin viime viikolla jonkun patentin läpi lukeneen analyysi Cell-arkkitehtuurista. Mietitäänpä miten homma toimisi, olettaen että analyysi ei mene tekniseltä puoleltaan pahasti metsään (hypepuolella se ampui kyllä aika iloisesti ja fanipoikamaisesti yli, tekniikkaosuus näytti loogiselta ja asialliselta). Näillä spekseillä se 1000-kertaisuus ei ole aivan täysin yliampuvaa, mutta vielä vähän markkinointipuheiden puolella. Suhteellisen pienellä rinnakkaisuuden lisäämisellä sekin on kuitenkin täysin realistista.
Analyysin pohjalta PS3:ssa olisi neljä Celliä, ja yhdessä Cellissä on POWER-pohjainen prosessori ja kahdeksan PS2:n vektoriunitin kaltaista vektoriprosessoria. Tämä ei itse asiassa ole uutta tietoa, vaan vastaavanlaisesta rakennelmasta on puhuttu jo kauan sitten. Täten PS3:ssa olisi yhteensä neljä POWERia ja 32 vektoriunittia. Koska koko lystin uhotaan pyörivän 4.6GHz:llä olisi kelloa 15.5 kertaa niin paljon kuin PS2:ssa. Jos oletetaan vektoriunittien olevan yhtä tehokkaita kuin PS2:ssa (todennäköisesti ne ovat käytännössä tehokkaampia, ja niistä saadaan enemmän irti jo siksi, että niissä on enemmän muistia) saadaan teoreettinen tehonlisäys PS2:een pelkästään näin noin 250-kertaiseksi.
Koneiden julkaisun välillä on noin kuusi vuotta, eli neljä täyttä Moore-sykliä. Perinteisesti Mooren lain siteerataan tarkoittavan tehon kaksinkertaistumista puolentoista vuoden välein, vaikka alkuperäinen laki puhuu komponenttitiheydestä, mutta tehotulkinnallakin näin saadaan kuudessa vuodessa vain tehon 16-kertaistuminen. 250-kertaisuus on siis harppaus miten tahansa tulkittuna.
Sivumainintana todettakoon, että PS2:n vektoriunittien teoreettinen liukulukulaskentateho on yhdessä samaa luokkaa kuin 3GHz:n Pentium 4:n teoreettinen vastaava. Näin teoriassa pelkkä yksi Cell tarjoaisi 60-kertaiset tehot tähän verrattuna. Erikoistuminen ja rinnakkaisuus on tapa saada paljon tehoja.
Mutta miten se sitten voi toimia järkevän hintaisena ja lämpöisenä? Yksinkertaisuus on valttia. PC-maailmassa on keskitytty siihen, että saadaan yksi prosessori mahdottoman nopeaksi ja isolle kellolle. Yksinkertaistamalla prosessoria sen saa pienemmäksi eli vähemmän transistoreja käyttäväksi, ja siten halvemmaksi ja vähemmän lämpeneväksi, ja vieläpä pyörimään paljon isommalla kellolla. Kuten PS2:ssa, Cellin vektoriuniteilla ei ole esimerkiksi ollenkaan cacheja, vaan oma pienempi muistinsa, mikä säästää paljon logiikassa ja tarjoaa nopeaa vapaasti hallittavaa muistia välittömään käyttöön sen sijaan että annetaan cache-logiikan arvata mitä ehkä saatetaan seuraavaksi tarvita.
Oleelliseksi tulee sitten, miten kaikki teho saadaan hyödynnettyä. PS2:ssa toisen vektoriyksikön sijainti ja väylät ovat tehneet siitä paljon vaikeamman hyödynnettävän, mikä näkyy tietysti myös sen käyttöasteessa. Yksi asia johon tuo mainittu Cell-analyysi ei ottanut ollenkaan kantaa onkin kääntäjäteknologia ja kehitysympäristöt. Nyt kun jälleen yksinkertaistetaan rautaa sen sijaan että heitetään yhä enemmän rautatason logiikkaa peliin, kuten x86-rintamalla on ollut tapana tehdä, vaaditaan kääntäjältä paljon enemmän erikoistumista kunnon tehojen irti saamiseksi. Sony itse on kovin rummuttanut ottaneensa opiksi PS2:sta, jonka alkuaikoina kehittäjät eivät saaneet paljon muuta kuin rautaläheiset dokumentaatiot, paremmat kehitystyökalut tai edes optimoiva vektoriunittien assembler-kääntäjä tulivat myöhemmin, mikä osittain loi PS2:lle vaikean ohjelmoitavan maineen. Suuresta rinnakkaisuudesta on vaikeampi saada yhtä suurta osaa tehoista hyödynnettyä kuin suoraviivaisessa systeemissä, mutta vaikka vain pikkuinen 10%:n hyödyntäminen 250-kertaisistakin tehoista on melkoisesti. Aika näyttää miten käy.
Itse olen vuosikymmenen ajan odottanut rinnakkaisuuden laajempaa yleistymistä, mutta vaikka niin saadaan isompia tehoja on niitä vaikeampi mainostaa kuin pelkästään isoja kellotaajuuksia. Murros lienee kuitenkin hissukseen tapahtumassa, koska kellotaajuusraja alkaa tulla PC-prosessoreilla vastaan, ja rinnakkaisuus ja uudet arkkitehtuurit ovat ainoa tapa saada lisää tehoja järkevässä muodossa menemättä takaisin 70-luvun kilowattiluokan virtalähteisiin ja jääkaappijäähdytyksiin.
Yksi asia mikä kannattaa vielä muistaa on se, että pitkälle rinnakkaistettua vektorilaskentaa ei voi käyttää kaikkeen. Se toimii tietynlaisessa liukulukumurskauksessa, kuten suorassa ja streamaavassa datassa, yleisemmin 3D-grafiikassa ja multimediassa (video ja ääni), tai vaikkapa fysiikkasimulaatioissa. Tekstinkäsittelyä tai käyttöjärjestelmän käynnistymistä se ei nopeuta.