Vastaus: PS3, N5, XBOX2 - kuka vetää pisimmän korren?
Löysin sellaiset lukemat, että niin Athlon 64 kuin Intelin prosessorit SSE3:n kanssa pääsisivät vain kahteen liukulukuoperaatioon per kellojakso. Näin 3.6GHz:n Pentium 4 SSE3:lla saavuttaisi 7.2GFLOPS ja 2.4GHz:n Athlon 64 FX 4.8GFLOPS. Mutta nämä ovat kaikki täysin teoreettisia huippulukemia, aivan kuten Xbox 360:n ja PS3:nkin ilmoitetut lukemat. Ei kannata unohtaa, että 295MHz:n PS2:n teoreettinen liukulukulaskentateho oli 6.2GFLOPS. Tämä tulee siitä, että Emotion Enginessä on peräti kymmenen FMAC-yksikköä (float multiply and accumulate), ja koska jokainen FMAC on kaksi operaatiota pystytään pelkästään näillä suoritusyksiköillä suorittamaan 20 operaatiota kellojaksossa. FMAC on DSP-tyylinen käsky, josta sattuu olemaan hyötyä multtttimeediasovelluksissa kuten 3D:ssä ja kuvankäsittelyssä, ja ainakaan SSE2:ssa ei vielä ollut mitään vastaavaa.
PC:ssä kovin numeronmurskausteho on viime vuosina ollut grafiikkapiireissä, ei prosessoreissa.
PC-prosessorit: 2 operaatiota per kellojakso, tietysti neliprosessorikoneella saisi 8 Kannattaa huomata, että vaikka SSE2:nkin SIMD-käskyissä on neljä rinnakkaista argumenttia pystyy prosessori ajamaan niistä vain kahta kerrallaan. Kyllä, SSE2 on vielä ainakin melkoisen rajoittunut VMX:n kaltaisiin vektoriprosessoreihin verrattuna, ja löytyneiden teholukemien perusteella SSE3 ei ainakaan tehoja paljon nosta.
PS2:n vektoriunitit: pelkästään FMACeista VU0:lle 8 ja VU1:lle 10 operaatiota per kellojakso. Kun mukaan lisätään vektoriunittien muut operaatiot (esim. jakoyksiköt) ja prosessorin oman FPU:n operaatiot saadaan noin 21 operaatiota per kellojakso. 21*0.295(GHz) = 6.195 eli tuo 6.2GFLOPS.
Xbox 360:n VMX-coret: 12 operaatiota per kellojakso. Kolme corea tekee yhteensä 36 operaatiota per kellojakso. 36*3.2(GHz) = 115.2, eli ilmoitettu 115.2GFLOPS.
PS3:n Cellin SPE:t: 8 operaatiota per kellojakso (hitaampia kuin VMX:t siis!). Seitsemän aktiivista tekee 56 operaatiota per kellojakso. Jos oletamme coressa olevan VMX-yksikön olevan samanlainen kuin Xbox 360:ssä saadaan siitä 12 operaatiota sekunnissa lisää. Näin 68*3.2(GHz) = 217.6, eli ilmoitettu 218GFLOPS. Näyttää täsmäävän (en ollut tästä ollenkaan varma laskuja aloittaessani).
Ja muistutuksena, kaikki on äärimmäisen teoreettista. Kaikkea tätä tehoa ei pysty hyödyntämään edes teknologiademossa. Oleellista onkin se kuinka suuri osa siitä saadaan käyttöön. Joka tapauksessa tämän pohjalta floating point -suorituskyvyssä PS3 hakkaa Xbox 360:n koska vaan, ja Xbox 360 puolestaan murskaa järkyttävällä ylivoimalla kaikki kotikoneet nopeimpia PC:itä ja Macintosheja myöten.
Itse en myöskään usko, että Nintendon Revolution lähtisi tehokilpailuun mukaan. Yllätyn, jos siinä on yli kaksi prosessoricorea ja yli 2GHz:n kellotaajuus.
Ohhoh, menipä numeronmurskaukseksi.
Hmmm, mitä yrität sanoa? Vaikka miten etsin en löytänyt mitään implikaatiota siitä, että PC-prosessorit pärjäisivät edes normaalille G4/G5:n VMX:lle laskentakapasiteetissa. Applehan pyrkii aina korostamaan tätä tehovertailuissa, sillä floating point -murskaus on ainoa jossa PPC-prosessorit pystyvät hieman hitaammalla kellolla pistämään kampoihin x86:lle.Suurimpana Xboxin ja Nintendon miinuksena pidän koneiden täydellistä liukulukutehon nojaamista Powerin omaan liukulukuyksikköön, joka ei tehoiltaan vastaa PC- raudan, EDES, tämänhetkisiä tekeleitä. Tästä esimerkkinä esitetyt luvut 115Gflop(Xbox360) vs 218Gflops(PS3), N5 tullee olemaan varsin lähellä Xboxia, samaan ytimeen perustuvana.
Löysin sellaiset lukemat, että niin Athlon 64 kuin Intelin prosessorit SSE3:n kanssa pääsisivät vain kahteen liukulukuoperaatioon per kellojakso. Näin 3.6GHz:n Pentium 4 SSE3:lla saavuttaisi 7.2GFLOPS ja 2.4GHz:n Athlon 64 FX 4.8GFLOPS. Mutta nämä ovat kaikki täysin teoreettisia huippulukemia, aivan kuten Xbox 360:n ja PS3:nkin ilmoitetut lukemat. Ei kannata unohtaa, että 295MHz:n PS2:n teoreettinen liukulukulaskentateho oli 6.2GFLOPS. Tämä tulee siitä, että Emotion Enginessä on peräti kymmenen FMAC-yksikköä (float multiply and accumulate), ja koska jokainen FMAC on kaksi operaatiota pystytään pelkästään näillä suoritusyksiköillä suorittamaan 20 operaatiota kellojaksossa. FMAC on DSP-tyylinen käsky, josta sattuu olemaan hyötyä multtttimeediasovelluksissa kuten 3D:ssä ja kuvankäsittelyssä, ja ainakaan SSE2:ssa ei vielä ollut mitään vastaavaa.
PC:ssä kovin numeronmurskausteho on viime vuosina ollut grafiikkapiireissä, ei prosessoreissa.
PS3:ssahan on coressa mukana myös tuo samainen VMX, joka löytyy jokaisesta Xbox 360:n coresta. Lasketaanpa siis prosessorien floating point -tehoja annettujen teoreettisten huippujen pohjalta.PS3:han käyttää Power ydintä vain kokonaislukuihin joita tarvitaan enimmäkseen pelien "runkokoodin" ajamisessa, ja tähänhän se on PS3 sisällä valjastettu.
PC-prosessorit: 2 operaatiota per kellojakso, tietysti neliprosessorikoneella saisi 8 Kannattaa huomata, että vaikka SSE2:nkin SIMD-käskyissä on neljä rinnakkaista argumenttia pystyy prosessori ajamaan niistä vain kahta kerrallaan. Kyllä, SSE2 on vielä ainakin melkoisen rajoittunut VMX:n kaltaisiin vektoriprosessoreihin verrattuna, ja löytyneiden teholukemien perusteella SSE3 ei ainakaan tehoja paljon nosta.
PS2:n vektoriunitit: pelkästään FMACeista VU0:lle 8 ja VU1:lle 10 operaatiota per kellojakso. Kun mukaan lisätään vektoriunittien muut operaatiot (esim. jakoyksiköt) ja prosessorin oman FPU:n operaatiot saadaan noin 21 operaatiota per kellojakso. 21*0.295(GHz) = 6.195 eli tuo 6.2GFLOPS.
Xbox 360:n VMX-coret: 12 operaatiota per kellojakso. Kolme corea tekee yhteensä 36 operaatiota per kellojakso. 36*3.2(GHz) = 115.2, eli ilmoitettu 115.2GFLOPS.
PS3:n Cellin SPE:t: 8 operaatiota per kellojakso (hitaampia kuin VMX:t siis!). Seitsemän aktiivista tekee 56 operaatiota per kellojakso. Jos oletamme coressa olevan VMX-yksikön olevan samanlainen kuin Xbox 360:ssä saadaan siitä 12 operaatiota sekunnissa lisää. Näin 68*3.2(GHz) = 217.6, eli ilmoitettu 218GFLOPS. Näyttää täsmäävän (en ollut tästä ollenkaan varma laskuja aloittaessani).
Ja muistutuksena, kaikki on äärimmäisen teoreettista. Kaikkea tätä tehoa ei pysty hyödyntämään edes teknologiademossa. Oleellista onkin se kuinka suuri osa siitä saadaan käyttöön. Joka tapauksessa tämän pohjalta floating point -suorituskyvyssä PS3 hakkaa Xbox 360:n koska vaan, ja Xbox 360 puolestaan murskaa järkyttävällä ylivoimalla kaikki kotikoneet nopeimpia PC:itä ja Macintosheja myöten.
Itse en myöskään usko, että Nintendon Revolution lähtisi tehokilpailuun mukaan. Yllätyn, jos siinä on yli kaksi prosessoricorea ja yli 2GHz:n kellotaajuus.
Ohhoh, menipä numeronmurskaukseksi.
Viimeksi muokannut moderaattori: