AMD Hammer -- harmadik rész
#2081
Elküldve: 2005. 02. 03. 12:32
#2083
Elküldve: 2005. 02. 03. 17:43
Idézet: special - Dátum: 2005. febr. 3., csütörtök - 12:51
A hireket olvasgatva mar az sem tul sokaig...
#2084
Elküldve: 2005. 02. 04. 17:00
Idézet: SFIJ - Dátum: 2005. febr. 2., szerda - 21:10
Nade emlekeim szerint a Cray sosem pakolt MIPS-t a gepeibe (megugye Itaniumot sem, pedig az SGI nagy Itanium fan). Volt ugye Alpha EV-4 a T3D-ben, Alpha EV-5 a Cray T3E-ben, NEC proci az SX-6-ban (sot talan az egesz gep az NEC termeke csak a Cray forgalmazta az USA-ban), a C90-ben es az Y-MP-ben emlekeim speci Cray procik ultek (csakugy, mint az X1-ben). Ezek a maguk idejeben elegge potens darabok voltak.
Valahogy az Opteron kilog ebbol a sorbol (leven a Power es az Itanium is eroteljesebb design). Itt mar inkabb arrol szol a mese, hogy igen visszafogott teljesitmenyu procikbol epitenek extrem gepet.
#2085
Elküldve: 2005. 02. 05. 15:20
Idézet: h1ghland3r - Dátum: 2005. febr. 4., péntek - 18:00
Ezzel vitatkozok. Milyen processzorok érhetőek el jelenleg (illetve bő egy évvel ezelőtt, amikor bejelentették)?
Sparc procik - felejtősek ebből a szempontból
Xeon - gyengébb és nem 64 bites
Power4 - gyengébb vagy olyan erős
Power5 - lényegesen erősebb
Itanium 2 - kb. ugyanolyan erős
Madison 9M - erősebb
Ráadásul ezek közül a 9M és a Power5 nem volt forgalomban bő egy évvel ezelőtt. Az tény, hogy nem a leggyorsabb processzorra építették az architektúrát, de az igaz, hogy az akkoriban elérhető egyik leggyorsabbra.
Szerkesztette: hvuk 2005. 02. 05. 15:22 -kor
#2086
Elküldve: 2005. 02. 05. 16:32
Idézet: hvuk - Dátum: 2005. febr. 5., szombat - 14:20
Sparc procik - felejtősek ebből a szempontból
Xeon - gyengébb és nem 64 bites
Power4 - gyengébb vagy olyan erős
Power5 - lényegesen erősebb
Itanium 2 - kb. ugyanolyan erős
Madison 9M - erősebb
Ráadásul ezek közül a 9M és a Power5 nem volt forgalomban bő egy évvel ezelőtt. Az tény, hogy nem a leggyorsabb processzorra építették az architektúrát, de az igaz, hogy az akkoriban elérhető egyik leggyorsabbra.
Hat nem tudom hogy merre jartal, de az Itanium 2 lebegopontos teljesitmenye magasan az Opteron felett van. Mondjuk az 1.5 GHz-es Itanium 2 6GFlops, a 2 GHz-es Opterone meg 4GFlops. Nem mindegy! Es a Cray gepei altalaban lebegopontos szamitasokra vannak megveve. Ezert furcsallottam kicsit az Opteronos elkotelezettseget, raadasul az anyaceg kokemeny Itanium fan.....
#2087
Elküldve: 2005. 02. 05. 17:34
Idézet: h1ghland3r - Dátum: 2005. febr. 5., szombat - 16:32
AZ Itanium nak fosabb a buszrendszere. Szvsz, ennyi.
#2088
Elküldve: 2005. 02. 05. 17:51
Idézet: h1ghland3r - Dátum: 2005. febr. 5., szombat - 16:32
4 utas renszerben az opteron mar erosebb lebegopotyben mint az itanium2.
What do stars do? They shine.(Yvaine)
#2089
Elküldve: 2005. 02. 06. 17:59
Idézet: h1ghland3r - Dátum: 2005. febr. 5., szombat - 17:32
Fent két indokot már kaptál, de ne feledkezzünk meg egy harmadikról sem. A nehéz optimalizáció miatt lényegesen nehezebb az Itaniumból kihozni a max. teljesítményt, mint az Opteronból. Emiatt a valós tesztek nem igazán támasztják alá az Itanium fölényét. Sőt.
#2090
Elküldve: 2005. 02. 07. 09:53
Idézet: hvuk - Dátum: 2005. febr. 6., vasárnap - 16:59
Ez nem igaz. Az Itanium matematikai kernelei sokkal jobbak mint a versenytarsake.
Pl. BLAS (Basic Linear Algebra Subprograms) hatekonysag:
Opteron:
dgemm: 91.8%
Linpack efficiency 1 CPU:89.9%
Linpack efficiency 2 CPU:88.8%
Itanium2 (1.5Mbyte L2):
dgemm: 99.0%
Linpack efficiency 1 CPU:97.6%
Linpack efficiency 2 CPU:96.3%
Es a Linpack mar forditoprogrammal keszul, nem hand-tuned!!!
Raadasul a szuperszamitogepeknel minden kutatas azt celozza, hogy az algoritmusokat a matematikai kernelek rutinjaibol epitsek fel. Pl. ma mar az osszes fontos linearis algebrai problema megoldasa Level 3 BLAS fuggvenyekbol epitkezik (ez pl. a DGEMM rutin, ami 99%-os hatekonysaggal valosithato meg Itaniumon). Mas teruletet nem ismerek ennyire behatoan, de tudtommal a Fourier transzformacio eseten is hasonlo a helyzet.
Es persze lehet jonni azzal, hogy a kerneleken kivuli reszek nem lesznek hatekonyak, mert gyenge a forditoprogram, de kit erdekel ez, ha a futasi ido 90%-anal tobb ido megy el BLAS hivasokra, majdnemhogy kar azokkal foglalkozni.
Olvastam egy felmerest, hogy a mernoki-tudomanyos problemak megoldasi idejenek 80%-85%-at linearis egyenletrendszerek megoldasa teszi ki. Egeszen pontosan a vilagon levo HPC celra beallitott gepek idejuk ekkora hanyadaban oldanak meg ilyen problemakat. Namost az Itanium leadott teljesitmenye ezen a teruleten: 6GFlops*0.99, mig az Opterone 4GFlops*0.91.
Szvsz egyvalamire tenyleg jo az Itanium - ahogy azt mar korabban itt is emlegettuk- : mernokok tudosok meregdraga jatekszerenek.
#2091
Elküldve: 2005. 02. 07. 12:05
És még mindig ott van a kérdés, hogy annak ellenére, hogy - a te szavaidat idézve - az anyacég kőkemény Itanium fan a Cray miért választotta az Opteront? Nyilván nyomós oka volt rá és ez az ok vélhetőleg nem marketingre vezethető vissza.
Szerkesztette: hvuk 2005. 02. 07. 12:06 -kor
#2092
Elküldve: 2005. 02. 07. 13:37
Idézet: h1ghland3r - Dátum: 2005. febr. 7., hétfő - 8:53
Szvsz egyvalamire tenyleg jo az Itanium - ahogy azt mar korabban itt is emlegettuk- : mernokok tudosok meregdraga jatekszerenek.
Na most az okfejtésed alapján szinte kizárólag PPC970FX-eseket kellene alkalmazni erre.
dgemm: 88.2%
Linpack efficiency 1 CPU:84.5%
Linpack efficiency 2 CPU:79.3%
Na, de ez 2,5GHz-en megy.
Így 0,882*10 GFLOPS a teljesítmény.
Hol van ettől az itanium?
Szerintem ma már nem nagyon lehet 1-1 kiragadott érték alapján kellene a processzorok teljesítményét becsülni.
#2093
Elküldve: 2005. 02. 07. 16:26
Idézet: Vajonész - Dátum: 2005. febr. 7., hétfő - 12:37
dgemm: 88.2%
Linpack efficiency 1 CPU:84.5%
Linpack efficiency 2 CPU:79.3%
Na, de ez 2,5GHz-en megy.
Így 0,882*10 GFLOPS a teljesítmény.
Hol van ettől az itanium?
Szerintem ma már nem nagyon lehet 1-1 kiragadott érték alapján kellene a processzorok teljesítményét becsülni.
Ha a PPC970 10GFlops, akkor az Itanium 12
Szerkesztette: h1ghland3r 2005. 02. 07. 16:28 -kor
#2094
Elküldve: 2005. 02. 07. 23:29
What do stars do? They shine.(Yvaine)
#2095
Elküldve: 2005. 02. 08. 08:16
Idézet: h1ghland3r - Dátum: 2005. febr. 7., hétfő - 15:26
Nem. Ugyanúgy 2 FMA van benne, mint az itaniumban, ugyanúgy max. 4 FP op/cycle.
32 bit esetén itt is 2x akkora a kibocsájtás, mint az itaniumnál, tehát 8.
Tehát a peak az 10 GFLOPS, míg a 1,5-es itaniumnál csak 6.
#2096
Elküldve: 2005. 02. 08. 10:39
Idézet: SFIJ - Dátum: 2005. febr. 7., hétfő - 22:29
Az a baj, hogy kerestem 4 utast, de egyenlore nem talaltam jot. Az SGI Origin (2*64CPU) vs. Cray XT-3 (96CPU) viszont nem az Opteron elonyet mutatja, meg akkor sem ha procinkenti atlagot nezunk.
Amit eddig talaltam az enyhen szolva nem fuggetlen forras (Intel), halistennek a Linpack-ot nehez hackelni. Ettol fuggetlenul ugy tunik, hogy 4CPU-val is jobb a hatekonysag (94.2%), mint egy szem Opteronnal:

Opteront meg guglizok, illetve hatha meg talalok "partatlanabb" teszteket is.
A PPC eredmenyeirol ket dolog:
- 4 utas eredmenyek termeszetesen nincsenek, a 2*2 utas illetve a dualos eredmenyek kiabanditoak es azt a kb. 4GFlops/CPU teljesitmenyt mutatjak, amirol en fecsegtem.
- Nem veletlen, hogy a Virginia Tech visszavonta a Top500 listarol az egyetlen PPC970 alapu gepet. Gondolom idaig nem jutott el a hir, de a teljesitmenye az elozetes becslesek fele volt. A peak ~17TFlops kb. 40%-at birtak kicsikarni a vart 80% helyett. Na ez tenyleg kiabrandito. Es lon csoda ez is az a 4GFlops/CPU teljesitmeny amirol en fecsegtem. Azota publikaltak egy ujabb top500-at, es abba sem kerult vissza a gep. Tehat az valoban 10GFlops peak (igazad volt Vajonesz), de meg senki nem birt belole 4-nel tobbet kipumpalni.
Ez ugyan nem 4 utas eredmeny, de azert figyelemre melto:
CPU: (1*2way Linpack) (2*2way Linpack)
Itanium 2: 10.52 10.28
Opteron: 5.815 5.869
PPC970: 7.949 8.225
Termeszetesen az eredmenyek a 2 procis node-ok teljesitmenye, tehat az osszrendszer teljesitmenye a masodik oszlop duplaja.
Forras:
http://www.linuxclustersinstitute.org/Linu...ions/Guiang.pdf
Szerkesztette: h1ghland3r 2005. 02. 08. 10:42 -kor
#2097
Elküldve: 2005. 02. 09. 09:11
Idézet: h1ghland3r - Dátum: 2005. febr. 8., kedd - 9:39
Ez ugyan nem 4 utas eredmeny, de azert figyelemre melto:
CPU: (1*2way Linpack) (2*2way Linpack)
Itanium 2: 10.52 10.28
Opteron: 5.815 5.869
PPC970: 7.949 8.225
A Barcelona Supercomputer Centert is visszavonták volna?
Ott 31.36 TFLOPS peak mellett a Linpack: 20.53 TFLOPS.
3564 db 2,2 GHz PPC970FX - 5,76 GFLOPS/cpu a 8,8 helyett.
2,5 GHz-essel pedig bőven 6 felett lenne.
A Power/PowerPC felépítéséből adódóan távolabb van a peaktől a valós teljesítmény, mint az itaniumnál.
A 4 utas eredményednél is kicsit árnyaltabb a kép, mivel az itanium 1,5GHz mellett az opteron is és ppc is csak 2 GHz-es volt, pedig ez utóbbiakból azóta jóval gyorsabbak is vannak, míg az itanium csak alig gyorsult azóta.
Mindezek fényében továbbra is vitattom, hogy bármire is a legjobb választás lenne az itanium.
#2098
Elküldve: 2005. 02. 09. 09:42
Idézet: Vajonész - Dátum: 2005. febr. 9., szerda - 8:11
Ott 31.36 TFLOPS peak mellett a Linpack: 20.53 TFLOPS.
3564 db 2,2 GHz PPC970FX - 5,76 GFLOPS/cpu a 8,8 helyett.
2,5 GHz-essel pedig bőven 6 felett lenne.
A Power/PowerPC felépítéséből adódóan távolabb van a peaktől a valós teljesítmény, mint az itaniumnál.
A 4 utas eredményednél is kicsit árnyaltabb a kép, mivel az itanium 1,5GHz mellett az opteron is és ppc is csak 2 GHz-es volt, pedig ez utóbbiakból azóta jóval gyorsabbak is vannak, míg az itanium csak alig gyorsult azóta.
Mindezek fényében továbbra is vitattom, hogy bármire is a legjobb választás lenne az itanium.
Ott a pont, a Barcelonai geprol megfeledkeztem.
Valoban van felnivaloja az Itaniumnak a Power-tol ebben a szegmensben (raadasul ez az egyetlen szegmens, ahol az Itanium2 tenyleg jo szvsz) raadasul az IBM-nek eleg ambiciozus tervei vannak a Power5 orajelet illetoen. Az eredeti felvetes arrol szolt, hogy miert pont Opteront alkalmaz a Cray, amikor annak nem tul jo a lebegopontos teljesitmenye.
#2099
Elküldve: 2005. 02. 09. 13:15
Idézet: h1ghland3r - Dátum: 2005. febr. 9., szerda - 9:42
Valoban van felnivaloja az Itaniumnak a Power-tol ebben a szegmensben (raadasul ez az egyetlen szegmens, ahol az Itanium2 tenyleg jo szvsz) raadasul az IBM-nek eleg ambiciozus tervei vannak a Power5 orajelet illetoen. Az eredeti felvetes arrol szolt, hogy miert pont Opteront alkalmaz a Cray, amikor annak nem tul jo a lebegopontos teljesitmenye.
Sok száz meg ezer procinál már számítanak a linkek. Ebben meg köztudott ,hogy jobb az Opteron. /HT tech/
#2100
Elküldve: 2005. 02. 09. 16:16
Idézet: h1ghland3r - Dátum: 2005. febr. 9., szerda - 8:42
Valoban van felnivaloja az Itaniumnak a Power-tol ebben a szegmensben (raadasul ez az egyetlen szegmens, ahol az Itanium2 tenyleg jo szvsz) raadasul az IBM-nek eleg ambiciozus tervei vannak a Power5 orajelet illetoen. Az eredeti felvetes arrol szolt, hogy miert pont Opteront alkalmaz a Cray, amikor annak nem tul jo a lebegopontos teljesitmenye.
Szerintem HT illetve nagyon jó ár/teljesítmény miatt használ opteront.

Súgó
A téma zárva.













