Cell (by Sony, Toshiba and IBM) Valóban forradalmi lesz?
#1781
Elküldve: 2007. 09. 11. 08:47
"Ez van bazdmeg, ha nem tetszik, el lehet menni."
#1782
Elküldve: 2007. 09. 11. 23:06
Idézet: bogdan - Dátum: 2007. szept. 11., kedd - 9:47
Már megint azok az emlékeid... szerintem lassan el kéne már fogadnod, hogy bizony, az emlékeid Téged meg szoktak csalni...

Idézet: d n . r - Dátum: 2007. aug. 11., szombat - 9:36
http://www.realworldtech.com/page.cfm?Arti...1005084318&p=11
Idézet
Idézet: bogdan - Dátum: 2007. aug. 11., szombat - 9:57

Mint látjuk, semmiféle probléma nincs abban az in theoryban, ami most már ráadásul kézzelfogható valóság.

(arról meg senki nem beszélt, hogy a _vásárló_ bővítené a memóriát, olvass már vissza)
#1783
Elküldve: 2007. 09. 20. 16:11
http://prohardver.hu/hirek/2007-09-20/tosh...l_alapokon.html
#1784
Elküldve: 2007. 11. 20. 14:54
Real-Time Ray Tracing : Holy Grail or Fools Errand?
#1785
Elküldve: 2007. 11. 21. 12:11
Idézet: d n . r - Dátum: 2007. nov. 20., kedd - 15:54
Real-Time Ray Tracing : Holy Grail or Fools Errand?
Szerintem nincs szó szent grálról, inkább csak egy másfajta megközelítésről, ami talán a jővő hardwareihez jobban passzol majd. Itt van pár Inteles cikk a témában:
http://blogs.intel.c.../tag/raytracing
#1786
Elküldve: 2007. 12. 08. 18:34
Idézet
128GB 2GB 256KB
(x86 disk) –> (x86 memory) –> (Cell memory) –> (SPE local store) –> (SPE register file)
120MB/sec 2GB/sec 25GB/sec 50GB/sec
http://gametomorrow.com/blog/index.php/200...ng-777-at-sc07/
#1787
Elküldve: 2008. 02. 05. 20:12
#1788
Elküldve: 2008. 02. 05. 20:25
What do stars do? They shine.(Yvaine)
#1789
Elküldve: 2008. 05. 16. 14:25
https://www.hwsw.hu/hirek/36045/ibm_bladece...ell_8i_hpc.html
#1790
Elküldve: 2008. 06. 17. 09:39
Idézet
A több mint 12 ezer PowerXCell 8i mintegy 1332 teraflops elméleti csúcsteljesítménnyel rendelkezik 64 bites lebegőpontos számítások terén, az IBM pedig a Linpack tesztben 1026 teraflopsot, vagyis éppen több mint egy petaflops teljesítményt sajtolt ki. A PowerXCell 8i a PlayStation 3 játékkonzolban bemutatkozott Cell Broadband Engine chip egy szuperszámítógépes felhasználást szem előtt tartó továbbfejlesztése, ami lényegében a 64 bites műveletekkel történő teljesítmény fokozását, és új, DDR2 memóriavezérlő bevezetését takarja. A 65 nanométeres eljárással gyártott chip egy PowerPC mag mellett 8 darab vektorprocesszort integrál, órajele 3,2 gigahertz.
https://www.hwsw.hu/hirek/36227/ibm_roadrun..._petaflops.html
Ez viszont néhány viszonylag friss info egy túlságosan rövid cikkből:
Idézet
http://www.businessweek.com/technology/con...ign_id=rss_tech
Az az érzésem, hogy a vevők érzékenysége és talán kompetitív okokból nem nagyon szeret erről beszélni az IBM, de mintha elég szép ecosystem és üzlet épülne ki a Cell platformra. Érdekes lesz figyelni, a Larrabee-t melyik HPC cég fogja felkarolni, és mennyire fogja tudni megállítani a Cellt és az AMD/NVIDIA stream processzorokat. a PowerXCell 8i már nagyon potensnek tűnik, és két év múlva esedékes a 45 nanométeres nextgen implementáció 32 továbbfejlesztett vektormaggal -- valószínűleg ennek már a fogyasztása is igen csinos lesz.
#1791
Elküldve: 2008. 06. 17. 13:19
Idézet: special - Dátum: 2008. jún. 17., kedd - 10:39
nezd eppen anad GT200 cikkje kapcsan neztem utana ez utobbi nV csoda (meltan kierdemelve a behemot cimet) egszeruen agyonvi a cell-t, nem kicsit, hanem nagyon. Masfelol komplet SDK van hozza, a CUDA, ere alapulo BLAS - szal ha igy nezem az nV van kozelbb ahhoz mainstreamma valjon. a larrabee valoban igeretes de jo esetben masfel ev mulva erkezik. addig sokminden tortenik, pl epp egy combos, globalis energiavalsag elejen/kozepen leszunk

What do stars do? They shine.(Yvaine)
#1792
Elküldve: 2008. 06. 17. 13:58
Szerkesztette: special 2008. 06. 17. 14:00 -kor
#1793
Elküldve: 2008. 06. 17. 14:13
Idézet: special - Dátum: 2008. jún. 17., kedd - 9:39
Ezek már egy ideje ismert infók. Az egyik a Cray a másik az SGI. Mindkét céggel készít az Intel egy 10 petaflopsot megcélzó hybrid szuperszámítógép rendszert(Xeon+Larrabee). A Cray rendszer várható elkészülte 2010/11, az SGI-s rendszer 2012. Ez utóbbit a Nasa rendelte a Hold és Mars kutatásokhoz.
#1794
Elküldve: 2008. 06. 17. 14:27
Idézet: SFIJ - Dátum: 2008. jún. 17., kedd - 13:19

A CUDA azért igen nehezen programozható felület és a kód sem túl hatékony. Double precision mellett meg igencsak leesik a teljesítmény. Szép az 1 teraflops single precision mellett mint a Tesla 10p-nél mint a FireStream 9250-nél, de double precisionban a Telsa már csak 90 gigaflopsot tud, a FireStreamet meg 200 fölöttinek mondja AMD. Konrét értékeket itt már egyik gyártó sem igazán emleget, eddig sem tették. Mindig csak a magas single percision érték volt kivéte a kikarkatba, mellé meg odaírva hogy és double precision is támogatva. De arról mélyen hallgattak azzal mennyit.
Amikor bejelentették az új Teslat, dupla pontosság mellett két 4 magos Xeonnal felérő teljesítményről beszélt az Nvidia. Az AMD sajtóbejelentésében pedig a FireStreamnél egy konkrét alkalmazás van megemlítve. Ott az elméleti 1 teraflopos single precision teljesítményből a gyakorlatban 174 gigaflopsot sikerült kicsikarniuk. Szóval ez alapján igen magasak a teoretikus elméleti csúcsértékek, de a gyakorlati értékek nem igazán tudnak ennek közelébe érni.
A CUDA programozhatóságának korlátaira meg azért jó példa hogy a mai napig nem lehet olyan iparági bechmarkokat lefuttatni ezekkel az eszközökkel mint egy spec vagy linpack. Ha ez menne, akkor azért jobban össze lehetne vetni őket a többi termékkel.
Márpedig a jővőben egyre több hybrid superszámítógépet fognak építeni, ahhoz pedig hogy egy rendszer a top500-ba kerüljön le kell tudni futtatni a linpackot double precision mellett. És jővőre a Bull-lal a Nvidia és készül egy hybrid szuperszámítógéppel Nehalem Xeonokkal és Teslával. Igaz annak a kapacitása "csak" 300 Gflops körüli, szóval nem csúcsdöntögető, de azért tápos gép. Viszont FireStream alapokon nyugvó hybrid szuperszámítógép tervről én még nem olvastam.
#1795
Elküldve: 2008. 06. 17. 14:30
Idézet: special - Dátum: 2008. jún. 17., kedd - 14:58
masfelol kizart a 8-ad teljesitmeny: ha egyaltalan nincs DP, akkor is 4 SP szorzasbol ossze lehet rakni egy DP szorzast, szoval ne tulozzunk, valami ott nem stimmel.
es abban biztos, hogy elorelepes az uj nvidia gpu, hogy nativan van benne DP. hogy gyors vagy lassu masodrendu: a cell-ben is azt varta az ipar, hogy mikor lesz benne DP.
Idézet: shabba
Idézet
Idézet
Szerkesztette: bogdan 2008. 06. 17. 14:35 -kor
"Ez van bazdmeg, ha nem tetszik, el lehet menni."
#1796
Elküldve: 2008. 06. 17. 14:33
Idézet: shabba - Dátum: 2008. jún. 17., kedd - 15:13
Maradjunk annyiban, hogy ezek szándéknyilatkozatok szintjén léteznek. Larrabee még bőven nincs.
#1797
Elküldve: 2008. 06. 17. 14:38
Idézet: bogdan - Dátum: 2008. jún. 17., kedd - 15:30
masfelol kizart a 8-ad teljesitmeny: ha egyaltalan nincs DP, akkor is 4 SP szorzasbol ossze lehet rakni egy DP szorzast, szoval ne tulozzunk, valami ott nem stimmel.
es abban biztos, hogy elorelepes az uj nvidia gpu, hogy nativan van benne DP. hogy gyors vagy lassu masodrendu: a cell-ben is azt varta az ipar, hogy mikor lesz benne DP.
30 DP egység van benne. ez a 4 SP MUL = 1 DP MUL egy szép dolog, csak ettől még a teljesítményveszteséged ennél sokkal nagyobb is lehet a penalty például a leginkább a műveletek késleltetései miatt, plusz ugye a szoftvert ekkor újra kell minimum forgatni.
a GPU egy nagyon korlátozott dolog, zéró vezérlés, csak "buta" alapműveletek.
#1798
Elküldve: 2008. 06. 17. 14:51
Idézet: bogdan - Dátum: 2008. jún. 17., kedd - 14:30
masfelol kizart a 8-ad teljesitmeny: ha egyaltalan nincs DP, akkor is 4 SP szorzasbol ossze lehet rakni egy DP szorzast, szoval ne tulozzunk, valami ott nem stimmel.
es abban biztos, hogy elorelepes az uj nvidia gpu, hogy nativan van benne DP. hogy gyors vagy lassu masodrendu: a cell-ben is azt varta az ipar, hogy mikor lesz benne DP.
Ez azért nem ilyen 1xű, hogy ha X a single precision akkor X/2 a double. Gondolja csak az alap Cellre, ott is tizedére csökken a double precison teljesítmény a single precisonhoz képest.
A Teslának 8-as csoportba vannak stream procijai, amik single precisionok, és minden ilyen 8-as tömbhöz csak egy double precision egység tartozik, ezért nyolcadolódik a teljesítmény.
Hogy ez AMD-nél hogy van azt még nem igazán tudni, de gyanítom ott is valami 5-ös, 6-os egység csoporthoz lehet egy DP egység, ezért ötöde, hatoda a DP teljesítmény.
Szerkesztette: shabba 2008. 06. 17. 14:58 -kor
#1799
Elküldve: 2008. 06. 17. 14:55
Idézet: bogdan - Dátum: 2008. jún. 17., kedd - 14:30
Természtesen vannak alkalmazás specifikus szuperszámítógépek, amiket szinte hardware szinten egy adott probléma megoldására szántak. Ezeken nem futnak az általános célú benchmark tesztet, de amire készültek arra nagyon gyorsak. Én inkább a klíma kutatás terén olvastam ilyen gépekről, de biztos más alkalmazás csoportra és készült már hasonló. Ezek a gépek jóval nagyobb teljesítményűek lehetnek mint amiket a top500-ban szerepelnek, de csak arra a feladatra tudják kiaknázni a képességeiket amire konkrétan készültek. Ezeknek a gépeknek az ár/teljesítmény mutatóik is igen kedvezőek.
#1800
Elküldve: 2008. 06. 17. 15:05
Idézet: shabba - Dátum: 2008. jún. 17., kedd - 15:51
nem X/2, hanem X/4! persze, hogy ujra kell forgatni, meg kesleltetes, meg minden, de azert ennel egy nagysagrendel ne legyen mar lassabb!
a Cell-re miert is gondoljak? nem hasonlitod veletlenul az elmeleti maximum SP-t a gyakorlati DP-hez? lasd alabb az elmeleti 1tera kontra valos 174 giga tesla..
az, hogy konkret DP egyseg keves van benne, az egy dolog, de hat ilyen hardware-re amugy is kezzel kell csiszolni a kodot, akkor meg 4 sp az bevalthato 1 dp-re. az, hogy konkret DP egyseg nincs benne annyi, az meg nem jelenti azt, hogy csak azok vegezhetnek DP szamitasokat. (az eredeti cellben ugye egyaltalan nincs DP egyseg, megis van neki DP teljesitmenye!)
"Ez van bazdmeg, ha nem tetszik, el lehet menni."