Cell (by Sony, Toshiba and IBM)

(92 Oldal)
« Elsõ
←
88
89
90
91
92
→

Nem indíthatsz témát.
A téma zárva.

Cell (by Sony, Toshiba and IBM) Valóban forradalmi lesz? Értékeld a témát:

#1781 bogdan

Őstag

Csoport: Fórumtag
Hozzászólások: 18.631
Csatlakozott: --

Elküldve: 2007. 09. 11. 08:47

kar, hogy en masra irtam: nem az IBM-rol, hanem a vasarlorol allitottam (ha emlekem nem csal), hogy ott nem nagyon fogja bovitgetni a memoriat!

a forum ma:
"Ez van bazdmeg, ha nem tetszik, el lehet menni."

${lang:go_to_top}$
Tetejére of the page up there ^

#1782 d n . r

Senior tag

Csoport: Fórumtag
Hozzászólások: 2.211
Csatlakozott: --

Elküldve: 2007. 09. 11. 23:06

Idézet: bogdan - Dátum: 2007. szept. 11., kedd - 9:47

kar, hogy en masra irtam: nem az IBM-rol, hanem a vasarlorol allitottam (ha emlekem nem csal), hogy ott nem nagyon fogja bovitgetni a memoriat!

Már megint azok az emlékeid... szerintem lassan el kéne már fogadnod, hogy bizony, az emlékeid Téged meg szoktak csalni...

Idézet: d n . r - Dátum: 2007. aug. 11., szombat - 9:36

Íme:

http://www.realworldtech.com/page.cfm?Arti...1005084318&p=11

Idézet

Fortunately, XDR DRAM devices could in theory be reconfigured in such a way so that upwards of 36 XDR devices can be connected to the same 36 bit wide channel and provide 1 bit wide data bus each to the 36 bit wide point-to-point interconnect. In such a configuration, a two channel XDR memory can support upwards of 2 GB of ECC protected memory with 256 Mbit DRAM devices or 4 GB of ECC protected memory with 512 Mbit DRAM devices

Idézet: bogdan - Dátum: 2007. aug. 11., szombat - 9:57

a problema az "in theory" reszben van, ugy erzem!

Mint látjuk, semmiféle probléma nincs abban az in theoryban, ami most már ráadásul kézzelfogható valóság.

(arról meg senki nem beszélt, hogy a _vásárló_ bõvítené a memóriát, olvass már vissza)

${lang:go_to_top}$
Tetejére of the page up there ^

#1783 shabba

Senior tag

Csoport: Fórumtag
Hozzászólások: 4.433
Csatlakozott: --

Elküldve: 2007. 09. 20. 16:11

Toshiba: vizualizációs koprocesszor Cell-alapokon
http://prohardver.hu/hirek/2007-09-20/tosh...l_alapokon.html

${lang:go_to_top}$
Tetejére of the page up there ^

#1784 d n . r

Senior tag

Csoport: Fórumtag
Hozzászólások: 2.211
Csatlakozott: --

Elküldve: 2007. 11. 20. 14:54

Pár hete láttam ezt a cikket a Beyond3D-n, de csak most volt idõm átolvasni. Nem közvetlenül Cell, de itt beszégettünk a real-time ray-tracingrõl, és ez is ennek a problémáiról szól:
Real-Time Ray Tracing : Holy Grail or Fools Errand?

${lang:go_to_top}$
Tetejére of the page up there ^

#1785 shabba

Senior tag

Csoport: Fórumtag
Hozzászólások: 4.433
Csatlakozott: --

Elküldve: 2007. 11. 21. 12:11

Idézet: d n . r - Dátum: 2007. nov. 20., kedd - 15:54

Szerintem nincs szó szent grálról, inkább csak egy másfajta megközelítésrõl, ami talán a jõvõ hardwareihez jobban passzol majd. Itt van pár Inteles cikk a témában:

http://blogs.intel.c.../tag/raytracing

${lang:go_to_top}$
Tetejére of the page up there ^

#1786 special

project 2501

Csoport: Stábtag
Hozzászólások: 11.962
Csatlakozott: 2001. jan. 16.

Elküldve: 2007. 12. 08. 18:34

retronews:

Idézet

In the IBM booth at SC07 the 350M triangle Boeing digital mockup will be rendered real-time at 1080p resolution using a hybrid cluster of Cell processor based QS21 blades (14 unit, 28 Cell BE MPUs) and a Ridgeback (AMD Opteron) memory server.

128GB 2GB 256KB

(x86 disk) –> (x86 memory) –> (Cell memory) –> (SPE local store) –> (SPE register file)

120MB/sec 2GB/sec 25GB/sec 50GB/sec

http://gametomorrow.com/blog/index.php/200...ng-777-at-sc07/

hwsw.hu

${lang:go_to_top}$
Tetejére of the page up there ^

#1787 max-pain

Senior tag

Csoport: Fórumtag
Hozzászólások: 4.098
Csatlakozott: --

Elküldve: 2008. 02. 05. 20:12

http://pc.watch.impr...6/kaigai416.htm

Kép

[ Kattints ide a teljes méretû képhez ]
Kép

${lang:go_to_top}$
Tetejére of the page up there ^

#1788 SFIJ

Őstag

Csoport: Fórumtag
Hozzászólások: 20.145
Csatlakozott: --

Elküldve: 2008. 02. 05. 20:25

mondjuk a cikk kifacsart english resze is izgi, nemcsak az abrak.

νιψονανωμηματαμημωνανοψιν

What do stars do? They shine.(Yvaine)

${lang:go_to_top}$
Tetejére of the page up there ^

#1789 shabba

Senior tag

Csoport: Fórumtag
Hozzászólások: 4.433
Csatlakozott: --

Elküldve: 2008. 05. 16. 14:25

Ötször nagyobb teljesítményre képes a Cell processzor új változata
https://www.hwsw.hu/hirek/36045/ibm_bladece...ell_8i_hpc.html

${lang:go_to_top}$
Tetejére of the page up there ^

#1790 special

project 2501

Csoport: Stábtag
Hozzászólások: 11.962
Csatlakozott: 2001. jan. 16.

Elküldve: 2008. 06. 17. 09:39

Egy kis Roadrunner follow-up. Ezt csak a rend kedvéért:

Idézet

Az NNSA által monumentális eredménynek titulált Roadrunner 6120 Opteron processzor köré 12240 PowerXCell 8i chipet szervez, melyek a számítási teljesítmény derekát adják. A rendszer három szerverbõl álló blokkoból épül fel, a blokkok egy kétfoglalatos, kétmagos Opteronoknak helyet adó LS21, és két darab kétutas QS22 Cell blade szerverbõl épülnek fel. Ezekbõl a blokkokból 180 darab képez egy összeköttetési csomópontot, 288 InfiniBand DDR portos száloptikás switch-csel, a rendszer pedig összesen 17 ilyen csomópontból épül fel. A 2 petabájtos háttértár 10 gigabites Etherneten csatlakozik.

A több mint 12 ezer PowerXCell 8i mintegy 1332 teraflops elméleti csúcsteljesítménnyel rendelkezik 64 bites lebegõpontos számítások terén, az IBM pedig a Linpack tesztben 1026 teraflopsot, vagyis éppen több mint egy petaflops teljesítményt sajtolt ki. A PowerXCell 8i a PlayStation 3 játékkonzolban bemutatkozott Cell Broadband Engine chip egy szuperszámítógépes felhasználást szem elõtt tartó továbbfejlesztése, ami lényegében a 64 bites mûveletekkel történõ teljesítmény fokozását, és új, DDR2 memóriavezérlõ bevezetését takarja. A 65 nanométeres eljárással gyártott chip egy PowerPC mag mellett 8 darab vektorprocesszort integrál, órajele 3,2 gigahertz.

https://www.hwsw.hu/hirek/36227/ibm_roadrun..._petaflops.html

Ez viszont néhány viszonylag friss info egy túlságosan rövid cikkbõl:

Idézet

In the future, computers like Roadrunner could also be used in a wide range of tasks, from animation to medical imaging to financial risk management, says Dave Turek, vice-president of deep computing at IBM. The company is working to implement technology based on the Roadrunner system at Mizuho Securities in Japan, where it will be used in the derivatives trading system, and at the medical imaging center of the Mayo Clinic, which will use the capabilities to render medical images and diagnostics faster.

http://www.businessweek.com/technology/con...ign_id=rss_tech

Az az érzésem, hogy a vevõk érzékenysége és talán kompetitív okokból nem nagyon szeret errõl beszélni az IBM, de mintha elég szép ecosystem és üzlet épülne ki a Cell platformra. Érdekes lesz figyelni, a Larrabee-t melyik HPC cég fogja felkarolni, és mennyire fogja tudni megállítani a Cellt és az AMD/NVIDIA stream processzorokat. a PowerXCell 8i már nagyon potensnek tûnik, és két év múlva esedékes a 45 nanométeres nextgen implementáció 32 továbbfejlesztett vektormaggal -- valószínûleg ennek már a fogyasztása is igen csinos lesz.

hwsw.hu

${lang:go_to_top}$
Tetejére of the page up there ^

#1791 SFIJ

Őstag

Csoport: Fórumtag
Hozzászólások: 20.145
Csatlakozott: --

Elküldve: 2008. 06. 17. 13:19

Idézet: special - Dátum: 2008. jún. 17., kedd - 10:39

Érdekes lesz figyelni, a Larrabee-t melyik HPC cég fogja felkarolni, és mennyire fogja tudni megállítani a Cellt és az AMD/NVIDIA stream processzorokat. a PowerXCell 8i már nagyon potensnek tûnik, és két év múlva esedékes a 45 nanométeres nextgen implementáció 32 továbbfejlesztett vektormaggal -- valószínûleg ennek már a fogyasztása is igen csinos lesz.

nezd eppen anad GT200 cikkje kapcsan neztem utana ez utobbi nV csoda (meltan kierdemelve a behemot cimet) egszeruen agyonvi a cell-t, nem kicsit, hanem nagyon. Masfelol komplet SDK van hozza, a CUDA, ere alapulo BLAS - szal ha igy nezem az nV van kozelbb ahhoz mainstreamma valjon. a larrabee valoban igeretes de jo esetben masfel ev mulva erkezik. addig sokminden tortenik, pl epp egy combos, globalis energiavalsag elejen/kozepen leszunk

νιψονανωμηματαμημωνανοψιν

What do stars do? They shine.(Yvaine)

${lang:go_to_top}$
Tetejére of the page up there ^

#1792 special

project 2501

Csoport: Stábtag
Hozzászólások: 11.962
Csatlakozott: 2001. jan. 16.

Elküldve: 2008. 06. 17. 13:58

továbbra is egy raszteres gpu, és DP alatt legjobb esetben is 8-adát hozza a csúcsteljesítménynek, plusz kevésbé rugalmasan programozható, szóval nem biztos, hogy véletlen lenne az, hogy a Roadrunner Cell-chipekre épít, nem pedig gpgpu stream processzorokra.

Szerkesztette: special 2008. 06. 17. 14:00 -kor

hwsw.hu

${lang:go_to_top}$
Tetejére of the page up there ^

#1793 shabba

Senior tag

Csoport: Fórumtag
Hozzászólások: 4.433
Csatlakozott: --

Elküldve: 2008. 06. 17. 14:13

Idézet: special - Dátum: 2008. jún. 17., kedd - 9:39

Érdekes lesz figyelni, a Larrabee-t melyik HPC cég fogja felkarolni

Ezek már egy ideje ismert infók. Az egyik a Cray a másik az SGI. Mindkét céggel készít az Intel egy 10 petaflopsot megcélzó hybrid szuperszámítógép rendszert(Xeon+Larrabee). A Cray rendszer várható elkészülte 2010/11, az SGI-s rendszer 2012. Ez utóbbit a Nasa rendelte a Hold és Mars kutatásokhoz.

${lang:go_to_top}$
Tetejére of the page up there ^

#1794 shabba

Senior tag

Csoport: Fórumtag
Hozzászólások: 4.433
Csatlakozott: --

Elküldve: 2008. 06. 17. 14:27

Idézet: SFIJ - Dátum: 2008. jún. 17., kedd - 13:19

A CUDA azért igen nehezen programozható felület és a kód sem túl hatékony. Double precision mellett meg igencsak leesik a teljesítmény. Szép az 1 teraflops single precision mellett mint a Tesla 10p-nél mint a FireStream 9250-nél, de double precisionban a Telsa már csak 90 gigaflopsot tud, a FireStreamet meg 200 fölöttinek mondja AMD. Konrét értékeket itt már egyik gyártó sem igazán emleget, eddig sem tették. Mindig csak a magas single percision érték volt kivéte a kikarkatba, mellé meg odaírva hogy és double precision is támogatva. De arról mélyen hallgattak azzal mennyit.

Amikor bejelentették az új Teslat, dupla pontosság mellett két 4 magos Xeonnal felérõ teljesítményrõl beszélt az Nvidia. Az AMD sajtóbejelentésében pedig a FireStreamnél egy konkrét alkalmazás van megemlítve. Ott az elméleti 1 teraflopos single precision teljesítménybõl a gyakorlatban 174 gigaflopsot sikerült kicsikarniuk. Szóval ez alapján igen magasak a teoretikus elméleti csúcsértékek, de a gyakorlati értékek nem igazán tudnak ennek közelébe érni.

A CUDA programozhatóságának korlátaira meg azért jó példa hogy a mai napig nem lehet olyan iparági bechmarkokat lefuttatni ezekkel az eszközökkel mint egy spec vagy linpack. Ha ez menne, akkor azért jobban össze lehetne vetni õket a többi termékkel.

Márpedig a jõvõben egyre több hybrid superszámítógépet fognak építeni, ahhoz pedig hogy egy rendszer a top500-ba kerüljön le kell tudni futtatni a linpackot double precision mellett. És jõvõre a Bull-lal a Nvidia és készül egy hybrid szuperszámítógéppel Nehalem Xeonokkal és Teslával. Igaz annak a kapacitása "csak" 300 Gflops körüli, szóval nem csúcsdöntögetõ, de azért tápos gép. Viszont FireStream alapokon nyugvó hybrid szuperszámítógép tervrõl én még nem olvastam.

${lang:go_to_top}$
Tetejére of the page up there ^

#1795 bogdan

Őstag

Csoport: Fórumtag
Hozzászólások: 18.631
Csatlakozott: --

Elküldve: 2008. 06. 17. 14:30

Idézet: special - Dátum: 2008. jún. 17., kedd - 14:58

egyfelol epitenek szuperszamitogepet GPU-ra (magyarorszagon, az elten!)
masfelol kizart a 8-ad teljesitmeny: ha egyaltalan nincs DP, akkor is 4 SP szorzasbol ossze lehet rakni egy DP szorzast, szoval ne tulozzunk, valami ott nem stimmel.
es abban biztos, hogy elorelepes az uj nvidia gpu, hogy nativan van benne DP. hogy gyors vagy lassu masodrendu: a cell-ben is azt varta az ipar, hogy mikor lesz benne DP.

Idézet: shabba

Szóval ez alapján igen magasak a teoretikus elméleti csúcsértékek, de a gyakorlati értékek nem igazán tudnak ennek közelébe érni.

no igen, ez tunik nagyobb gondnak egyenlore. (bar azt is tegyuk hozza, a cell sem egy leanyalom!!)

Idézet

A CUDA programozhatóságának korlátaira meg azért jó példa hogy a mai napig nem lehet olyan iparági bechmarkokat lefuttatni ezekkel az eszközökkel mint egy spec vagy linpack.

ezt nem ertem. a linpack-hoz nem blas kell? SFIJ azt mondja, hogy blas van rajta..

Idézet

Márpedig a jõvõben egyre több hybrid superszámítógépet fognak építeni, ahhoz pedig hogy egy rendszer a top500-ba kerüljön le kell tudni futtatni a linpackot double precision mellett.

a top500-nak meg a sajtonak persze az kell. de a vevonek nem feltetlenul! mar regota olvastam, hogy reg megvan a petaflopos gep, csak nem fut rajta a linpack. de hat nem is annak a futtatasara epitettek. (nekem nem jut eszembe, melyik geprol van szo. valaki?)

Szerkesztette: bogdan 2008. 06. 17. 14:35 -kor

a forum ma:
"Ez van bazdmeg, ha nem tetszik, el lehet menni."

${lang:go_to_top}$
Tetejére of the page up there ^

#1796 special

project 2501

Csoport: Stábtag
Hozzászólások: 11.962
Csatlakozott: 2001. jan. 16.

Elküldve: 2008. 06. 17. 14:33

Idézet: shabba - Dátum: 2008. jún. 17., kedd - 15:13

Maradjunk annyiban, hogy ezek szándéknyilatkozatok szintjén léteznek. Larrabee még bõven nincs.

hwsw.hu

${lang:go_to_top}$
Tetejére of the page up there ^

#1797 special

project 2501

Csoport: Stábtag
Hozzászólások: 11.962
Csatlakozott: 2001. jan. 16.

Elküldve: 2008. 06. 17. 14:38

Idézet: bogdan - Dátum: 2008. jún. 17., kedd - 15:30

30 DP egység van benne. ez a 4 SP MUL = 1 DP MUL egy szép dolog, csak ettõl még a teljesítményveszteséged ennél sokkal nagyobb is lehet a penalty például a leginkább a mûveletek késleltetései miatt, plusz ugye a szoftvert ekkor újra kell minimum forgatni.

a GPU egy nagyon korlátozott dolog, zéró vezérlés, csak "buta" alapmûveletek.

hwsw.hu

${lang:go_to_top}$
Tetejére of the page up there ^

#1798 shabba

Senior tag

Csoport: Fórumtag
Hozzászólások: 4.433
Csatlakozott: --

Elküldve: 2008. 06. 17. 14:51

Idézet: bogdan - Dátum: 2008. jún. 17., kedd - 14:30

Ez azért nem ilyen 1xû, hogy ha X a single precision akkor X/2 a double. Gondolja csak az alap Cellre, ott is tizedére csökken a double precison teljesítmény a single precisonhoz képest.

A Teslának 8-as csoportba vannak stream procijai, amik single precisionok, és minden ilyen 8-as tömbhöz csak egy double precision egység tartozik, ezért nyolcadolódik a teljesítmény.

Hogy ez AMD-nél hogy van azt még nem igazán tudni, de gyanítom ott is valami 5-ös, 6-os egység csoporthoz lehet egy DP egység, ezért ötöde, hatoda a DP teljesítmény.

Szerkesztette: shabba 2008. 06. 17. 14:58 -kor

${lang:go_to_top}$
Tetejére of the page up there ^

#1799 shabba

Senior tag

Csoport: Fórumtag
Hozzászólások: 4.433
Csatlakozott: --

Elküldve: 2008. 06. 17. 14:55

Idézet: bogdan - Dátum: 2008. jún. 17., kedd - 14:30

Természtesen vannak alkalmazás specifikus szuperszámítógépek, amiket szinte hardware szinten egy adott probléma megoldására szántak. Ezeken nem futnak az általános célú benchmark tesztet, de amire készültek arra nagyon gyorsak. Én inkább a klíma kutatás terén olvastam ilyen gépekrõl, de biztos más alkalmazás csoportra és készült már hasonló. Ezek a gépek jóval nagyobb teljesítményûek lehetnek mint amiket a top500-ban szerepelnek, de csak arra a feladatra tudják kiaknázni a képességeiket amire konkrétan készültek. Ezeknek a gépeknek az ár/teljesítmény mutatóik is igen kedvezõek.

${lang:go_to_top}$
Tetejére of the page up there ^

#1800 bogdan

Őstag

Csoport: Fórumtag
Hozzászólások: 18.631
Csatlakozott: --

Elküldve: 2008. 06. 17. 15:05

Idézet: shabba - Dátum: 2008. jún. 17., kedd - 15:51

Ez azért nem ilyen 1xû, hogy ha X a single precision akkor X/2 a double. Gondolja csak az alap Cellre, ott is tizedére csökken a double precison teljesítmény a single precisonhoz képest.

nem X/2, hanem X/4! persze, hogy ujra kell forgatni, meg kesleltetes, meg minden, de azert ennel egy nagysagrendel ne legyen mar lassabb!
a Cell-re miert is gondoljak? nem hasonlitod veletlenul az elmeleti maximum SP-t a gyakorlati DP-hez? lasd alabb az elmeleti 1tera kontra valos 174 giga tesla..
az, hogy konkret DP egyseg keves van benne, az egy dolog, de hat ilyen hardware-re amugy is kezzel kell csiszolni a kodot, akkor meg 4 sp az bevalthato 1 dp-re. az, hogy konkret DP egyseg nincs benne annyi, az meg nem jelenti azt, hogy csak azok vegezhetnek DP szamitasokat. (az eredeti cellben ugye egyaltalan nincs DP egyseg, megis van neki DP teljesitmenye!)

a forum ma:
"Ez van bazdmeg, ha nem tetszik, el lehet menni."