HWSW Informatikai Kerekasztal: Cell (by Sony, Toshiba and IBM) - HWSW Informatikai Kerekasztal

Ugrás a tartalomhoz

Mellékleteink: HUP | Gamekapocs

  • (92 Oldal)
  • +
  • « Első
  • 83
  • 84
  • 85
  • 86
  • 87
  • Utolsó »
  • Nem indíthatsz témát.
  • A téma zárva.

Cell (by Sony, Toshiba and IBM) Valóban forradalmi lesz? Értékeld a témát: -----

#1681 Felhasználó inaktív   SFIJ 

  • Őstag
  • PipaPipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 20.145
  • Csatlakozott: --

Elküldve: 2007. 06. 12. 20:07

Idézet: bogdan - Dátum: 2007. jún. 12., kedd - 20:01

de ehhez mi koze az altalad idezett szovegresznek? (mert nem sok, azon kivul, hogy tobb lepcson es egyeb premisszan keresztul logikai/szemantikai kapcsolatot allitottam fel kozottuk.)

mi is volt az ertelme az idezesednek?

:omg:

szerintem onmagad mevalaszoltad a sajat kerdesed. kellek en ehhez? :Đ
νιψονανωμηματαμημωνανοψιν

What do stars do? They shine.(Yvaine)

#1682 Felhasználó inaktív   dezz 

  • Törzsvendég
  • PipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 740
  • Csatlakozott: --

Elküldve: 2007. 06. 12. 20:57

Idézet: Laa-Yosh - Dátum: 2007. jún. 12., kedd - 16:52

Ha nem egy adott képkocka adatait osztjuk szét, akkor az már nem a képkocka párhuzamos feldolgozása, konzolos környezetben pedig erre van szükség. Ott ugyanis szinkronizálni kell a tévé frissítésével, ami 30/60 fps kötelező betartását jelenti. Ha elkezdik szétbontani több tickre a képkocka feldolgozását, akkor az erőteljes késleltetést okozhat - eleve van egy adag az input miatt, a double buffering és vsync miatt, a tévé sebessége miatt, minden miliszekundum számít. Ezért ez a módszer nem járható út, hogy úgy párhuzamosítjuk a taszkokat, hogy a Cell fele az egyik képkockát számolja, a másik meg a következőt.
Nem értem, a kötelező 30/60 fps hogy befolyásolni a kérdést. Inkább azt gondolnám, a 30/60 fps alatti értékek elkerülése érdekében - konzolokra jellemzően - mindent be kell vetni.

Vegyük pl. az alábbi szervezést:

épp megjelenített frame  számolt frame, feladat 1/2    számolt frame, feladat 2/2
-----------------------------------------------------------------------------------------------
          x (buffer A)              x+2 (buffer2 A)                  x+1 (buffer B)
          x+1 (buffer B)          x+3 (buffer2 B)                  x+2 (buffer A)
          x+2 (buffer A)          x+4 (buffer2 A)                  x+3 (buffer B)

(feladat 1/2: pl. fizika, feladat 2/2: rendering; buffer x: frame buffer; buffer2: fizikai számításokra)
Két fázisú futószalag, 2x-es gyorsulás, és pusztán 2 frame latency (a sima double-bufferezés 1 frame-jéhez képest). Az már túl sok lenne?
De nyugodtan lehet szólni, ha valami nem stimmel.

Idézet

Az alapkérdés pedig nem az volt hogy a Crossfire hogy működik, vagy hogy a futószalag mit jelent
Nem emlékszem, hogy azt mondtam volna, ezek voltak. De ugye látod, mégis hogy kapcsolódnak hozzá?

Idézet

hanem hogy a játékfejlesztők milyen problémákkal szembesülnek a game kód párhuzamosítása során.
Igen, és ezért hoztam fel a lehetséges megoldásokra néhány példát.

Ezt írtad:

Idézet: Laa-Yosh - Dátum: 2007. jún. 11., hétfő - 19:43

A játékoknál alapvetően az a párhuzamosítási probléma, hogy a gameworld és renderer részfolyamatok mind egymásra épülnek - minden képkockánál fizikázni kell, AI-zni, game kódozni, aztán ez alapján animálni, renderernek parancsokat küldeni... A pontos sorrend játékonként változó, de alapvetően mindig érvényes az elv, hogy az egyes fázisokat csak egymás után lehet indítani, párhuzamosítani ezek között nem nagyon lehet. Marad a folyamaton belüli többszálúsítás, ami viszont már jóval kevésbé egyértelmű, főleg az SPE-k lokális memóriájának apró de annál fontosabb sajátosságai miatt.
Nos nekem úgy tűnik, nem csak a feladaton belüli többszálúsítás maradt.

Idézet

Az SPE-nek nagyon kevés az adat- és utasításmemóriája. Ezért nagyon kicsi taszkok gyors végrehajtására alkalmazható, és mivel gyors a busz, ezért nyugodtan lehet küldözgetni az adatokat - a probléma a késleltetési idő. Ez jelentősen megnöveli a várakozást, ezért érdemes bufferelni.
Ez azért némileg attól is függ, milyen filozófiával közelítjük meg. Gondolom, ismered a 96KB-os Kkriegert, vagy ott van a rengeteg 64k demo, amik nem egyszerű effekteket valósítanak megy ennyi kódból (tudom, tudom, a játékfejlesztők nem ilyen "őrültek"). Na persze az adatok szempontjából több már jóval több ram kell nekik. Arra akarok kilyukadni, hogy ha elég jó a kód, nem magukat a taszkokat kell olyan sűrűn cserélni, hanem az adatokat. (Oké, ez már talán súrolja a kötekedés határát, bár ennek sem az volt a célja, de mindegy.)

#1683 Felhasználó inaktív   SFIJ 

  • Őstag
  • PipaPipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 20.145
  • Csatlakozott: --

Elküldve: 2007. 06. 12. 21:44

Idézet: dezz - Dátum: 2007. jún. 12., kedd - 20:57

Vegyük pl. az alábbi szervezést:

épp megjelenített frame     számolt frame, feladat 1/2    számolt frame, feladat 2/2
-----------------------------------------------------------------------------------------------
             x (buffer A)                 x+2 (buffer2 A)                  x+1 (buffer B)
             x+1 (buffer B)             x+3 (buffer2 B)                  x+2 (buffer A)
             x+2 (buffer A)             x+4 (buffer2 A)                  x+3 (buffer B)

(feladat 1/2: pl. fizika, feladat 2/2: rendering; buffer x: frame buffer; buffer2: fizikai számításokra)
Két fázisú futószalag, 2x-es gyorsulás, és pusztán 2 frame latency (a sima double-bufferezés 1 frame-jéhez képest). Az már túl sok lenne?
De nyugodtan lehet szólni, ha valami nem stimmel.

Nem emlékszem, hogy azt mondtam volna, ezek voltak. De ugye látod, mégis hogy kapcsolódnak hozzá?

ez nagon szep, csa a vevoid letorik a kezedet. a szamolasi mododban (sajnos nem ketto, hanem) 3 frame-nyi ~50ms input lag-ed lesz a megjelenitett tartalom es a juzer altal eszkozolt akcio kozott. a HC gamerek mer 35-40ms lag eseten kurvaanyaznak...

raadasul a PS3-ban iszonyat memszuke van, ottvan meg a stencil/z-buffer kerdese is

Szerkesztette: SFIJ 2007. 06. 12. 21:49 -kor

νιψονανωμηματαμημωνανοψιν

What do stars do? They shine.(Yvaine)

#1684 Felhasználó inaktív   Laa-Yosh 

  • Senior tag
  • PipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 3.770
  • Csatlakozott: --

Elküldve: 2007. 06. 12. 22:15

Idézet: SFIJ - Dátum: 2007. jún. 12., kedd - 22:44

3 frame-nyi ~50ms input lag-ed lesz a megjelenitett tartalom es a juzer altal eszkozolt akcio kozott. a HC gamerek mer 35-40ms lag eseten kurvaanyaznak...

Bibi #1: ez csak egy része a teljes lagnek.
Eleve ott vna az emberi reakcióidő, ami ugye legalább 2-3 tizedmásodperc, ha jól emlékszem. A kontroller hw sem feltétlenül instant jelez a gépnek.
A képkocka végén várni kell a vsync jelre a kész kép kiírásához.
A legtöbb HDTV sem olyan marha gyors ám, pl. ha nem natív felbontásban hajtod akkor scale-ezni fog, ami szintén idő. Ha hülye a user és bekapcsolva hagyja a zajszűrőket meg sharpen filtereket, akkor ez több tizedmásodpercre is felmehet... és persze ettől a látvány kiesik a szinkronból a hanggal...

Bibi #2, és ez a nagyobb baj:
Manapság a 60 fps sebességgel futó játék szenzációszámba megy, Xboxon ilyen a Forza 2, PS3-on nem is nagyon tudok ilyenről. Akciójátékok a grafika miatt kivétel nélkül 30 fps-t érnek el (de akadoznak néha), ott 3 frame késleltetés pont 1/10-ed másodperc. Na az már önmagában túl sok... és akkor jön a többi késleltetés, és ebből lesz a csúszkálva és túl lassan reagáló, játszhatatlan játék.

Abszolúte elfogadhatatlan a játékoknál az, hogy akár csak egy képkocka plusz késleltetést hozzon a game kód. Csak az adott frame történésein belül lehet párhuzamosítani, ezért anyáznak miatta ennyire.

Szerkesztette: Laa-Yosh 2007. 06. 12. 22:19 -kor

LY

#1685 Felhasználó inaktív   dezz 

  • Törzsvendég
  • PipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 740
  • Csatlakozott: --

Elküldve: 2007. 06. 12. 23:14

Idézet: SFIJ - Dátum: 2007. jún. 12., kedd - 22:44

ez nagon szep, csa a vevoid letorik a kezedet. a szamolasi mododban (sajnos nem ketto, hanem) 3 frame-nyi ~50ms input lag-ed lesz a megjelenitett tartalom es a juzer altal eszkozolt akcio kozott. a HC gamerek mer 35-40ms lag eseten kurvaanyaznak...
Az a legrosszabb eset lesz (ha az éppen megjeleníteni kezdett frame elején jön az input [ami után még jön 2 frame számolás]). A legjobb meg 2 frame, 33,3 ms. Az átlag 41,6. Oké, ez sem a legjobb. :) Viszont, ez nem minden játékban számít ilyen sokat. Az ilyen szupergyors FPS-ek kedvelői valószínű amúgy sem a konzolokat részesítik előnyben, a maguk kikapcsolhatatlan vsync-ével.

Aztán ott van még az a lehetőség is, hogy pl. nem a teljes fizikát számolni az első körben, hanem csak effekt-fizikát, amit nem befolyásol az input. Akkor kapásból visszatérünk a szokásos double-bufferingre jellemző késleltetéshez (1-2 frame).

Idézet

raadasul a PS3-ban iszonyat memszuke van, ottvan meg a stencil/z-buffer kerdese is
Na igen, de ez egy másik téma. Úgyanúgy el kell férni, akár így, akár úgy csináljuk a dolgokat.


Idézet: Laa-Yosh - Dátum: 2007. jún. 12., kedd - 23:15

Bibi #1: ez csak egy része a teljes lagnek.
Eleve ott vna az emberi reakcióidő, ami ugye legalább 2-3 tizedmásodperc, ha jól emlékszem. A kontroller hw sem feltétlenül instant jelez a gépnek.
2-300 ms? Ehhez képest csak 16,6 (60fps) - 33,3 (30fps) ms, amit egy plusz fázis beiktatása okoz (ha input-függő).

Idézet

A képkocka végén várni kell a vsync jelre a kész kép kiírásához.
Hát igen, PC-n (a legkülönfélébb videokártyák és monitor képfrissítési ráták közepette) úgy megy, hogy csinálunk valamit, aztán nekiállunk várni-várakozni a vsync-re... Konzolon meg jó esetben úgy, hogy az egész folyamat szinkronizálva van a vsync-kel.

Idézet

Bibi #2, és ez a nagyobb baj:
Manapság a 60 fps sebességgel futó játék szenzációszámba megy, Xboxon ilyen a Forza 2, PS3-on nem is nagyon tudok ilyenről. Akciójátékok a grafika miatt kivétel nélkül 30 fps-t érnek el (de akadoznak néha), ott 3 frame késleltetés pont 1/10-ed másodperc. Na az már önmagában túl sok... és akkor jön a többi késleltetés, és ebből lesz a csúszkálva és túl lassan reagáló, játszhatatlan játék.
Na hát igen, ez tényleg szomorú. (Utálom a 2-frémes frissítést.)

Idézet

Abszolúte elfogadhatatlan a játékoknál az, hogy akár csak egy képkocka plusz késleltetést hozzon a game kód. Csak az adott frame történésein belül lehet párhuzamosítani, ezért anyáznak miatta ennyire.
Hmm, itt ilyen többszáz ms késésekről van szó, akkor miért számít ilyen sokat ennek töredéke?

Szerkesztette: dezz 2007. 06. 12. 23:25 -kor


#1686 Felhasználó inaktív   Laa-Yosh 

  • Senior tag
  • PipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 3.770
  • Csatlakozott: --

Elküldve: 2007. 06. 12. 23:55

Akkor adjuk össze, 30 fps mellett.

1. megjelenítési lag, amíg a kiküldött kép kikerül a tévére
legyen jóindulattal 10ms
2. játékos reakcióideje
250ms
3. kontroller reakcióideje
legyen megint csak jóindulattal 40ms

Eddig 300 ms telt el, ez 9 képkocka. Ha rosszul jön ki az input és csak a következő frame-en értékeli ki a gép, akkor 10 képkocka. Ha atomgyors a játékos, akkor az mínusz egy kocka; ha átlagember, akkor plusz egy...

Ez után jön csak a feldolgozás, ami megint 2 vagy 3 kocka, tehát a legjobb eset most 8+2 = 10 kocka, a legrosszabb 11 + 3 = 14 kocka.

Megint output lag, megint reakcióidő, legjobb eset 600ms azaz 18 kocka; legrosszabb eset 730ms.
Ez így már majdnem egy teljes másodpercnyi késleltetés aközött, hogy mi történt a játékban és mit csináljon rá válaszul a játék. Gyökér HDTV-vel akár az 1000ms is teljesíthető lenne. Borzasztó sok...

Szóval minden lehetséges eszközzel csökkenteni kell, és ebbe bizony beletartozik az is, hogy nem lehet gameworld eseményeket csak úgy több tickre elosztogatni. Már az is komoly kérdés, hogy a game kód - grafikai kód szétbontható-e egyáltalán - vagy az egésznek zusammen bele kell-e inkább férnie abba a 33.3ms-be...
LY

#1687 Felhasználó inaktív   SFIJ 

  • Őstag
  • PipaPipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 20.145
  • Csatlakozott: --

Elküldve: 2007. 06. 13. 00:20

Idézet: dezz - Dátum: 2007. jún. 12., kedd - 23:14

Az a legrosszabb eset lesz (ha az éppen megjeleníteni kezdett frame elején jön az input [ami után még jön 2 frame számolás]). A legjobb meg 2 frame, 33,3 ms. Az átlag 41,6.

úgyláccik nem programoztál még valós idejű szoftot. a jitter window-t mindig a worst case-re kell belőni. nem a game iparban dalgozom de van ebből gondunk, nemis kevés, nekünk is :D

mégegy apróság. LY a rekcióidőről beszél, énemeg az észlelésiről. a rekció az, amikor látod, agyilag megcsócsálod majd nyomsz rá valamit. ez sokszorosa annak, mint amekkora lag már lehet zavaró. Én pl miniDV felvételen már az ajakszinkronon látom ha vacak a gép és a hang másfél két képkockát csúszik.  game seteében arról van szó, hogy nyúlás után a júzer élszleli hogy mennyiben változott a cuccos állapota. ez az idő az input lag töredéke a rekcióidőnek. igazi HC gamerek CRTn jáccanak a mai napig mert a TFTk tipikus 1-2 framenyi lag-ja ismár zavaró a számukra.

Szerkesztette: SFIJ 2007. 06. 13. 00:27 -kor

νιψονανωμηματαμημωνανοψιν

What do stars do? They shine.(Yvaine)

#1688 Felhasználó inaktív   dezz 

  • Törzsvendég
  • PipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 740
  • Csatlakozott: --

Elküldve: 2007. 06. 13. 01:19

Idézet: SFIJ - Dátum: 2007. jún. 13., szerda - 1:20

úgyláccik nem programoztál még valós idejű szoftot.
Nem egyet. 2D-s stuffok, double-buffering nélkül. A megjelenítés és az input polling 1 frémenként. (Illetve 1x-2x kellett némi mahináció az inputtal, ha nagyon rövid idejű pöccintésekre is figyelni kellett.)

Idézet

a jitter window-t mindig a worst case-re kell belőni.
Nem ismerem ezt a kifejezést.

Nem tudom, ma elégségesnek számít-e frémenként 1x utánanézni az inputnak, de ha igen, akkor én azt a köv. frame előállításának első lépésének tenném meg.

Idézet

Én pl miniDV felvételen már az ajakszinkronon látom ha vacak a gép és a hang másfél két képkockát csúszik.  game seteében arról van szó, hogy nyúlás után a júzer élszleli hogy mennyiben változott a cuccos állapota. ez az idő az input lag töredéke a rekcióidőnek. igazi HC gamerek CRTn jáccanak a mai napig mert a TFTk tipikus 1-2 framenyi lag-ja ismár zavaró a számukra.
Hmm. (szerk: mondjuk én is gyorsan kiszúrom, ha valahol késik a hang, de még nem mértem le, hány ms fölött. Mostanában egyébként az m1-m2-n veszem néha észre, nem tudom, mit bénáznak.)


Laa-Yosh: Hát ez az, hogy azt gondolnám, 1000ms esetén 17-33 ms ide vagy oda már alig számít. De mindegy, inkább elhiszem, hogy nagyon is számít. :)

Szerkesztette: dezz 2007. 06. 13. 01:32 -kor


#1689 Felhasználó inaktív   dezz 

  • Törzsvendég
  • PipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 740
  • Csatlakozott: --

Elküldve: 2007. 06. 13. 02:57

Ja, pár éve mikrokontrollerezek, ez is real-time, de frame-ek csak komm. protokollokban vannak. :Đ

#1690 Felhasználó inaktív   SFIJ 

  • Őstag
  • PipaPipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 20.145
  • Csatlakozott: --

Elküldve: 2007. 06. 13. 03:11

Idézet: dezz - Dátum: 2007. jún. 13., szerda - 1:19

Mostanában egyébként az m1-m2-n veszem néha észre, nem tudom, mit bénáznak.)

nem biztos, hogy a z ő saruk. ők benyomják mamár ASI-ba. ezt átveszik a nagyadók meg a kábelesek. a kábelesek szépeb átcsomizzák low bitrate mpeg2-be, ezt szépen elküldik a fejegységeknek, a fejegységek meg visszaalakítják PAL-ba. a transcode/decode simán lehet 40-60 ms késleltetés. ha a hang delay rosszul van beállítva a transzkóderben, mindjárt kiló a lóláb :D

Idézet: dezz - Dátum: 2007. jún. 13., szerda - 1:19

Nem tudom, ma elégségesnek számít-e frémenként 1x utánanézni az inputnak, de ha igen, akkor én azt a köv. frame előállításának első lépésének tenném meg.
ez úgy megy hogy ugye az action csináz egy IRQ-t ebből lesz valami (win)message, bele a processz kjújába. rászagolsz a frame kiszámolásának az elején a kjúdra. namost ha a parszt véletlenül kicsit később babrászott, akkor ezt az infót márcsak aköv frémben fogod látni :D digitális technika, nem tökéletes :D

Szerkesztette: SFIJ 2007. 06. 13. 03:17 -kor

νιψονανωμηματαμημωνανοψιν

What do stars do? They shine.(Yvaine)

#1691 Felhasználó inaktív   bogdan 

  • Őstag
  • PipaPipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 18.631
  • Csatlakozott: --

Elküldve: 2007. 06. 15. 16:23

SFIJ-nek tisztelettel ajanlva:

http://www.renyi.hu/...sima-vektor.pdf

(ugy tunik ezek a magyarok, meg ha kulfoldon is publikalnak ragaszkodnak ehhez az elavult futoszallaghoz, meg ha butasag is.. ;) mielott barki kerdezne a konyv angol eredetije 1997-es.)
a forum ma:
"Ez van bazdmeg, ha nem tetszik, el lehet menni."

#1692 Felhasználó inaktív   dezz 

  • Törzsvendég
  • PipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 740
  • Csatlakozott: --

Elküldve: 2007. 06. 15. 17:00

10 év nagy idő... Ma már a PC-s procik ált. ALU-i is átlapoltan fútószalagosak. A SIMD egységeik meg... valódi SIMD-esek. Hasonlóan,  a mai vektorprocik is full SIMD-esek (teljesen párhuzamosak) valahány bitig (128, 256, ?), és csak afölött jön be újra az átlapolásos futószalagosítás.

Btw, ideje lenne elismerned, hogy az SPE-k egyenként akár kvázi-scalar, összességében szoftver-futószalagos, más szóval felfűzött működtetésének semmi köze a fenti dologhoz - ergo, ami az említett módon megoldható, nem feltétlenül SIMD-esíthető.

Szerkesztette: dezz 2007. 06. 15. 17:01 -kor


#1693 Felhasználó inaktív   SFIJ 

  • Őstag
  • PipaPipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 20.145
  • Csatlakozott: --

Elküldve: 2007. 06. 15. 17:27

Idézet: bogdan - Dátum: 2007. jún. 15., péntek - 16:23

SFIJ-nek tisztelettel ajanlva:

http://www.renyi.hu/...sima-vektor.pdf

(ugy tunik ezek a magyarok, meg ha kulfoldon is publikalnak ragaszkodnak ehhez az elavult futoszallaghoz, meg ha butasag is.. ;) mielott barki kerdezne a konyv angol eredetije 1997-es.)

mar megint csuszttatsz futoszalagugyben, de nembaj. de azert olvass csak bele, itt egy cisc implementaciorol ir, es azt mondja, hogy egy ilyen cisc-be a futoszalag behozatala, akar ezerszeres eredmenyt hozhat. mig a valodi SIMD megoldas, multialuval, vagy particionalhato ALU-val tizeserszeres novekedest hoz.
de tovabra is ajanlom figyelmedbe a a wiki szocikket :D

egyre nyilvanvalobb szamodra, hogy az altalad preferalt istallo a DSPket hivja vektorprocinak - mi a vilag nagyobb resze nem :D

Szerkesztette: SFIJ 2007. 06. 15. 17:34 -kor

νιψονανωμηματαμημωνανοψιν

What do stars do? They shine.(Yvaine)

#1694 Felhasználó inaktív   bogdan 

  • Őstag
  • PipaPipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 18.631
  • Csatlakozott: --

Elküldve: 2007. 06. 16. 08:42

Idézet: SFIJ - Dátum: 2007. jún. 15., péntek - 18:27

mar megint csuszttatsz futoszalagugyben, de nembaj.
oszinten szolva nem ertelek. hogy lehet csusztatni egy ilyen kerdesben, miszerint "van-e koze a futoszalagoknak a vektorprocesszorokhoz?", amikor az ember szakirodalmat hoz? hoztam magyar szakirodalmat (Nemeth-Horvath), nem tetszett Neked. OK. hoztam nagol nyelvut (Sima-Fountain-Kacsuk; mellesleg a Fountain irta az emlitett reszt), ez sem tetszik...

most ott tartunk, hogy en hoztam ket komolynak tuno szakirodalmat, Te meg meg mindig egy wiki cikkel dobalozol... (ami nem eleg pontos, es mellesleg emliti is a pipeline-okat..) kerlek hozzal valami komolyabb szakirodalmat, mert itt mar arra lenne szukseg. en ugy hiszem megtettem ezt.

Idézet

azert olvass csak bele, itt egy cisc implementaciorol ir, es azt mondja, hogy egy ilyen cisc-be a futoszalag behozatala, akar ezerszeres eredmenyt hozhat. mig a valodi SIMD megoldas, multialuval, vagy particionalhato ALU-val tizeserszeres novekedest hoz.
es? (mellesleg a futoszallag nem ezerszeres, hanem 10x-es szorzot hoz! olvass figyelmesebben..) nem az a kerdes, hogy ez a megvalositas mit er el mas elmeleti megkozelitesekhez kepest, hanem az, hogy amit anno es ma(!) vektorprocesszorkent arulnak, az vajon milyen felepitesu.

amugy meg egy idezet a konyvbol, "a futoszalagok alkalmazasai"-rol:
"Az elso alkalmazasi lehetoseg ugyanannak a muveletnek a sorozatos vegrehajtasa, mint peldaul, ket vektor egymast koveto elemeinek osszeadasa. A futoszalagtechnikat ily modon a vektorprocesszorok hasznositjak vektorutasitasok vegrehajtasara."

ez eleg egyertelmuenk tunik, nem?

Idézet

egyre nyilvanvalobb szamodra, hogy az altalad preferalt istallo a DSPket hivja vektorprocinak - mi a vilag nagyobb resze nem :D
a) nem preferalok en senkit! egyenlore ilyen szakirodalmat talaltam.
b) a vilag nagyobbik reszebe rajtad kivul ki is tartozik? :p hozhatnal vegre nehany komolyabb hivatkozast..,
c) ha ez a DSP, akkor a mai Cray es NEC vektorprocesszorok is DSP-k lennenek?? (kulonben mi a busnak emelnek ki a 8 pipeline-t az adatlapok?) nezd, SFIJ, egyre jobban ugy tunik, hogy nem egy orult megy szemben az autopalyan, hanem mindenki!! ;)

**********************************************************

Idézet: dezz

10 év nagy idő...
hat hogy is mondjam.. egyfelol azert a felsobb kategoriaban kicsit konzervativabb az ipar, kisse nehezebben fordul. itt nem egy-masfel evente cserelgetik az architekturat szemben az otthoni jatekosok igenyevel..

de en nyitott vagyok barmire! hozz nyugodtan frissebb szakirodalmat! (ahelyett, hogy orulnel, hogy a 15 evet mar 9-10-re leszoritottam ebbe kotsz bele? hm..)

Idézet

Ma már a PC-s procik....
vektorprocesszorokrol beszelunk, nem? nem PC-s megoldasokrol. irtam mar, hogy ne a PC-vel gyere. (a "valodi vektorprocesszor" kifejezes meg eleg vicces.. ez nem hittan, hogy a biblia megmondja, hogy mi a valodi..!)

Idézet

a mai vektorprocik is full SIMD-esek (teljesen párhuzamosak) valahány bitig (128, 256, ?), és csak afölött jön be újra az átlapolásos futószalagosítás.
hat tekintve azt, hogy az elso szerencsetlen Cray-1 is 4096 bites volt, egy mai vektorprocesszor meg.... ha az NCE-orl szolo wiki cikket nezem, akkor az talan 10Mbit szelessegu lehet..  szoval ez a "valahany bitig teljesen parhuzamosak" nem er tul sokat ebben. bosegesen kell am futoszallagokkal megtamogatni. (amugy meg miert erdekes ez? csak nem ugy gondoltad, hogy azt allitom, hogy tobbszorozesi technikat nem is hasznalnak a voktorprocesszorokban? persze, hogy hasznalnak! de futoszalagot is, nem is kicsit.)

Idézet

Btw, ideje lenne elismerned, hogy az SPE-k egyenként akár kvázi-scalar, összességében szoftver-futószalagos, más szóval felfűzött működtetésének semmi köze a fenti dologhoz - ergo, ami az említett módon megoldható, nem feltétlenül SIMD-esíthető.
a) meg egyszer mondom: valojaban nem az az erdekes, hogy a mai vektorprocesszork milyenek, hanem csak az, hogy bizonyos pipeline szamitasok ekvivalensek a vektorprocesszorokkal. (illetve, hogy ezek a bizonyos szamitasok igen gyakoriak.)
b) "nem feltetlenul"?? en soha nem mondtam azt, hogy "feltetlenul"!!! en csak annyit mondtam, hogy van olyan eset, amikor igen, es hogy ez az eset gyakori.
a forum ma:
"Ez van bazdmeg, ha nem tetszik, el lehet menni."

#1695 Felhasználó inaktív   SFIJ 

  • Őstag
  • PipaPipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 20.145
  • Csatlakozott: --

Elküldve: 2007. 06. 16. 09:31

látom bogdán, nagyon rá vagy erre a pipeline dologra gyóygulva. tudod amit csinlász az kb olyan, mintha azt mondanád, hogy a budapesti bkv autóbuszok legfontosabb attribútuma az, hogy kékek. és való igaz, nem lehet elvitatni azt hogy kékek, de ha valaki nem látja be, hogy nem ez a legfontosabb tulajdonságuk...  :smoker:

a további csuszákkal most nem foglalkoznék - nincs hozzá kedv :Đ
νιψονανωμηματαμημωνανοψιν

What do stars do? They shine.(Yvaine)

#1696 Felhasználó inaktív   bogdan 

  • Őstag
  • PipaPipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 18.631
  • Csatlakozott: --

Elküldve: 2007. 06. 16. 10:03

hogymivan????
mikor mondtam en, hogy a vektorprocesszorok legfontosabb tulajdonsaga lenne a pipeline?? olvass mar vissza egy picit, mert ez a hozzaallas nem tul produktiv.

dezz allitotta, hogy nem azok (Te mellesleg csatlakoztal), en meg irtam, hogy marpedig de..

hogy jott ide a legfontosabb tulajdonsag? nem ertelek.

ha a tobbi "csuszka" is hasonlo szinvonalu.....
a forum ma:
"Ez van bazdmeg, ha nem tetszik, el lehet menni."

#1697 Felhasználó inaktív   SFIJ 

  • Őstag
  • PipaPipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 20.145
  • Csatlakozott: --

Elküldve: 2007. 06. 16. 10:37

Idézet: bogdan - Dátum: 2007. jún. 16., szombat - 10:03

hogymivan????
mikor mondtam en, hogy a vektorprocesszorok legfontosabb tulajdonsaga lenne a pipeline?? olvass mar vissza egy picit, mert ez a hozzaallas nem tul produktiv.

dezz allitotta, hogy nem azok (Te mellesleg csatlakoztal), en meg irtam, hogy marpedig de..

hogy jott ide a legfontosabb tulajdonsag? nem ertelek.

ha a tobbi "csuszka" is hasonlo szinvonalu.....

pipeline ekvivalencia, hmm? :Đ
νιψονανωμηματαμημωνανοψιν

What do stars do? They shine.(Yvaine)

#1698 Felhasználó inaktív   bogdan 

  • Őstag
  • PipaPipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 18.631
  • Csatlakozott: --

Elküldve: 2007. 06. 16. 11:00

kvazi ekvivalenciarol irtam, maradjunk is ennel.
a forum ma:
"Ez van bazdmeg, ha nem tetszik, el lehet menni."

#1699 Felhasználó inaktív   dezz 

  • Törzsvendég
  • PipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 740
  • Csatlakozott: --

Elküldve: 2007. 06. 16. 12:00

Idézet: bogdan - Dátum: 2007. jún. 16., szombat - 9:42

hat hogy is mondjam.. egyfelol azert a felsobb kategoriaban kicsit konzervativabb az ipar, kisse nehezebben fordul. itt nem egy-masfel evente cserelgetik az architekturat szemben az otthoni jatekosok igenyevel..
Hát pedig de. Gondolod, hogy nem használják ki a technika új lehetőségeit? Mit is mondtál, hány pipeline lépéses az újabb nagygépek vektorprocijai, 256, 512, v. még több elemű vektorszámításoknál? 8? Na, ebből láthatod, hogy már itt sem elemenként hajtódik végre a dolog, hanem 32 (256/8) elemet egyszerre dolgoz fel SIMD-ben... És így megy végig az összes elemen.

Idézet

vektorprocesszorokrol beszelunk, nem? nem PC-s megoldasokrol. irtam mar, hogy ne a PC-vel gyere.
A Cell SPE-it hova sorolnád?

Idézet

(a "valodi vektorprocesszor" kifejezes meg eleg vicces.. ez nem hittan, hogy a biblia megmondja, hogy mi a valodi..!)
CPU-k SIMD egységei: nem valódi vektorprocik, csak vektor egységek, erre vonatkozott a "valódi".

Idézet

hat tekintve azt, hogy az elso szerencsetlen Cray-1 is 4096 bites volt, egy mai vektorprocesszor meg....
64 (4096/64) lépéses pipeline hosszúságú volt?

Idézet

ha az NCE-orl szolo wiki cikket nezem, akkor az talan 10Mbit szelessegu lehet..  szoval ez a "valahany bitig teljesen parhuzamosak" nem er tul sokat ebben. bosegesen kell am futoszallagokkal megtamogatni.
Nem sokat ér? Csak 4x-es sebességnövekedést  (DP FP) 256 bitnél, 8x-os 512 bitnél, stb. :) Ha visszaolvasol, láthatod, hogy már én is írtam ezt.

Idézet

(amugy meg miert erdekes ez? csak nem ugy gondoltad, hogy azt allitom, hogy tobbszorozesi technikat nem is hasznalnak a voktorprocesszorokban? persze, hogy hasznalnak! de futoszalagot is, nem is kicsit.)
Hát... Erősen úgy tűnt, ezt állítod. :) Az általad belinkelt irodalomban is a vektorprociban még nem volt valódi, egy idejű SIMD végrehajtás, azt csak a tömbprociknál említették... szerk: ezen hsz első idézete tőled is éppen az, hogy nem változtatják olyan könnyen a jól bevált architektúrát (ami az irodalom szerint tehát full pipelined kellene legyen).

Idézet

a) meg egyszer mondom: valojaban nem az az erdekes, hogy a mai vektorprocesszork milyenek, hanem csak az, hogy bizonyos pipeline szamitasok ekvivalensek a vektorprocesszorokkal. (illetve, hogy ezek a bizonyos szamitasok igen gyakoriak.)
A nagyon régi vektorprocikkal - ha egyátalán volt valaha olyan, ami egyátalán nem tartalmazott valódi, egyidejű SIMD végrehajtást.

Idézet

b) "nem feltetlenul"?? en soha nem mondtam azt, hogy "feltetlenul"!!!
Dede. Ezt írtad: "(gy.k.: nincs olyan, hogy vektorizalni nem tudom, de futoszallagositani igen..)". (Mellesleg itt te instruction pipeline-ról beszélsz, miközben és szoftveresről, de mindegy.)

Idézet

en csak annyit mondtam, hogy van olyan eset, amikor igen, es hogy ez az eset gyakori.
Ezt gondold át újra... Még1x: az SPE-k felfűzáséről van szó, melyek teljesen más kódsort hajtanak végre, és csak az eredményt adják tovább. Ez teljesen más dolog, mint a SIMD végrehajtás.

Szerkesztette: dezz 2007. 06. 16. 12:06 -kor


#1700 Felhasználó inaktív   dezz 

  • Törzsvendég
  • PipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 740
  • Csatlakozott: --

Elküldve: 2007. 06. 16. 12:19

Idézet: bogdan - Dátum: 2007. jún. 16., szombat - 11:03

dezz allitotta, hogy nem azok (Te mellesleg csatlakoztal), en meg irtam, hogy marpedig de..

Idézz pontosan! Én azt mondtam, hogy ma már nem olyanok, és ezt utána pontosítottam arra, hogy bizonyos bitszámig nem olyanok. (És a végén még az is kiderülhet, hogy soha nem is voltak full pipeline-esek, hanem már eleve vegyes feldolgozásúak voltak.)

Téma megosztása:


  • (92 Oldal)
  • +
  • « Első
  • 83
  • 84
  • 85
  • 86
  • 87
  • Utolsó »
  • Nem indíthatsz témát.
  • A téma zárva.

1 felhasználó olvassa ezt a témát.
0 felhasználó, 1 vendég, 0 anonim felhasználó