HWSW Informatikai Kerekasztal: Cell (by Sony, Toshiba and IBM) - HWSW Informatikai Kerekasztal

Ugrás a tartalomhoz

Mellékleteink: HUP | Gamekapocs

  • (92 Oldal)
  • +
  • « Első
  • 80
  • 81
  • 82
  • 83
  • 84
  • Utolsó »
  • Nem indíthatsz témát.
  • A téma zárva.

Cell (by Sony, Toshiba and IBM) Valóban forradalmi lesz? Értékeld a témát: -----

#1621 Felhasználó inaktív   dezz 

  • Törzsvendég
  • PipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 740
  • Csatlakozott: --

Elküldve: 2007. 06. 11. 21:51

Idézet: bogdan - Dátum: 2007. jún. 11., hétfő - 22:21

idoben told el, es talan meglatod az ekvivalenciat..

de kezdheted a masik oldalrol is: probald kisakkozni hogy lesz futoszallagbol vektorprocesszor, ha megvan latni fogod az ekvivalenciat!
Tehát most arra gondolsz, hogy a vektorprociban több végrehajtóegység van, és ezek az adott számítás (szerk: nem úgy értettem, hogy ugyanaz) más-más fázisánál tartanak.

Csakhogy, itt az egyes egységek SIMD-ben működnek. Én meg arról beszéltem, hogy az egyes egységek skalárisan számolnak, de más-más fázist. (Persze a legjobb, ha ők is SIMD-ben dolgoznak, csak ugye éppen egy olyan esetről van szó, amikor ez valami miatt nem megy.)

Nos, hogy is lett a többfázisú skalárból SIMD?

Szerkesztette: dezz 2007. 06. 11. 22:00 -kor


#1622 Felhasználó inaktív   d n . r 

  • Senior tag
  • PipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 2.211
  • Csatlakozott: --

Elküldve: 2007. 06. 11. 21:56

Idézet: dezz - Dátum: 2007. jún. 11., hétfő - 22:51

Én meg arról beszéltem, hogy az egyes egységek skalárisan számolnak, de más-más fázist

Pontosan ez a lényeg, márpedig ha nincs ugye "same instruction", akkor lőttek a SIMD-végrehajtásnak! :)

#1623 Felhasználó inaktív   bogdan 

  • Őstag
  • PipaPipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 18.631
  • Csatlakozott: --

Elküldve: 2007. 06. 11. 21:59

hat az azonos fazisok altal!!

meg egyszer:
"probald kisakkozni hogy lesz futoszallagbol vektorprocesszor, ha megvan latni fogod az ekvivalenciat!"

a futoszallag elven megvalositott vektorprocesszor egysegei egymashoz kepest ugyanis NEM SIMD modon mukodnek! ez csak eltolva igaz, eppen ugy, mint az altalad megvalositani kivant esetben.
a forum ma:
"Ez van bazdmeg, ha nem tetszik, el lehet menni."

#1624 Felhasználó inaktív   d n . r 

  • Senior tag
  • PipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 2.211
  • Csatlakozott: --

Elküldve: 2007. 06. 11. 22:03

Idézet: bogdan - Dátum: 2007. jún. 11., hétfő - 22:59

a futoszallag elven megvalositott vektorprocesszor egysegei egymashoz kepest ugyanis NEM SIMD modon mukodnek!

Ezt szerintem nem is állította senki.
Viszont Te _ekvivalenciát_ állítóttál a futószallag-elv és a "vektorprocesszor" között. Most akkor az utóbbin nem a SIMD végrehajtást értetted? Akkor viszont most mi ekvivalens itt mivel?

Szerkesztette: d n . r 2007. 06. 11. 22:05 -kor


#1625 Felhasználó inaktív   bogdan 

  • Őstag
  • PipaPipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 18.631
  • Csatlakozott: --

Elküldve: 2007. 06. 11. 22:04

Idézet: d n . r - Dátum: 2007. jún. 11., hétfő - 22:40

Ezt mondjuk egyébként kételm, hiszen pl. ha csak skalár műveletere szánod a processzorodat, akkor ott vektorizálni nem tudsz, ellenben futószallagosítani meg igen.
Vagy rosszul gondolnám?

rosszul. mondom, hogy nagyjabol ekvivalens, kulonben nem lehetne futoszallaggal megvalositani a vektorprocesszort!

es nem a Tannenbaumban kell nezni. az masrol szol, mas szinten.

*************************************************************
az a lenyeg, hogy SIMD-beli "azonos utasitas" lehetseges idoben eltolva is!
a forum ma:
"Ez van bazdmeg, ha nem tetszik, el lehet menni."

#1626 Felhasználó inaktív   bogdan 

  • Őstag
  • PipaPipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 18.631
  • Csatlakozott: --

Elküldve: 2007. 06. 11. 22:07

Idézet: d n . r - Dátum: 2007. jún. 11., hétfő - 23:03

Ezt szerintem nem is állította senki.

mar hogyne. mindketten. kulonben mi ertelme volna emlegetni, hogy a futoszallagban nincs SIMD? csak ugy van ertelme ennek az allitasnak, ha szemben ezzel azt allitjatok, hogy lam, lam, a vektorprocesszor viszont SIMD.

ami igaz, csak megvalositasilag (futoszallaggal) nem szigoruan. pont ugyanannyira, mint a futoszallagositott esetek tulnyomo resze.


****************************************
"a "vektorprocesszor" között. Most akkor az utóbbin nem a SIMD végrehajtást értetted?"
NEM. a "vektorprocesszor" alatt egeszen konkretan vektorprocesszort ertek. tudod, egy kis kutyu, ami bizonyos tulajdonsagokkal bir....

Szerkesztette: bogdan 2007. 06. 11. 22:34 -kor

a forum ma:
"Ez van bazdmeg, ha nem tetszik, el lehet menni."

#1627 Felhasználó inaktív   d n . r 

  • Senior tag
  • PipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 2.211
  • Csatlakozott: --

Elküldve: 2007. 06. 11. 22:07

Idézet: bogdan - Dátum: 2007. jún. 11., hétfő - 23:04

rosszul. mondom, hogy nagyjabol ekvivalens, kulonben nem lehetne futoszallaggal megvalositani a vektorprocesszort!

es nem a Tannenbaumban kell nezni. az masrol szol, mas szinten.

*************************************************************
az a lenyeg, hogy SIMD-beli "azonos utasitas" lehetseges idoben eltolva is!

Hm, hát én ezt nagyon nem értem... Sem azt, hogy "kulonben nem lehetne futoszallaggal megvalositani a vektorprocesszort!" (ez mitől lenne bármiben is ekvivalencia?) és "az a lenyeg, hogy SIMD-beli "azonos utasitas" lehetseges idoben eltolva is!" (ez meg mitől lenne SIMD?...)

#1628 Felhasználó inaktív   d n . r 

  • Senior tag
  • PipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 2.211
  • Csatlakozott: --

Elküldve: 2007. 06. 11. 22:09

Húha, egyre kevésbé értem.
Én a magam részéről futószallag-ELV-ről és SIMD-VÉGREHAJTÁSRÓL beszéltem, mert ezekről a kifejezésekről látom, hogy van értelmük, és hogy mi is az értelmük.

#1629 Felhasználó inaktív   d n . r 

  • Senior tag
  • PipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 2.211
  • Csatlakozott: --

Elküldve: 2007. 06. 11. 22:13

Idézet: bogdan - Dátum: 2007. jún. 11., hétfő - 23:04

az a lenyeg, hogy SIMD-beli "azonos utasitas" lehetseges idoben eltolva is!

Megpróbálom dekódolni. :)
Pl. egy háromdimenziós vektort skalárszorzol. Azaz mindhárom koordinátáját szorzod X-szel. Ezt eltolhatod időben (azaz egymás _után_ szorzod meg őket), de akkor ez ugye _nem_ SIMD (azt pont arra találták ki, hogy az ilyeneket _egyszerre_ csinálhasd), így nem értem, mitől lenne már "lehetséges" eltolni az iőben... Akkor már nem lenne az, ami... :)

#1630 Felhasználó inaktív   dezz 

  • Törzsvendég
  • PipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 740
  • Csatlakozott: --

Elküldve: 2007. 06. 11. 22:13

szerk: ez RE: bogdan 22:59

Te most egy olyan futószallagra gondolsz, ami az eredetileg SIMD utasítást elemenként időben eltolva dolgozza fel? Ennek mi értelme lenne? Miért nem tudja egyszerre (azonos elem -> azonos fázis)? Nem tudom, volt-e ilyen vektorproci, de a maiak nem ilyenek: egy-egy egység az összes elemen dolgozik egyszerre, és ezen belül pipe-olva.

Másrészt, nem feledkeztél meg véletlenül arról, hogy az említett esetben az SPE-k nem 1-1 utasítást végeznek el, aztán már adják is tovább az adatot a másiknak, hanem egy egész kódsort - SPE-nként mást... Plusz az egyes SPE-k nem 1 utasításnyival vannak más fázisban, hanem az egyik ott folytatja a műveletet, ahol a másik befejezte.

Szerkesztette: dezz 2007. 06. 11. 22:14 -kor


#1631 Felhasználó inaktív   bogdan 

  • Őstag
  • PipaPipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 18.631
  • Csatlakozott: --

Elküldve: 2007. 06. 11. 22:47

sok a zavar.. lassunk egy kis szakirodalmat:
http://www.renyi.hu/~bogdan/foto/5-Special...chitekturak.pdf
a forum ma:
"Ez van bazdmeg, ha nem tetszik, el lehet menni."

#1632 Felhasználó inaktív   SFIJ 

  • Őstag
  • PipaPipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 20.145
  • Csatlakozott: --

Elküldve: 2007. 06. 11. 22:58

Idézet: bogdan - Dátum: 2007. jún. 11., hétfő - 20:56

(gy.k.: nincs olyan, hogy vektorizalni nem tudom, de futoszallagositani igen..)

dehogynincs :D van egy a műveleted, legyen a végrehajtási ideje T, legyen egy B műveleted, aminek a végrehajtási ideje 3T. Legyenek ezek mondjuk atomi SQL tranzakciók. Nézzük az A+B műveletet. lehet egy olyan megoldás, hogy egyben lemagy az A+B , megjön az eredmény, és beütemezem utána a köv inputot. Ez azt jelenti, hogy 4T időközönként indíthatsz új műveletet. Most csináljuk azt, hogy fogunk egy procit ami csak A műveleteket végez és vegyünk 3 db másik procit, ami csak B műveleteket. fűzzük fel szépen őket úgy hogy:
                   + - B - +
in - A -szelektor- + - B - + - MUX - out
                   + - B - +

Namost egy ilyen sémában ugya T időközönként indíthatsz műveletet, aminek az ideje kicsit több lesz mint 4T de a hatékonyságod 4x-eződött!
νιψονανωμηματαμημωνανοψιν

What do stars do? They shine.(Yvaine)

#1633 Felhasználó inaktív   dezz 

  • Törzsvendég
  • PipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 740
  • Csatlakozott: --

Elküldve: 2007. 06. 11. 22:59

Mondom én... Ez az irodalom a vektorprocik igen korai megvalósítását tárgyalja. Ma már a 128 bites operandusú műveletek számára 128 bites adatsín és regiszterek állnak rendelkezésre, ezért utasításon belül, tehát elemenként már nincs átlapolás.

#1634 Felhasználó inaktív   SFIJ 

  • Őstag
  • PipaPipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 20.145
  • Csatlakozott: --

Elküldve: 2007. 06. 11. 23:02

Idézet: d n . r - Dátum: 2007. jún. 11., hétfő - 21:48

Most nincs nálam sajna a Tanenbaum: Számítógép-architektúrák könyv, de pl. emlékeim szerint abban ez tök jól le van írva (meg nyilván még 1000 másik könyvben, amiket nem ismerek :) )

ha ezt a nevet még1x elírod, a véredet veszem! :Đ
νιψονανωμηματαμημωνανοψιν

What do stars do? They shine.(Yvaine)

#1635 Felhasználó inaktív   Laa-Yosh 

  • Senior tag
  • PipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 3.770
  • Csatlakozott: --

Elküldve: 2007. 06. 11. 23:03

Idézet: dezz - Dátum: 2007. jún. 11., hétfő - 22:10

De vannak kivételek. 1. Lásd pl. 2nd gen. CrossFire: az egyik kártya fizikára használható. Ha csak egymás után mehetne a dolog, nem lenne sok értelme külön egy kártyán csak fizikára használni.

WTF?
A két kártya simán dolgozhat két különböző képkockán, vagy a game kód által már befejezett adatokon... ez marhára nem kapcsolódik ahhoz, amit írtam...

Idézet

2. Nemrég olvastam egy interjút egy PC-s fejlesztővel; úgy tervezik kihasználni a többmagos procikat, hogy a 2. mag a fizikát és az AI-t számolja, ill. ha van még mag, akkor az AI arra kerül át. Ennek is csak akkor van értelme, ha párhuzamosan működhet. A kulcs talán az, hogy a rendering közben már a köv. frame "fizikáját" számolják.


Ergo marad a szekvenciális feldolgozás, plusz buknak pár miliszekundumot. Össze tud ám adódni...

Idézet

De talán 1-1 főfeladat többé-kevésbé párhuzamosítása sem akkora ördöngősség.


De igen, ez a baj - nagy ördöngősség. Évtizednyi szoftverfejlesztés mehet a kukába, lehet a jól bevált algoritmusokat kidobni, újakat kitalálni. Még nem érett meg rá az ipar, nincs elég akadémiai kutatás a témában, beledobták a game ipart a mélyvízbe.

És ismétlem, a párhuzamosítás másik akadálya a local store, ami 256k - de ha jót akar a kóder, akkor 128k-t használ, a másik 128k-ból meg vagy az előző taszk eredményeit írogatja ki, vagy a következő adatait olvassa be oda. Namost 128k-ba elég kevés dolog fér bele, lehet bitvadászni...


Az SPE-k sorbakötése meg megint más tészta, ilyenkor az egyik SPE kimenő adatai mennek a másikba további feldolgozásra, és így tovább. Nem úgy számít futószalagnak, ahogy a műveletvégző egységeken belüli feldolgozás...
LY

#1636 Felhasználó inaktív   SFIJ 

  • Őstag
  • PipaPipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 20.145
  • Csatlakozott: --

Elküldve: 2007. 06. 11. 23:05

Idézet: dezz - Dátum: 2007. jún. 11., hétfő - 22:13

szerk: ez RE: bogdan 22:59

Te most egy olyan futószallagra gondolsz, ami az eredetileg SIMD utasítást elemenként időben eltolva dolgozza fel? Ennek mi értelme lenne? Miért nem tudja egyszerre (azonos elem -> azonos fázis)? Nem tudom, volt-e ilyen vektorproci, de a maiak nem ilyenek: egy-egy egység az összes elemen dolgozik egyszerre, és ezen belül pipe-olva.

hát attól fúgg mit nevezel mainak. a pentium4 pl a szorzást 16 bites egségekkel, kaszkádosítva, időben eltólva végezte. a prescott már 32 biteseket használt :D
νιψονανωμηματαμημωνανοψιν

What do stars do? They shine.(Yvaine)

#1637 Felhasználó inaktív   SFIJ 

  • Őstag
  • PipaPipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 20.145
  • Csatlakozott: --

Elküldve: 2007. 06. 11. 23:08

Idézet: dezz - Dátum: 2007. jún. 11., hétfő - 21:10

Multitaskingról volt szó, tehát jellemzően 1 task = 1 process, különféle feladatokkal.
ez oltárinagy tévedés. a mai modern videogame-ek is sok processzből állnak.

Idézet: dezz - Dátum: 2007. jún. 11., hétfő - 21:10

Akkor még1x: 1 process is a végrehajtás egy threadje, azaz szála, de a newthread() (stb.) egy konkrétan threadnek nevezett al-szálat indít el, ami osztozik a hozzá tartozó process összes erőforrásán. De a "multithreading" nem ilyen "thread"-ek egyidejű futtatását jelenti, hanem bármilyen szálakét, lehet az egy másik process is. Ez kb. olyan, mint "a Nap is egy nap, de nem minden nap a Nap". ;)
szerintem olvasd el a POSIX szabványt :D te erősen kevered a hw és a sw thread fogalmát, ami mondjuk nem meglepő, mert a modren OSek és processzorok is kezdik ezt a határt elmosni.
νιψονανωμηματαμημωνανοψιν

What do stars do? They shine.(Yvaine)

#1638 Felhasználó inaktív   Laa-Yosh 

  • Senior tag
  • PipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 3.770
  • Csatlakozott: --

Elküldve: 2007. 06. 11. 23:18

A nagy ereszdeleahajamot megszakítva talán érdemes lenne visszakanyarodni az alaptémához... mi a Cell?

Első körben van egy rakás vektoros egység, amik a brutál számítási kapacitást adják. Kompromisszum pl. a csak 32 bites IEEE adat kezelése, meg sok fotnos elem kihagyása (mindenből 8 kerülne a lapkára). Ezekre a funkciókra van a PPE, ami többé-kevésbé koordinálja is az SPE-ket, meg kiegészíti őket.

A sok ALU mit sem ér sávszélesség nélkül, de itt jön be a többi kompromisszum. Kicsi a cache, mert kell a lapkán a hely az SPE-knek; kicsi és borzasztó késleltetésű a memóriabusz, mert nem fér el a PS3 nyákon szélesebb vezeték meg több IC. Megoldás: az SPE-ket gyors belső busz köti össze és mindnek gyors lokális memóriája van, így minimalizálható a RAM elérés. Megint kompromisszum: local store tranzisztorok vs. SPE tranzisztorok -> kicsi a lokális memória is.

Az egész designról süt a konzolos filozófia. Ami a lapkára kerül, azon nem kell spórolni, mert pár process shrink után úgyis olcsó lesz; az alaplap és a RAM viszont nem szerveres hightech környezet, hanem baromi szűk keresztmetszet, mert azt nehezebb ócsítani és amúgy se gyártható saját üzemben.

Erre jön még a video alrendszer a maga hasonló trükkjeivel...

SZVSZ egyértelmű, hogy ez egy végletekig specializált rendszer, ahol a költség vs feature döntéseket a konzol piac sajátosságai határozták meg. Minden általános felhasználási kísérlet elsősorban PR és költségcsökkentés miatt indul, a rendszer alkalmassága ezen a fronton lényegtelen.
LY

#1639 Felhasználó inaktív   dezz 

  • Törzsvendég
  • PipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 740
  • Csatlakozott: --

Elküldve: 2007. 06. 11. 23:26

Idézet: Laa-Yosh - Dátum: 2007. jún. 12., kedd - 0:03

WTF?
Ez nagyon kellett...

Idézet

A két kártya simán dolgozhat két különböző képkockán, vagy a game kód által már befejezett adatokon... ez marhára nem kapcsolódik ahhoz, amit írtam...
Dehogynem. Ez is egy lehetőség a feladatok egyidejű végzésére. Az most tök mindegy, hogy az egyik már a köv. frémen dolgozik. Mellesleg magam is írtam, hogy valószínű így megy a dolog.

Idézet

Ergo marad a szekvenciális feldolgozás, plusz buknak pár miliszekundumot. Össze tud ám adódni...
Szekvenciális, de nem úgy, hogy ugyanaz az egység végzi egymás után.

Idézet

De igen, ez a baj - nagy ördöngősség. Évtizednyi szoftverfejlesztés mehet a kukába, lehet a jól bevált algoritmusokat kidobni, újakat kitalálni.
Néha jót tesz egy kis forradalom.

Idézet

Még nem érett meg rá az ipar, nincs elég akadémiai kutatás a témában, beledobták a game ipart a mélyvízbe.
Ez van, ezt kell szeretni. Sajna a 10GHz-es proci egyelőre nem jött össze... És amúgy is rég kevés lenne.

Idézet

És ismétlem, a párhuzamosítás másik akadálya a local store, ami 256k
Magam is írtam már ezt.

Idézet

- de ha jót akar a kóder, akkor 128k-t használ, a másik 128k-ból meg vagy az előző taszk eredményeit írogatja ki, vagy a következő adatait olvassa be oda. Namost 128k-ba elég kevés dolog fér bele, lehet bitvadászni...
Ez szerintem nem jó ötlet - max. akkor, ha egy-egy taszk futási ideje igen rövidke.

Idézet

Az SPE-k sorbakötése meg megint más tészta, ilyenkor az egyik SPE kimenő adatai mennek a másikba további feldolgozásra, és így tovább.
Már én is írtam ezt.

Idézet

Nem úgy számít futószalagnak, ahogy a műveletvégző egységeken belüli feldolgozás...
ÉS??? Talán én jöttem ezzel? Akkor légyszi címezd neki. KÖSZ.

#1640 Felhasználó inaktív   SFIJ 

  • Őstag
  • PipaPipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 20.145
  • Csatlakozott: --

Elküldve: 2007. 06. 11. 23:27

Idézet: dezz - Dátum: 2007. jún. 11., hétfő - 22:59

Mondom én... Ez az irodalom a vektorprocik igen korai megvalósítását tárgyalja. Ma már a 128 bites operandusú műveletek számára 128 bites adatsín és regiszterek állnak rendelkezésre, ezért utasításon belül, tehát elemenként már nincs átlapolás.

szerintem félreértetted a jegyzetben írottakat.
νιψονανωμηματαμημωνανοψιν

What do stars do? They shine.(Yvaine)

Téma megosztása:


  • (92 Oldal)
  • +
  • « Első
  • 80
  • 81
  • 82
  • 83
  • 84
  • Utolsó »
  • Nem indíthatsz témát.
  • A téma zárva.

1 felhasználó olvassa ezt a témát.
0 felhasználó, 1 vendég, 0 anonim felhasználó