SFIJ: igen, jol mondod, Nemeth Gabor a konyv egyik szerzoje, es valoban, ezt tanitotta meg a 90-es eveg vegen is. es bar emberileg egy szornyu alak, en nem latom, hogy a konyve barmiben is rosszabb lenne, mint mas konyvek!
dezz: jossz itt a modern vektorprocesszorokkal, hogy azok nem igy mukodnek, es 128 meg 256 bites utrol beszelsz?? mar a Cray1 is 64 db 64 bites adatot dolgozott fel egyszerre, ez 4k bit utszelesseg. egy mai NEC vektorprocesszor a wikipedia szerint 256 adaton dolgozik egyszerre pipeline-onkent. (bar nem irja, hogy a "word" milyen szeles.) kulon kiemeli, hogy 8 pipeline-bol all a processzor. mint ahogy a Cray vektorprocesszoranak leirasa is 8 pipeline-t emel ki!
komolyan ugy hiszed, hogy a mai vektorprocesszorok konkret fizikai megvalositasa nem pipeline rendszeru? en ketlem.. (es ne az asztali processzorok SSE egysegevel gyere!)
**********************************************************
azt irod, hogy erted, amit mondok, es olvassak vissza, es valaszoljak erdemben. en szivesen megtennem, tenyleg! de meg mindig ugy velem, hogy nem erted azt, amit irtam. remelem nem haragszol meg ram, ha ugy velem, amig nem erted teljes egeszeben az elvet, amit kifejtettem nem tartom jo otletnek egyesevel valaszolni, mert az csak (ugy hiszem) ertelmetlen sardobalasba torkolna.
hogy mast ne emlitsek, az a kerdes, hogy egy mai vektorprocesszor hogy epul fel teljes mertekben erdektelen az allitasomhoz! akar igy, akar ugy epul fel az allitasomon ez mitsem valtoztat. azt mondod erted, amit irok. akkor latod ezt is? latod, hogy semmi koze hozza?
**********************************************************
szoval a tegnap esti utan, ok, hogy LY nem szimpatizal vele, de feltetelezem o 120%-ban erti a dolgokat, bizonyara jobban, mint pl. en, igy szamara eleg unalmas a kerdeskor.. szoval egy kis visszakanyarodas.
nem kivantam azt irni, hogy a pipeline 100%-ban ekvivalens a vektorprocesszorral. azt irtam (eredetileg is), hogy nagyreszt, tobbnyire ekvivalens. ha kesobb irtam is olyat, ami teljes mertekunek ertelmezheto, azt csak azert tettem, mert az olvasokozonseg semminemu hasonlosagot nem velt felfedezni, igy a modalitasi resz nem volt annyira erdekes.
*******************************************************
szoval nezzuk meg a pipeline es a vektorprocesszor hasonlosagait! mindketto parhuzamos architektura (tobb elemen vegez egyszerre muveletet), es mindkettore
szigoruan igaz, hogy nem lehet az elemek kozott adatfuggoseg. kulonbseg termeszetesen van, megpedig az, hogy a vektorprocesszor (meg ha pipeline felepitesu is, ami termeszetesen nem befolyasolja semmiben sem az elvet!) szigoruan azonos muveleteket hajt vegre a bemeno adat elemein, mig a pipeline elvben mas-mas muveletet is
vegezhet elemenkent. (SFIJ peldaja az elozo oldalon a nem vektorizalhato pipeline-rol azert rossz, mert nem irja le a teljes rendszert, ahol vagy kiderulne, hogy adatfuggoseg van, vagy az, hogy konnyeden vektorizalhato 2 db A es 6 db B egyseg segitsegevel..)
az elvben mas-mas persze felvet problemakat, megpedig azt, hogy a kulonbozo muveletek vegrehajtasi ideje eroteljesen kulonbozhet, igy ez esetben a pipeline nem jol kihasznalt (buborekokkal telitodik). a masik problema, az adatfuggoseg, miszerint soha nem epulhetnek egymasra a bejovo szamitasok (legalabbis a pipeline hosszanal rovidebb tavon.) ebbol kovetkezik, hogy a pipeline szervezodes is igazabol a steaming tipusu adatfeldolgozasban hasznos, megpedig ott, ahol sok elemen hasonlo muveletet kell vegrehajtani. (es szerencsenk van: sok ilyen feladat letezik.)
dezz otleteben, miszerint
HA nem lehet vektorizalni a feladatot (ez egy fontos premissza!), akkor bontsuk fel pipeline szeruen, es ugy adogassuk az SPE-knek sorba. latszik, hogy az adatfuggosegi feltetel ebben az esetben iszonyatosan megno, hiszen egy SPE minimum szazas nagysagrendu utasitast kell, hogy vegrehajtson (kulonben a kommunikacio elvinne minden elonyt), igy a fuggosegi ablak ezres nagysagrendekbe tolodna ki.
az en allitasom az, hogy ilyen ezres nagysagrendu utasitassorokat talalni, amelyekben nincsenek fuggosegek nem konnyu. illetve ez nem teljesen igaz: konnyu, ha sok adaton fuggetlen es azonos utasitasokat kell vegrehajtanunk. azaz ez nem technologiai, hanem empirikus erv. azonban ha ide jutottunk, akkor maris az
azonos utasitasok fuggetlen elemeken feladathoz
tudjuk hasznalni a vektorprocesszorkent uzemelo egysegeket, hiszen biztosan tudjuk vektorizalni a feladatot (lasd a vektorizalhatosag felteteleit az elso bekezdesben..). (legfeljebb nemi idobeli eltolasra van szuksegunk, de ez nem elvi, hanem csak technologiai kerdes, es meg csak nem is problema.)
******************************************************
uff.. remelem ertheto voltam.
Szerkesztette: bogdan 2007. 06. 12. 09:40 -kor