Idézet: hvuk - Dátum: 2004. szept. 7., kedd - 14:56
Nem igaz, hogy a pipe csökkenése annyi órajel, mint ahány stage-ből áll? Mert ugye elméletileg minden stage-en belül egy órajelen végez a processzor. Vagy ez nem minden stage-re igaz? Vagy most nagy baromságot mondtam?
Igen, baromságot mondtál. A többire meg: már nem egyszer le lett írva itt a szekcióban minden, amit most kérdezel. Én meg már nagyon-nagyon meguntam, hogy bár nem tanulsz, az agyszüleményeidet ugyanolyan lelkesedéssel adod elő ezredszerre is, amit aztán ezeregyedszerre is ki kellene javítani.
Idézet
Nyilván az a kérdés, hogy a következő line megjön-e időben? Meg az is (és erről fogalmam sincs), hogy miközben tölti be az előző cache line-t, közben kérheti-e már a következő tartalmát (lecsökkentve ezzel a latencyt). Ha nem, és a cache line feldolgozása után még nincs bent a következő line, akkor a latency csökkentése nyilván gyorsítja a működést. Persze csak minimális mértékben.
A valódi kérdés az, hogy kiszámítható-e időben a következő cacheline
helye. Egy minimális késleltetés pedig az OS overhead/cache trashing miatt elkerülhetetlen, de ez nem azt jelenti, hogy pl. egy WS-alkalmazáson -a Q3 nem ilyen - bármit is dobna a netburstba beheggesztett IMC.
Idézet
Viszont azt egyre kevésbé értem, hogy mi köze van annak, hogy milyen hosszú a pipe ahhoz, hogy mennyire profitál az alacsony késleltetésből. Mert annak van köze, hogy egy program stream jellegű és emiatt a latency nem befolyásolja igazán a teljesítményét, de ennek csak közvetett kapcsolata van a pipe hosszával. Továbbá az is jól látszik, hogy a streamesítés a legtöbb program esetén (legalábbis játékok esetén) nem igazán válik be, nem használják azt (vagy igen, de kicsi a hatékonyság) erre a legjobb példa a Doom 3.
A pipe length nem azonos a pipe-ben töltött órajelek számával. Az utóbbi az, ami igazán számít. Ehhez jön, hogy ha hosszú a pipe, akkor elegendő utasítással dolgozik ahhoz, hogy a buszt kitömjék a HW prefetch és load/writeback ciklusok. Hacsak pl. nem IO intenzív, vagy nincs tele olyan logikai döntéssorozatokkal, amik miatt a HW-prefetch csak szemetelni jó. Vagy nem ugrál ezer pici kódrészlet között, aminek a felét csak egyszer használja, ám bőven kilógnak az ICache-ból. Meg még ezer dolog, ami a WS-kategóriában tipikusan _nem_ jelentkezik.
Idézet
Ha Rive erre (a streamesített programokra) gondolt amikor azt mondta, hogy hosszú pipe esetén nem számít a latency, akkor bizony csak az alkalmazások egy szűk tartománya esetén (kódoló/dekódoló progik, tömörítők és profi 3D cuccok) van igaza, a legfontosabb desktop teljesítmény szegmensben, a játékok piacán nincs. Márpedig ha a desktop piacon valakinek gyors gépre van szüksége és emiatt áldoz rá, akkor az a legtöbbször a játékok miatt teszi, nem pedig a fentiek miatt. Már persze ahol a teljesítmény számít és nem azért kell 3 GHz-es processzor, mert a vállalat policy-je ilyet rendel a beosztáshoz.
Igeeeeennnnn! Már megint kedved szerint ugrálsz a kategóriák között! Nincs is annál nagyobb élmény, ugye?
Azért nem baj, ha mindig röhögök egy öblöset, amikor a desktop előkerül a Xeon, az Itanium meg a sokprocis Opteronok között? Ja, amúgy meg hányni lenne kedvem ettől