Kötetlenül, a VGA kártyákról...

(157 Oldal)
« Elsõ
←
46
47
48
49
50
→
Utolsó »

Nem indíthatsz témát.
A téma zárva.

Kötetlenül, a VGA kártyákról... mindennapi társunk, a VGA... Értékeld a témát:

#941 SATAN

Senior tag

Csoport: Fórumtag
Hozzászólások: 3.786
Csatlakozott: --

Elküldve: 2008. 11. 09. 01:03

Idézet: Warrior - Dátum: 2008. nov. 8., szombat - 20:26

Miért érdekel mennyi a videomem-használat?

Ertem a lenyeget annak amit az optimalizaciorol irtal. koszonom a faradtsagod hogy ilyen boven leirtad.
De ebbol meg mondjuk mindig nem teljesen tiszta hogy maga a jatek gyartoja hogy optimalizal hogyha optimalizalni akar. mert a te peldadnal te az ASMel megkerulod az apit es kozvetlenul a hardverhez nyulsz ,es kozvetlenul a hardverhez windowsban csak a vga driver nyulhat ha jol tudom.szal elvileg ilyen szintu optimalizaciot nem hajthat vegre a jatek programozoja. Mondjuk nem tudom hogy dx api belul mennyire van rendszerkozeli programozasi lehetoseg. ha van ra lehetoseg akkor ha kap segitseget a vga gyartotol akkor mar lehetseges, de ebben nem vagyok biztos hogy dx en belulrol te tudsz kozvetlenul a vgahoz nyulni hogy kihasznaljad a belso felepites adta lehetosegeket.

A video memoria hasznalat meg azert erdekel mert nekem csak 384MBos kartyam van es szeretnem tudni hogy az egyes progiknal teszteknel mikor fogy ki a memoriabol. mennyivel dobja meg a memoriahasznalatot egy fsaa pl meg ilyesmi.Mindig is ezgatott hogy mennyire er hatrany engem amiatt hogy nincs 512MB ramom.
Amikor belassul a kartyam akkor a memoria miatt lassul be vagy a gpu sebesseg miatt.

Szerkesztette: SATAN 2008. 11. 09. 01:24 -kor

ASUS P5K, C2D E4300 1800@2700MHz, 2X1GB/800 Kingmax ram,Gainward GTX 460 1GB,1db 200GB Maxtor+1db 400GB WD Sata+1db 500GB Sata WD+1db 500GB Sata Samsung,1500GB Sata Samsung, 500W Chieftech táp, Benq FP222Wa TFT , Logitech mouseman Dual Optical mouse, Delux slim billentyuzet

${lang:go_to_top}$
Tetejére of the page up there ^

#942 SATAN

Senior tag

Csoport: Fórumtag
Hozzászólások: 3.786
Csatlakozott: --

Elküldve: 2008. 11. 09. 01:08

amugy megtalaltam volna hogy hol lehet beallitani a rivatunerbe de sajnos azt irja hogy vista alatt nem megy. es most nekem win7 van es azalatt sem jelenik meg

${lang:go_to_top}$
Tetejére of the page up there ^

#943 Warrior

Őstag

Csoport: Fórumtag
Hozzászólások: 10.246
Csatlakozott: --

Elküldve: 2008. 11. 09. 03:38

Idézet: SATAN - Dátum: 2008. nov. 9., vasárnap - 2:03

... Amikor belassul a kartyam akkor a memoria miatt lassul be vagy a gpu sebesseg miatt.

Egy adott alkalmazás közben lassul be?

Szerintem a 384-512-ben messze nincs olyan jelentõs különbség, mint pl. a 128-256-ban, hiába azonosak a méretbeli különbségek.

"Hey Ripley, don't worry. Me and my squad of ultimate badasses will protect you! Check it out! Independently targeting particle beam phalanx. Vwap! Fry half a city with this puppy. We got tactical smart missiles, phase-plasma pulse rifles, RPGs, we got sonic electronic ball breakers! We got nukes, we got knives, sharp sticks..."

${lang:go_to_top}$
Tetejére of the page up there ^

#944 SATAN

Senior tag

Csoport: Fórumtag
Hozzászólások: 3.786
Csatlakozott: --

Elküldve: 2008. 11. 09. 10:00

Idézet: Warrior - Dátum: 2008. nov. 9., vasárnap - 4:38

Egy adott alkalmazás közben lassul be?

Szerintem a 384-512-ben messze nincs olyan jelentõs különbség, mint pl. a 128-256-ban, hiába azonosak a méretbeli különbségek.

Jaja akozben akarom megnezni. pl kideriteni hogy a devil may cry 4 DX10 es tesztjeben miert esik visszaa annyira a sebesseg amikor dx9 es modban meg egeszen jo helyen vegzek. de ott pl 16X FSAAban egyeztunk meg hogy azzal teszteljunk. de ha jol tudom az AA az megdobja a memoriahasznalatot plusz meg a DX10 es verzio is tobb memoriat eszik es hogy amiatt lassul e be nagyon.

Szerkesztette: SATAN 2008. 11. 09. 10:06 -kor

${lang:go_to_top}$
Tetejére of the page up there ^

#945 Virus9AX

Őstag

Csoport: Fórumtag
Hozzászólások: 7.611
Csatlakozott: --

Elküldve: 2008. 11. 09. 12:15

Idézet: Warrior - Dátum: 2008. nov. 9., vasárnap - 4:38

Egy adott alkalmazás közben lassul be?

Szerintem a 384-512-ben messze nincs olyan jelentõs különbség, mint pl. a 128-256-ban, hiába azonosak a méretbeli különbségek.

Méretben lehet hogy azonos de arányában nem:
128>256 duplája lett a memória méret
384>512 1/3-val nõtt csak a memória méret.

Mondjuk ekkora VGA memórára meg ilyen hülye memóra felosztásokra csak az NV-nek van szüksége mert a szar felépítésbõl adódóan hamar kifogyna a memóriából ha 256 ot használna.
Egy ATI-nál meg még bõven elég az is.

${lang:go_to_top}$
Tetejére of the page up there ^

#946 SATAN

Senior tag

Csoport: Fórumtag
Hozzászólások: 3.786
Csatlakozott: --

Elküldve: 2008. 11. 09. 13:07

Idézet: Virus9AX - Dátum: 2008. nov. 9., vasárnap - 13:15

errol jut eszembe anno neztem egy tesztet ahogy egy 256Mb os 8800GTbe flasheltek egy 512 es biosat es gyorsabb volt sok helyen a sima(256mb os) valtozatnal. kicsit furcsanak talaltam hogy ezt meg lehetett csinalni es hogy miert lett vajon gyorsabb...(talan mashogy szervezi a dolgokat es ezert?)
Akkor egy pillanatig arra gondoltam h ki kene probalni az en karimba egy 768Mb oset fleshelni de mondom inkabb nem rizikozok ilyen hulyeseggel, mivel tobb tesztet nem lattam a 8800GTrol sem, aztan franc se tudja mennyire hiheto ugy.

Szerkesztette: SATAN 2008. 11. 09. 14:00 -kor

${lang:go_to_top}$
Tetejére of the page up there ^

#947 NetTom

Senior tag

Csoport: Fórumtag
Hozzászólások: 3.563
Csatlakozott: --

Elküldve: 2008. 11. 10. 11:29

Idézet: SATAN - Dátum: 2008. nov. 9., vasárnap - 2:03

Túl magasszintûnek képzeled el a DX-et, szerintem ezért "nem érted", hogy lehet optimalizálni egy adott architektúrára.

A DX nem úgy mûködik, hogy kiadod, hogy rajzolj kockát, legyen köd, meg stb... (nagyon leegyszerûsítve), hanem azt kell leprogramoznod, hogyan végezze el az elõbbi feladatokat lépésrõl lépésre (durván egyszerûsítve pixel, vertex, regiszter szinten) mit csináljon a GPU az adatokkal.

Az optimalizációt egy adott hardverre pont ez teszi lehetõvé, hogy a megvalósítás során olyan programot lehet írni ami egyik kártyán jól megy, a másikon pedig lassabban mégis ugyanaz az eredmény. (És pont ez teszi lehetõvé hardver független effektek és megvalósítások létrehozását, vagyis a rugalmasságot ami egyre inkább elõtérbe kerül.)
Például a DX elõírja legyen összeadás mûvelet.
Ha egy Geforce egyszerre csak 1 összeadást tud elvégezni, de gyorsabban mert nagyobb az órajele, mint egy párhuzamosan 5-öt összeadni képes Radeon lassabb órajellel, akkor kedvezhetsz optimalizálással mind a két típusnak.
A Geforce-nak egy olyan kód ami egymás után összead 5 számot de úgy, hogy a kód egyes utasításai mindig megvárják az elõzõ eredményét (vagyis függõek, így nem hajthatóak végre egymással párhuzamosan), de ez nem követelmény az eredmény szempontjából, akkor az gyorsabb lesz a Geforce-on a nagyobb órajel miatt, mert õ is meg a Radeon is csak egymás után tudja végrehajtani (1-et órajelenként) .
Ha olyan kódot írsz ami párhuzamosan összeadja a számokat (mondjuk kettesével), akkor viszont a Radeon nyerhet, mert míg a Geforce-nak egyesével végig kell hajtani minden utasítást megvárva az eredményeket, addig a Radeon kettesével párhuzamosan el tudja végezni a feladatot (pl 2/3 idõ alatt, mert az lassabb órajel miatt azért nem ideális a nyereség ügye), hiába alacsonyabb az órajele. Extrém esetben pl mind az 5-öt elvégzi párhuzamosan mert olyan jó a kód, akkor 5x gyorsabb logikailag.

Amikor egy játékot fejlesztessz, akkor a fentihez hasonló döntéseken múlik/múlhat, hogy milyen gyors lesz egy játék egy adott kártyán és bizony támogatói nyomásra lehetséges a másik versenytárs hátránybahozása.

Remélem érthetõ, amit akartam írni ilyen gyorsan.

Itt van pl angolul a fenti jellegû dolog szemléltetve mai hardveren: http://www.anandtech...aspx?i=3341&p=6

Persze van még számos más mód "optimalizálásra", ez csak egyike volt a sok módnak.

Szerkesztette: ThomasS31 2008. 11. 10. 11:52 -kor

${lang:go_to_top}$
Tetejére of the page up there ^

#948 CAC

Törzsvendég

Csoport: Fórumtag
Hozzászólások: 511
Csatlakozott: --

Elküldve: 2008. 11. 10. 11:49

Ezt olvastátok már: win7 vs cf/sli?

Kissé kiábrándít, ugyanis a w7 eddig nagyon jó kritikákat kapott. Én is ezt akarom majd használni, de cf-es lapom van, s noha még sosem volt, de mindig kacérkodom egy cf-es rendszer kiépítésének a lehetõségével.

Zavard össze a Világot: mosolyogj hétfõn!
-----------------------------------------------------------
Eladó cuccok:
2db bontatlan Samsung 3D-s szemüveg
Cooler Master Wavemaster full alu ház
Bolti (csak kipróbálva volt!!) VTX3D 6870

${lang:go_to_top}$
Tetejére of the page up there ^

#949 NetTom

Senior tag

Csoport: Fórumtag
Hozzászólások: 3.563
Csatlakozott: --

Elküldve: 2008. 11. 10. 11:57

Idézet: CAC - Dátum: 2008. nov. 10., hétfõ - 12:49

Ez nem az a CF amire te gondolsz, a Hybrid arról szól, hogy van az alaplapon egy gyengébb GPU, amit pl általánosan használsz, és beteszel egy erõsebb GPU kártyát pl játékokra és eközött realtime váltogat a driver attól függõen milyen számítási teljesítmény kell. (Vagy te váltassz manuálisan.)
Ez amugyis csak az alsó kategóriában elérhetõ és mûködik jelenleg.

De ez nem érinti és nem is azonos a csúcskategóriás kétkártyás rendszermegoldásokkal.

${lang:go_to_top}$
Tetejére of the page up there ^

#950 SATAN

Senior tag

Csoport: Fórumtag
Hozzászólások: 3.786
Csatlakozott: --

Elküldve: 2008. 11. 10. 12:00

Idézet: ThomasS31 - Dátum: 2008. nov. 10., hétfõ - 12:29

Túl magasszintûnek képzeled el a DX-et, szerintem ezért "nem érted", hogy lehet optimalizálni egy adott architektúrára.

Valoszinuleg ez volt a kulcsa a problemamnak. nem tudtam/tudom hogy dx en belul mennyire lehet reszletekbe menoen alkotni.en inkabb kepzeltem ugy ahogy emlitetted hogy csak megmondom mi legyen, es hogy a hogyannal nem foglalkozik a DX.Ha viszont tud a hogyannal is foglakozni hogy ezzel kiaknazza az egyes vgak elonyeit akkor ok.
most akkor viszont megint az kezdett el foglalkoztatni hogyha dxen belul lehet ennyire jol optimalizalni akkor a driverkeszitok mit optimalizalnak a driverben amivel plusz fpseket csikarnak ki

faraszto vagyok tudom

Szerkesztette: SATAN 2008. 11. 10. 12:23 -kor

${lang:go_to_top}$
Tetejére of the page up there ^

#951 NetTom

Senior tag

Csoport: Fórumtag
Hozzászólások: 3.563
Csatlakozott: --

Elküldve: 2008. 11. 10. 12:40

Idézet: SATAN - Dátum: 2008. nov. 10., hétfõ - 13:00

faraszto vagyok tudom

Driverben ügye a DX kód->GPU kód konverzió történik. Itt, ha van erõforrás rá (pl CPU) akkor lehet elemezni a kódot párhuzamosságok keresésére, vagy le lehet cserélni konkrét kódokat hatékonyabbra, persze úgy hogy az eredmény nem változik. Ergo "real-time" optimalizációt lehet csinálni. Persze ehhez tudni és elemezni kell, a játék/program miként használja a hardverünk. De ez meg nem gond, hisz ki más ismerné illetve férne hozzá jobban nálunk a hardverünkhöz.

(Erre egyébként ékes példa és bizonyíték az, hogy manapság CPU tuningal nagyobb gyorsulást lehet elérni, mint GPU tuninggal sok esetben...)

Közben volt idõm kis példát összedobni:
Szóval össze kell adni hat számot: S=A+B+C+D+E+F, tegyük fel ez a mûveletsor hozza létre a ködünk.

Geforce legyen 100Hz és egy mûvelet per órajel, Radeon 75Hz és két mûvelet per órajel.

Ha úgy valósítom meg hogy:
1. s1= A+B
2. s2= s1+C
3. s3= s2+D
4. s4= s3+E
5. S= s4+f
Akkor a Geforce és a Radeon is 1 mûveletet tud végrehajtani órajelenként a függõség miatt, így:
Geforce 5/100= 0.05s alatt végez
Radeon 5/75= 0.066s alatt végez

Ha úgy valósítom meg pl:
1. s1= A+B (Radeon 1.)
2. s2= C+D (Radeon 1.)
3. s3= s1+E (Radeon 2.)
4. s4= s2+F (Radeon 2.)
5. S= s3+s4 (Radeon 3.)
Akkor a Geforce megintcsak 1 mûveletet tud végrehajtani a Radeon viszont az elsõ és második párt párhuzamosan tudja, így:
Geforce 5/100= 0.05s marad
Radeon 3/75= 0.04 lesz.

Persze ez elég primitív példa.

Amugy jelenleg az a helyzet ugye valóságban is, hogy a Geforce 1 mûveletet végez 1 órajel alatt, míg a Radeon 5-öt képes ideális esetben. Így elméletileg egy 4850 is bõven jobb lenne ideális esetben mint egy GTX280. Csak ügye a kód nem lehet mindig ideális erre, mint ahogy az elõzõ linkelt oldalon is látszik.

Ha valami nagy gyorsulást okoz egy driver, akkor könnyen lehet, hogy egy fenti kódcserét végeznek "on-the-fly" a driverben, vagy valami más hatékonyságnövelést találtak a kódban.

Szerkesztette: ThomasS31 2008. 11. 10. 12:50 -kor

${lang:go_to_top}$
Tetejére of the page up there ^

#952 SATAN

Senior tag

Csoport: Fórumtag
Hozzászólások: 3.786
Csatlakozott: --

Elküldve: 2008. 11. 10. 12:52

a peldakat ertem, mar az anandteches cikknel is ertettem.
Csak azt nem tudtam hogy mi tortenik melyik szinten. mi a driver szinten es mi jatekprogramozoi szinten.

Tehat driver szinten tortenik gyakorlatilag az optimalizalatlan kod optimalizalasa olyan szempontbol hogy megprobal a kodban olyat keresni amit gyorsabban tud megcsinalni annal mint ahogy a jatek programozo kitalalta, es akkor azt a kodreszt vegulis atirjak ?
Csak azt rossz realtimeban csinalni, miert nem adnak ki inkabb patchet a jatekhoz a driverfejlesztok hogy a gyarilag optimalizalt kod fusson es ne kelljen ezert prociidot vagy mas eroforrast felhasznalni? vagy a jatek kodjat fizikailag nem tudjak atirni patch formajaban? csak idieglenesen azt tudjak hogy a dx adta kodot a kozvetlenul futtatas elott atirja hogy hogy legyen elvegezve?

Szerkesztette: SATAN 2008. 11. 10. 12:55 -kor

${lang:go_to_top}$
Tetejére of the page up there ^

#953 NetTom

Senior tag

Csoport: Fórumtag
Hozzászólások: 3.563
Csatlakozott: --

Elküldve: 2008. 11. 10. 12:54

Idézet: SATAN - Dátum: 2008. nov. 10., hétfõ - 13:52

Igen, csak nem a játék kódját írják át állandóra, hanem a driverben mindig "realtime" kicserélik.
Jobb esetben persze kiadhat a készítõ is egy javítást a játékhoz, ha abból profitál minden fél.

${lang:go_to_top}$
Tetejére of the page up there ^

#954 SATAN

Senior tag

Csoport: Fórumtag
Hozzászólások: 3.786
Csatlakozott: --

Elküldve: 2008. 11. 10. 12:58

Idézet: ThomasS31 - Dátum: 2008. nov. 10., hétfõ - 13:54

meg pont szerkesztettem egyet de szerencsere arra is jo lett a valaszod

Gondolom ha patchet akarnak irni ahhoz kell a jatekfejlesztok segitsege, vagy meg lehet csinalni effektiv egy ilyet a segitseguk nelkul?

Szerkesztette: SATAN 2008. 11. 10. 13:00 -kor

${lang:go_to_top}$
Tetejére of the page up there ^

#955 NetTom

Senior tag

Csoport: Fórumtag
Hozzászólások: 3.563
Csatlakozott: --

Elküldve: 2008. 11. 10. 13:03

Idézet: SATAN - Dátum: 2008. nov. 10., hétfõ - 13:58

meg pont szerkesztettem egyet de szerencsere arra is jo lett a valaszod

Gondolom ha patchet akarnak irni ahhoz kell a jatekfejlesztok segitsege, vagy meg lehet csinalni effektiv egy ilyet a segitseguk nelkul?

Azért nem irható át mindig fixen, mert az nem feltétlen jó mindkét félnek. Lehet, hogy amit nyersz a másik fél meg elbukja vagy mégrosszabb.

Pl ha az egyik kártya tudna SIN/COS mûveletet hardveresen a másik meg nem (ezért a játék kód valami szoftveres megoldást használ), de a driver ezt felismeri és kicseréli egyetlen SIN mûveletre, attól még a játék készítõje nem tudja átírni, mert akkor a másikon egyáltalán nem menne a játék.

${lang:go_to_top}$
Tetejére of the page up there ^

#956 SATAN

Senior tag

Csoport: Fórumtag
Hozzászólások: 3.786
Csatlakozott: --

Elküldve: 2008. 11. 10. 13:12

Idézet: ThomasS31 - Dátum: 2008. nov. 10., hétfõ - 14:03

Azért nem irható át mindig fixen, mert az nem feltétlen jó mindkét félnek. Lehet, hogy amit nyersz a másik fél meg elbukja vagy mégrosszabb.

ez vili. de mondjuk nem cserel olyan nagyon surun vga kartyat az ember, hogy baj legyen ha felrakja az ember a patchot. mondjuk persze csak akkor rakja fel ha olyan a kartyaja amire terveztek.
Vagy tul sok patch kellene szinte minden egyes kartyahoz vagy azert az egy szeriaba(pl osszes HD 3XXXhez? mert mind ugyanugy epul fel lenyegeben ha jol tudom) tartozokhoz eleg lenne tobbsegben ugyanaz a patch?

Elmeletben lehetseges amugy egy patch irasa a jatekgyarto tudta nelkul? vagy ahhoz kell tudni olyan dolgokat amit csak a jatek gyartoja tud?

Szerkesztette: SATAN 2008. 11. 10. 13:14 -kor

${lang:go_to_top}$
Tetejére of the page up there ^

#957 NetTom

Senior tag

Csoport: Fórumtag
Hozzászólások: 3.563
Csatlakozott: --

Elküldve: 2008. 11. 10. 13:16

Idézet: SATAN - Dátum: 2008. nov. 10., hétfõ - 14:12

Persze kell a fejlesztõ támogatása általában, mert itt szellemi tulajdonról van szó. Plussz a driver nem feltétlen végez magasabb szintû elemzéseket, így nem feltétlen derül ki minden összefüggés a játékkód egészében, hanem csak valami pillanatnyi.
Sok esetben a fejlesztõk nem foglalkoznak már ilyen szinten a játék utóéletével, csak nagyon kritikus hibákat javítanak. Vagy nem érdekük (pl az Assassin Creed féle DX10.1 AA javtása)...stb

Röviden itt az adott helyzettõl függ mindig mi a lehetõség. Persze lehetséges az is amit írtál.
Sõt van hogy egy harmadik fél végez kódoptimalizációt egy adott kártya és program között (pl egy átfogó/teljes, un "total conversion mod" keretén belül).

Szerkesztette: ThomasS31 2008. 11. 10. 13:18 -kor

${lang:go_to_top}$
Tetejére of the page up there ^

#958 CAC

Törzsvendég

Csoport: Fórumtag
Hozzászólások: 511
Csatlakozott: --

Elküldve: 2008. 11. 10. 13:28

Idézet: ThomasS31 - Dátum: 2008. nov. 10., hétfõ - 12:57

Valóban, ezt most én értelmeztem félre. :respect:

Ez esetben továbbra is várom már 2009 nyarát és a Windows 7-et.

${lang:go_to_top}$
Tetejére of the page up there ^

#959 Warrior

Őstag

Csoport: Fórumtag
Hozzászólások: 10.246
Csatlakozott: --

Elküldve: 2008. 11. 10. 14:17

Idézet: ThomasS31 - Dátum: 2008. nov. 10., hétfõ - 12:29

...
Ha egy Geforce egyszerre csak 1 összeadást tud elvégezni, de gyorsabban mert nagyobb az órajele, mint egy párhuzamosan 5-öt összeadni képes Radeon lassabb órajellel, ...

Ó, köszi! Errõl megfeledkeztem, mármint a párhuzamos végrehajtás fontosságáról. Ebben is eltérnek az egyes gyártók termékei.

${lang:go_to_top}$
Tetejére of the page up there ^

#960 NetTom

Senior tag

Csoport: Fórumtag
Hozzászólások: 3.563
Csatlakozott: --

Elküldve: 2008. 11. 10. 14:34

Ügye, ha csak a shader számolási teljesítményt néznénk nagyon leegyszerûsítve, akkor az alábbi táblázat szerint látható a Radeonok mekkora skálán mozoghatnak a kód függvényében.
Tisztán látszik pl a 3870 miért lassabb néha mint a 9600GT majdnem. Valószínûleg azokban az esetekben a shaderkód nem párhuzamosítható és a textúrázás egyenlõ. De az is látszik hogy ideális esetben meg jóval többre lenne képes.

Ha valaki átnézi a netes tesztek átlagát, akkor nagyon jól látszik, hogy pl a valódi ATI teljesítmény nagyon közel esik a "Min" shaderszám szerinti rangsorukhoz a GPU-k között. Ebbõl adódóan valószínûleg a mai kódok nem optimálisak csak az nVidia számára.