-=RV870, GT300 - találgatások és tények=- ...avagy az első DX11 generáció
#3262
Elküldve: 2010. 12. 27. 12:37
Idézet: Abu85 - Dátum: 2010. 12. 27. 12:25
kivarjuk...

#3263
Elküldve: 2010. 12. 27. 12:57
Idézet: arn - Dátum: 2010. 12. 27. 12:37

Jövő október előtt szvsz nem lesz semmi a 28nm-es darabokból...
"To borrow the pharse of the ancient philosopher Clarksonius, 4th century B.C. - How hard can it be?"
"Have you ever thought: Oh no, my shoehorn is far too heavy? Well, help is at hand with this special lightweight, carbonfiber ended shoehorn."
"Clarkson you great oaf!"
Twittegylet
#3264
Elküldve: 2010. 12. 27. 13:03
Idézet: arn - Dátum: 2010. 12. 27. 13:37

Az AMD-nél nem sok a kérdés. Eléggé egyértelmű, hogy a dizájn merre bővíthető. Szvsz picit több shader egység egy blokkon belül, és plusz egy vagy kettő teljes blokk.
Az NV-nél az Echelonból lehet kiindulni. A felépítés valószínűleg megmarad, mert több GPC rontana a vezérlésen, de a CUDA magokba befér egy plusz FP ALU. Esetleg lesz egy FP ALU, az Int ALU pedig kibővül FP-re is. A memóriavezérlőt kell átdolgozni, hozzá kell adni a virtuális memória támogatását, és kell egy vagy kettő ARM mag bele. Kész is a Kepler. Jó esélye lesz az Intel Knights Corner ellen.
#3265
Elküldve: 2010. 12. 27. 13:24
post='6862454']
és kell egy vagy kettő ARM mag bele
Ez minek kellene bele???????
Szerkesztette: solyomferi 2010. 12. 27. 13:25 -kor
#3266
Elküldve: 2010. 12. 27. 14:00
Idézet: solyomferi - Dátum: 2010. 12. 27. 14:24
Mert a shader multiprocesszorok úgynevezett throughput optimized egységek, de néhány feladat igényli a latency optimized magokat. A kettő egy egységgel nem átfedhető. A mag vagy ilyen, vagy olyan, és ez a feldolgozás menetét is jelentősen befolyásolja. A shader multiprocesszorok például nagyon rosszul működnek a késleltetésre érzékeny feladatokban. Nem mellesleg a Kepler a fenti módosításokkal önálló platform lesz, vagyis képes operációs rendszert is futtatni. Hasonló lesz az Intel Knights Corner rendszere is. Az is képes lesz operációs rendszert futtatni.
#3267
#3268
Elküldve: 2010. 12. 27. 16:41
Idézet: Abu85 - Dátum: 2010. 12. 27. 14:00
Akkor minek PC elég videokarit venni.
#3269
Elküldve: 2010. 12. 27. 16:56
Idézet: solyomferi - Dátum: 2010. 12. 27. 17:41
Talán nem a játékosok PC-je lesz az elsődleges terület ahova tervezik/szükség van rá.

Nem jött össze neki, továbbküldték...
#3270
#3271
Elküldve: 2010. 12. 27. 17:45
#3272
Elküldve: 2010. 12. 27. 17:59
Idézet: zyrobs - Dátum: 2010. 12. 27. 17:45
huúhh ez ütött.


BF2 /

1103hrs / 1042hrs / 66hrs
#3273
Elküldve: 2010. 12. 27. 18:11
Idézet: Abu85 - Dátum: 2010. 12. 27. 13:00
lehet erted valojaban , lehet nem , ezert kifejtem bovebben mi is a lenyeg, egy gpu-ban egyszerre tobb ezer adatkeres van folyamatban , ha valamelyik thread nem kap adatot mert mondjuk nincs a cacheben az adat, a kulso memoriabol meg tobb ezer orajel mig megerkezik a keres utan, igy ezek a threadek nyugvo allapotba kerulnek , mihelyt az adat megerkezik felebrednek, ez nem problema abban az esetben amikor tobb ezer thread fut egyszerre
de amikor processzort emulalunk gpu-n akkor ez igen nagy problemava lep elo , a helyzet kezelese problemas, lehet javitani nagy cache-ek integralasaval lasd intel, vagy LocalStore manipulalasaval DMA adatmozgatassal egybeepitve lasd cell, esetleg prioritas bevezetese az adatkiszolgalo folyamatban , az nvidia szamara tobb lehetoseg adott, valoszinuleg az arm mag integralasa a legutolso opcio
inkabb a cache meretenek novelese a celszeru, localstore a mostani fermiben is adott esetleg egy kis dma beepitese elkepzelheto , es prioritas is valoszinu, tehat minden megoldast alkalmazni fognak a nagyobb hatekonysag erdekeben
aztan az is lehet hogy kitalalnak valami olyat amit nem tudok

www.m12technology.com
I'm CEO bitch
#3274
Elküldve: 2010. 12. 27. 18:42

Ez nyilván koncepció, mert az emulálás lassú. Ha gyors lenne mindenki x86-ot emulálna, de mivel lassú és a Transmeta is elbukott, így senki sem fog ilyen hardverrel előállni. Az ARM mag azért első számú opció, mert licenszelhető a teljes Core, és az elérhető lehetőségek közül a lehető leghatékonyabb megoldás ez. Ráadásul az ARM Cortex A15 a Maxwellre kész lesz, és azt a magot a szerverpiacra szánja az ARM. Az NV pedig előáll egy komplett HPC platformmal, amire van operációs rendszer, és nem kell Xeon vagy Opteron processzorokra költeni, továbbá az SM és az LP magok megoszthatják az adatokat egymással, vagyis egy tökéletes heterogén módon programozható rendszer. Az lehet, hogy neked ez nem tetszik, meg a PC-be nem lesz jó, de ezt az NV-nél brutálisan leszarják, mert nem neked akarnak megfelelni, mivel a HPC és a professzionális piac a fontos. Természetesen téged sem hagynak cserben a consumer rétegnek ott lesz a Tegra, még a CUDA-t is fogja egy későbbi implementáció támogatni. A Kepler a virtuális memória támogatásával, és a feltételezett egy-két ARM processzormaggal, szintén képes önállóan egy operációs rendszer futtatására. Arra is lehet építeni.
Minden cég egy irányba tart csak más-más elképzeléssel (még ha ezek az elképzelések, nem is különböznek gyökeresen). A cél közös. Teljes platformot kínálni, mert ez a jövő. Mindenki készül a rendszerszintű integrációra. Egy olyan meghatározó céget sem tudsz mondani, akik nem álltak elő, vagy nem fejlesztenek IGP-vel rendelkező CPU-t.
Szerkesztette: Abu85 2010. 12. 27. 18:45 -kor
#3275
Elküldve: 2010. 12. 27. 19:07
Idézet: abu - Dátum: 2010. 12. 27. 17:11
nem akarlak basztatni de par hete meg azon rohogtetek hogy 2 ghz-en mennek a shaderek az nvidian, olvasgass a ph-n az 580-as forumban

az arm processzor egy gane , arra nem lehet jovot alapozni , 1-2 ev mulva mar sehol sem lesznek
Szerkesztette: vers 2010. 12. 27. 19:07 -kor
www.m12technology.com
I'm CEO bitch
#3276
Elküldve: 2010. 12. 27. 19:33
Idézet: vers - Dátum: 2010. 12. 27. 20:07

az arm processzor egy gane , arra nem lehet jovot alapozni , 1-2 ev mulva mar sehol sem lesznek
Mutass egy olyan GeForce-ot az NVIDIA honlapjáról, ami 2 GHz-es shaderórajelen megy.

Ahhoz képest, hogy gané, minden telefonban ott van. Mint mondtam lehet, hogy neked nem tetszik az NVIDIA stratégiája, de mint minden cég nekik is a pénz az első. Éppen ezért olyan stratégiát építenek ki, amivel a legjobban járnak. Ha ez a stratégia áldozatokkal jár, akkor feláldoznak pár márkanevet, de a lényeg, hogy összességében anyagilag jól járjanak, és nem az, hogy a te igényeidet kielégítsék.
#3277
Elküldve: 2010. 12. 27. 19:46
Idézet: Abu85 - Dátum: 2010. 12. 27. 18:33

Ahhoz képest, hogy gané, minden telefonban ott van. Mint mondtam lehet, hogy neked nem tetszik az NVIDIA stratégiája, de mint minden cég nekik is a pénz az első. Éppen ezért olyan stratégiát építenek ki, amivel a legjobban járnak. Ha ez a stratégia áldozatokkal jár, akkor feláldoznak pár márkanevet, de a lényeg, hogy összességében anyagilag jól járjanak, és nem az, hogy a te igényeidet kielégítsék.
nem tudom elkepzelni hogy az nvidia csucs mernokei beraknanak egy armot a fermi melle, ilyen papirt nem lattam meg ahol ez lett volna irva , de Te se az tuti

www.m12technology.com
I'm CEO bitch
#3278
Elküldve: 2010. 12. 27. 20:20
Kérdés: We all know that Intel and AMD are looking at merging CPU cores and GPUs on the same die.
In my mind, the future is for hybrid computing, where different kind of processors working together and find their own kind of tasks to work on. Currently, multi-core CPU and many-core GPU are working together, tasks are distributed by software schedulers. Data parallel tasks are assigned to GPUs and task-parallel jobs are assigned to GPUs. However, communication between these two kinds of processors is the performance bottleneck. I hope NVIDIA can provide a solution on their desktop GPU product line too.
Bill Dally:
That's exactly right. The future is heterogeneous computing in which we use CPUs (which are optimized for single-thread performance) for the latency sensitive portions of jobs, and GPUs (which are optimized for throughput per unit energy and cost) for the parallel portions of jobs. The GPUs can handle both the data parallel and the task parallel portions of jobs better than CPUs because they are more efficient. The CPUs are only needed for the latency sensitive portions of jobs - the serial portions and critical sections.
Kérdés: Do you believe a time will come when GPU and CPU are on the same chip or "board" it seems the logical next step to avoid the huge PCI-E latency and have a better GPU-CPU interactivity ? i know there is ongoing research in this area already ...but what is your personal opinion on the possibility and benefits of this ?"
Bill Dally:
Our Tegra processors already combine CPUs and a GPU on a single chip. For interactivity what's important is not the integration but rather having a shared memory space and low latency synchronization between the two types of cores.
I don't see convergence between latency-optimized cores and throughput optimized cores. The techniques used to optimize for latency and throughput are very different and in conflict. We will ultimately have a single chip with many (thousands) of throughput cores and a few latency-optimized cores so we can handle both types of code.
Szerinted kinek a processzormagja licenszelhető? Mondj valamit az ARM-on kívül.

--- Spekuláció a Ray Tracey blogból:
- 2013: Maxwell with 4 CPU cores
- 2011: Kepler with 2 CPU cores
My bet is that Kepler will at least have one and probably two (ARM based) CPU cores and Maxwell will probably have 4 CPU cores on the GPU. The inclusion of true CPU cores on the GPU will make the CPU-GPU bandwidth problem of today obsolete and will enable smarter ray tracing algorithms like Metropolis light transport and bidirectional path tracing on the GPU. Biased rendering methods such as photon mapping and irradiance caching will be easier to implement. It will also give a tremendous performance boost to the (re)building of acceleration structures and to ray tracing of dynamic geometry, which will no longer depend on the slow PCIe bus. Apart from ray tracing, most other general computation tasks will also benefit greatly. I think this CPU/GPU combo chip will be Nvidia's answer to AMD's oft-delayed Fusion and Intel's Sandy Bridge.
Szerkesztette: Abu85 2010. 12. 27. 20:23 -kor
#3279
Elküldve: 2010. 12. 27. 20:28
Idézet: vers - Dátum: 2010. 12. 27. 20:46

Fermi... az a mostani architektúra és nem viszik tovább. Mivel van ARM licenszük és a Tegra processzoruk is erre épül, nem véletlenül prezentálták szeptemberben a GPU Technologia konferencián az elkövetkező fejlesztéseket.

http://www.nvidia.co.../Dally_SC10.pdf
(tuti fake dolog van a linken mert a beyond3d-n volt fenn !!!)
A heterogén működés az azt jelenti hogy CPU-n és GPU-n fog számolni. Más CPU meg nincs nekik csak a Tegra.
Nem jött össze neki, továbbküldték...
#3280
Elküldve: 2010. 12. 27. 20:45
www.m12technology.com
I'm CEO bitch