Amit te szeretnél azt pl OpenCL vagy hasonló nyílt szabványú kódnál tudnám elképzelni (feltéve hogy a CPU és a GPU is futtatni tudja a kódot valamilyen formában) és egy eléggé bonyolult thread kezelő algoritmussal, ami lekezeli azt a komplex "problémát", hogy egy gyors nem (annyira) párhuzamos CPU és egy lassabb, de nagyon párhuzamos GPU végrehajtó között optimálisan elosztja a feladatot.
Kieg: A másik lehetőség, hogy megírod CPU-ra és GPU-ra is kódot külön, és mind a kettőt futtatod egyszerre, és az eredményt összeadod a végén valahogy. Ehhez is kell a thread/process kezelő természetesen valamilyen formában, hogy össze legyen hangolva a dolog. De ez nem a CUDA, vagy a GPGPU képességeken múlik, hanem csakis a fejlesztőn, hogy hogyan implementálja a feladatot.
Szerkesztette: ThomasS31 2009. 04. 01. 21:11 -kor