Idézet: Jocika - Dátum: 2006. jan. 4., szerda - 21:52
Ákos; a 13-as albert nem jó?
Csak mert reggel még fent volt a honlapodon, most meg már nincs...
Sajnos nem jó. Úgy tűnik az Einsteinnél sokkal szűkebb a tűrésmező mint a SETI-nél, vagy talán nincs is. Kb. 60 bit pontosságúak voltak az eredményeim, a SETI-nél bőven elég volt 20, ezért is lehetséges az SSE egyszerű használata.
A 0013-as után még feltornáztam a SIN/COS számítás pontosságát is 64 bitre (maximum), de ekkor már nem voltam gyorsabb a processzorba integrált FSINCOS utasításnál. Tehát kijelenthető hogy jelentősen gyorsítani csak az osztó rutin további módosításával lehetséges.
Még lehet hogy teszek pár kísérletet egy SSE (+ FPU) alapú Newton-Raphson iterációval finomított reciprokképzésre, bár az igazi az SSE2 (+ FPU) alapú lenne, ugyanis az FPU CW/PC=10 (53 bites mantissza, dupla pontos értékek) pontosságal számol az osztásnál. Ilyen pontosságú az SSE2 is.
Az iterációra azért van szükség mert a SSE alatt csak 12 bites reciproktáblázatot lehet előcsalogatni a CPU-ból (AMD esetén 14-15 bit)...