hvuk, a buzz-on irtad:
Idézet
A legújabb pletykák szerint azonban az L1 cache késleltetése 3 ciklusról 2 ciklusra csökken a K10-ben,
Majdnem bejott!... A GDC-n elhangzottak szerint tenyleg valtozik a L1 load latency a Barcelona-ban, de egyreszt nem csokken, hanem novekszik, 3-rol 4-re, masreszt szerencsere csak a FP load-ot erinti. A tobbi stimmel.

L1D=64KB, L1I=64KB hivatalosan, az FP load pipe eggyel hosszabb, mint eddig, mert a 128 bites loadokhoz kellett egy extra lepcso.
Tovabba lehet szurkolni, hogy gyenge a szovegertesem, mert ha jol ertem, a sse128 store kisse hulyen van megoldva... 2uops-ot fogyaszt (nix fastpath???) , meg egyszerre mindket L1D portot lefoglalja (mivel az L1D store csak 2x64 bit szeles), es igy ugye blokkolja a loadot :confused: .... Aztan persze lehet, hogy a load-reorderinggel egyutt ez nem is annyira veszes...
No es nem vektorizalt koddal ofkoz nem lesz gyorsabb a Barcelona... (a hosszabb pipeline miatt, ha a tobbi modositas ezt nem kompenzalja, meg lassabb is lehet... szegeny x87 kodok.

)
Udv,
B.