HWSW Informatikai Kerekasztal: AMD Hammer - negyedik rész - HWSW Informatikai Kerekasztal

Ugrás a tartalomhoz

Mellékleteink: HUP | Gamekapocs

  • (153 Oldal)
  • +
  • « Első
  • 103
  • 104
  • 105
  • 106
  • 107
  • Utolsó »
  • Nem indíthatsz témát.
  • A téma zárva.

AMD Hammer - negyedik rész Értékeld a témát: -----

#2081 Felhasználó inaktív   hvuk 

  • Senior tag
  • PipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 4.857
  • Csatlakozott: --

Elküldve: 2007. 02. 05. 23:04

Idézet: SFIJ - Dátum: 2007. febr. 5., hétfő - 21:07

a kerdesre a megfejtes a GTL+ busz. a 4 woodcrest core osztozik az 1 buszon, raadasul a memoria is 1ben van, megmeg az I/O is ott megy. opteronnal dedikaltan megy az I/O, lokalis a RAM es ott a 50GBites HT link a 2 cpu kozott.

A Woodcrest nem Bensley platformot használ? Mert ha igen, akkor ott külön dedikált busza van mindkét procinak.
Athlon 64 939 2 GHz Winchester mag, GigaByte NF4 K8N Ultra-9 (passzív chipset), GigaByte X800 (passzív), 2x512 KingMax HC 500 MHz, Hitachi 160 Gb, NEC 3520, Coolink BAT01VS (1040 ford.), Chieftec 420W, Chieftec ház, Samsung 193P TFT monitor

#2082 Felhasználó inaktív   SFIJ 

  • Őstag
  • PipaPipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 20.145
  • Csatlakozott: --

Elküldve: 2007. 02. 06. 05:39

Idézet: hvuk - Dátum: 2007. febr. 5., hétfő - 23:04

A Woodcrest nem Bensley platformot használ? Mert ha igen, akkor ott külön dedikált busza van mindkét procinak.

szerinted mégis mit mutatnak a mérési eredmények? Valamitől csak punnyad a pörformansz, nem? :)
νιψονανωμηματαμημωνανοψιν

What do stars do? They shine.(Yvaine)

#2083 Felhasználó inaktív   bogdan 

  • Őstag
  • PipaPipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 18.631
  • Csatlakozott: --

Elküldve: 2007. 02. 06. 09:29

inkabb meg kene elobb magyarazni az Opteron 104%-os skalazodasat!

szoval ez nem kerek.
a forum ma:
"Ez van bazdmeg, ha nem tetszik, el lehet menni."

#2084 Felhasználó inaktív   hvuk 

  • Senior tag
  • PipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 4.857
  • Csatlakozott: --

Elküldve: 2007. 02. 06. 09:31

Idézet: SFIJ - Dátum: 2007. febr. 6., kedd - 5:39

szerinted mégis mit mutatnak a mérési eredmények? Valamitől csak punnyad a pörformansz, nem? :)

De ezeket a válaszokat én is tudtam. Azt hittem van még valami mögötte. Akkor vegyük úgy, hogy szónoki kérdés volt. :D

Szerkesztette: hvuk 2007. 02. 06. 09:32 -kor

Athlon 64 939 2 GHz Winchester mag, GigaByte NF4 K8N Ultra-9 (passzív chipset), GigaByte X800 (passzív), 2x512 KingMax HC 500 MHz, Hitachi 160 Gb, NEC 3520, Coolink BAT01VS (1040 ford.), Chieftec 420W, Chieftec ház, Samsung 193P TFT monitor

#2085 Felhasználó inaktív   hvuk 

  • Senior tag
  • PipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 4.857
  • Csatlakozott: --

Elküldve: 2007. 02. 06. 09:33

Idézet: bogdan - Dátum: 2007. febr. 6., kedd - 9:29

inkabb meg kene elobb magyarazni az Opteron 104%-os skalazodasat!

szoval ez nem kerek.

Milyen 104%-os skálázódást? 1-ről 2 socketre? Ennek oka lehet, hogy nem ugyanaz a cég tesztelte vagy nem ugyanolyan oprendszer alatt, esetleg nem azzal a fordítóval vagy nem olyan beállításokkal.
Athlon 64 939 2 GHz Winchester mag, GigaByte NF4 K8N Ultra-9 (passzív chipset), GigaByte X800 (passzív), 2x512 KingMax HC 500 MHz, Hitachi 160 Gb, NEC 3520, Coolink BAT01VS (1040 ford.), Chieftec 420W, Chieftec ház, Samsung 193P TFT monitor

#2086 Felhasználó inaktív   bogdan 

  • Őstag
  • PipaPipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 18.631
  • Csatlakozott: --

Elküldve: 2007. 02. 06. 10:16

1 magrol 4 magra.

es azok az okok, amiket Te hoztal sem tul meggyozoek a linearisnal is jobb skalazodas szempontjabol!

ha meg igen, akkor nem is biztos, hogy ugy kikapna az Opteron 1 magosan a woodcresttol, ha az a bizonyos masik ceg, masik oprendszer alatt, mas forditoval csinalna.. szoval ezt igy sehogy sem lehet szerintem osszehasonlitani.
a forum ma:
"Ez van bazdmeg, ha nem tetszik, el lehet menni."

#2087 Felhasználó inaktív   hvuk 

  • Senior tag
  • PipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 4.857
  • Csatlakozott: --

Elküldve: 2007. 02. 06. 11:07

Bogdan, szerintem valamit keversz. Az általam idézett adatok közül az első normál spec eredmény, a második pedig rate. A kettő szerintem nem összevethető, legalábbis a SPEC2000 esetében még nem volt összevethető. Most nincs időm megnézni, hogy mi van a 2006 esetén, de szerintem ott sem.
Athlon 64 939 2 GHz Winchester mag, GigaByte NF4 K8N Ultra-9 (passzív chipset), GigaByte X800 (passzív), 2x512 KingMax HC 500 MHz, Hitachi 160 Gb, NEC 3520, Coolink BAT01VS (1040 ford.), Chieftec 420W, Chieftec ház, Samsung 193P TFT monitor

#2088 Felhasználó inaktív   bogdan 

  • Őstag
  • PipaPipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 18.631
  • Csatlakozott: --

Elküldve: 2007. 02. 06. 11:14

lehet, hogy keverek valamit, de Te is kiszamoltal egy skalazodast. ezt irod:
"Woodcrest rossz skálázódása is (ami meglepően rossz az eredményeket elnézve, mindösszesen csak 67% körüli (int esetben)"

ez mibol jott ki?
a forum ma:
"Ez van bazdmeg, ha nem tetszik, el lehet menni."

#2089 Felhasználó inaktív   hvuk 

  • Senior tag
  • PipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 4.857
  • Csatlakozott: --

Elküldve: 2007. 02. 06. 12:09

Idézet: bogdan - Dátum: 2007. febr. 6., kedd - 11:14

ez mibol jott ki?

Összevetettem az 1x2 magos és a 2x2 magos rate értékeket.
Athlon 64 939 2 GHz Winchester mag, GigaByte NF4 K8N Ultra-9 (passzív chipset), GigaByte X800 (passzív), 2x512 KingMax HC 500 MHz, Hitachi 160 Gb, NEC 3520, Coolink BAT01VS (1040 ford.), Chieftec 420W, Chieftec ház, Samsung 193P TFT monitor

#2090 Felhasználó inaktív   bogdan 

  • Őstag
  • PipaPipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 18.631
  • Csatlakozott: --

Elküldve: 2007. 02. 06. 13:14

ja, hogy megteveszteskent masra vonatkoztattad a skalazodast, mint amit beideztel.. cseles, cseles..

(maskor lehetne preciz hivatkozast adni? ;) marhogy az ilyen figyelmetlenek mint en is ertsek, mirol irsz..)
a forum ma:
"Ez van bazdmeg, ha nem tetszik, el lehet menni."

#2091 Felhasználó inaktív   hvuk 

  • Senior tag
  • PipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 4.857
  • Csatlakozott: --

Elküldve: 2007. 02. 06. 13:27

Idézet: bogdan - Dátum: 2007. febr. 6., kedd - 13:14

ja, hogy megteveszteskent masra vonatkoztattad a skalazodast, mint amit beideztel.. cseles, cseles..

(maskor lehetne preciz hivatkozast adni? ;) marhogy az ilyen figyelmetlenek mint en is ertsek, mirol irsz..)

Számomra triviális volt, hogy a specint és a specintrate eredményeket nem vetem össze. De valóban félreérthető, ha valaki nem gondol bele kellő mélységben a dologba.

Hivatkozás: www.spec.org :D
Athlon 64 939 2 GHz Winchester mag, GigaByte NF4 K8N Ultra-9 (passzív chipset), GigaByte X800 (passzív), 2x512 KingMax HC 500 MHz, Hitachi 160 Gb, NEC 3520, Coolink BAT01VS (1040 ford.), Chieftec 420W, Chieftec ház, Samsung 193P TFT monitor

#2092 Felhasználó inaktív   d n . r 

  • Senior tag
  • PipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 2.211
  • Csatlakozott: --

Elküldve: 2007. 02. 06. 14:32

A négymagos Opteronok pontosított útiterve

#2093 Felhasználó inaktív   d n . r 

  • Senior tag
  • PipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 2.211
  • Csatlakozott: --

Elküldve: 2007. 02. 06. 14:48

Persze még mindig nem láttam normális tesztet/previewt/kiszivárogtatást/akármit, amiből a clock-to-clock teljesítmény külömféle alkalmazásokban összevethető lenne, mindenesetre azért ha tényleg ilyen ütemben ilyen órajeleken hozzák, azért én azt sejtem, hogy ez kissé kevés lesz az AMDnek az üdvösséghez.
A Core 2 Quad tavaly debütált 2,66-on (és pl. a PH!en és Anandnál is 3,2 körül ment gyári léghűtéssel, ha jól emlékszem), Q3ban itt a 45 nano és a Penryn.
Ehhez képest a K8L 2008 H2-ben lesz (persze a táblázat szerint!) 2,6-on... 
Emlékezzünk az AMD slide-ra, ott egy 2,66os Quad-dal mérték össze a (nem tudjuk, milyen órajelűre becsléssel számított) K8L-lel.

Szerkesztette: d n . r 2007. 02. 06. 14:49 -kor


#2094 Felhasználó inaktív   hvuk 

  • Senior tag
  • PipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 4.857
  • Csatlakozott: --

Elküldve: 2007. 02. 06. 16:33

Idézet: d n . r - Dátum: 2007. febr. 6., kedd - 14:32


A DailyTech egy rakás szar. Ettől még lehetne igazuk ebben a kérdésben, de én kizártnak tartom. Teljesen irreális, hogy csak 2008 közepén jön ki a 2.6 GHz-es 4 magos K8L. Ezt azt jelentené, hogy az AMD (és nyilván az IBM) 65 nm-es technológiája egy rakás szutyok. Ez persze lehetséges, de nem valószínű.
Athlon 64 939 2 GHz Winchester mag, GigaByte NF4 K8N Ultra-9 (passzív chipset), GigaByte X800 (passzív), 2x512 KingMax HC 500 MHz, Hitachi 160 Gb, NEC 3520, Coolink BAT01VS (1040 ford.), Chieftec 420W, Chieftec ház, Samsung 193P TFT monitor

#2095 Felhasználó inaktív   d n . r 

  • Senior tag
  • PipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 2.211
  • Csatlakozott: --

Elküldve: 2007. 02. 06. 16:38

Idézet: hvuk - Dátum: 2007. febr. 6., kedd - 16:33

A DailyTech egy rakás szar. Ettől még lehetne igazuk ebben a kérdésben, de én kizártnak tartom. Teljesen irreális, hogy csak 2008 közepén jön ki a 2.6 GHz-es 4 magos K8L. Ezt azt jelentené, hogy az AMD (és nyilván az IBM) 65 nm-es technológiája egy rakás szutyok. Ez persze lehetséges, de nem valószínű.

Meglátjuk, mennyire lőttek mellé/alá. Majd pl. az INQ megmondja! :Đ

Amúgy ha így lenne, az nem a 65 nanóról mondana "ítéletet", hiszen ez egy monolit 4 magos, elvileg sokmindenben megváltoztatot design lesz a 2 magos K8hoz képest.

#2096 Felhasználó inaktív   hvuk 

  • Senior tag
  • PipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 4.857
  • Csatlakozott: --

Elküldve: 2007. 02. 06. 16:41

Ez érdekes. A K8L kódnevet mégis az AMd találta ki, de azt a Turionra alkalmazták. A K9 a DC K8 volt, a K8L-re pedig a K10-et alkalmazták. Persze akkor felmerül a kérdés, hogy miért írta azt az Inquirer, hogy a K9-et és a K10-et is törölték. :omg:  :rolleyes:

Idézet

...
While Intel and the rest of the industry was using the codename K8L for AMD's next-gen architecture revamp, K8L existed only in AMD's expired internal roadmaps - roadmaps that died a long, long time ago.

The "L" suffix in K8L actually meant Low-Power. And, you've guessed it right, this was a description for the Turion 64, which was introduced years ago. Surprised? You should not be, given the fact that K9 was actually a codename for the dual-core family, only introduced after Turion's debut in Las Vegas.

Also, differences between the upcoming K10 marchitecture the original K8 and K9 are far greater than most of the readers can assume, and having talked to a lot of industry analysts and insiders, we can freely say it could be a nice leap ahead to the smarter choice.

Athlon 64 939 2 GHz Winchester mag, GigaByte NF4 K8N Ultra-9 (passzív chipset), GigaByte X800 (passzív), 2x512 KingMax HC 500 MHz, Hitachi 160 Gb, NEC 3520, Coolink BAT01VS (1040 ford.), Chieftec 420W, Chieftec ház, Samsung 193P TFT monitor

#2097 Felhasználó inaktív   hvuk 

  • Senior tag
  • PipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 4.857
  • Csatlakozott: --

Elküldve: 2007. 02. 06. 16:45

Idézet: d n . r - Dátum: 2007. febr. 6., kedd - 16:38

Amúgy ha így lenne, az nem a 65 nanóról mondana "ítéletet", hiszen ez egy monolit 4 magos, elvileg sokmindenben megváltoztatot design lesz a 2 magos K8hoz képest.

De, bizony mondana véleményt a 65 nm-ről is. A 130nm->90nm-es váltásnál eljutottak a 2.6GHz-es SC verziótól a 2.8GHz-es DC verzióig (azonos TDP mellett). Jelelneg 120W TDP-nél 3 GHz-en járnak, ergo elvárható lenne 65nm-en minimum egy 2.8GHz-es verzió kihozatala jövő év közepén. Újratervezett core ide vagy oda.
Athlon 64 939 2 GHz Winchester mag, GigaByte NF4 K8N Ultra-9 (passzív chipset), GigaByte X800 (passzív), 2x512 KingMax HC 500 MHz, Hitachi 160 Gb, NEC 3520, Coolink BAT01VS (1040 ford.), Chieftec 420W, Chieftec ház, Samsung 193P TFT monitor

#2098 Felhasználó inaktív   Atti 

  • Őstag
  • PipaPipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 11.674
  • Csatlakozott: --

Elküldve: 2007. 02. 09. 11:53

Idézet

Február 7-én kezdte meg működését a ChiC a németországi Chemnitz-ben (régebbi nevén Karl-Marx-Stadt), a helyi egyetemen. A számítógép-rendszer 538 szerver node-jában összesen 2 152 darab AMD Opteron Rev. F processzor kapott helyet. Az IBM alaplapokat tartalmazó node-okat InfiniBand köti össze.
...
A CHiC aggregált teljesítménye 11 teraflop/s, így fel kell bukkannia a leközelebbi TOP500-as listán az első 100 leggyorsabb szuperszámítógép közt.


https://hup.hu/node/35385
WoT nick: Atti77

#2099 Felhasználó inaktív   hvuk 

  • Senior tag
  • PipaPipaPipaPipa
  • Csoport: Fórumtag
  • Hozzászólások: 4.857
  • Csatlakozott: --

Elküldve: 2007. 02. 10. 12:23

K8L újdonságainak teljes listája (mármint ami a neten eddig fellelhető). Van benne egy-két új információ is.

Quad-core
- Native quad-core design
- Redesigned and improved crossbar(northbridge)
- Improved power management
- New level of cache added, L3 VICTIM
Power management - DICE(Dynamic Independent Core Engagement)
- Supports separate CPU core and memory controller power planes to allow CPU to lower its power state while the memory controller is running full bore
- Enhanced AMD's PowerNow allows individual core frequencies to lower while other cores may be running full bore
Virtualization improvements
- Nested Paging(NP):
* Guest and Host page tables both exist in memory.(The CPU walks both page tables)
* Nested walk can have up to 24 memory acesses! (Hardware caching accelerates the walk)
* "Wire-to-wire" translations are cached in TLBs
* NP eliminates Hypervisor cycles spent managing shadow pages(As much as 75% Hypervisor time)
- Reduced world-switch time by 25%:
* World-switch time: round-trup to Hypervisor and back
Dedicated L1 cache
- 256bit 128kB (64kB instruction/64kB data) - egyes hírek szerint csak 32/32, ez passzolna a csökkentett latency-hez (e nélkül gyakorlatilag elképzelhetetlen a csökkentés)
- 2 x 128bit loads/cycle
- lower latency (valószínűleg 3-ról 2-re, de csak csökkentett cache-el)
Dedicated L2 cache
- 128bit 512kB
- 128bit bus to northbridge
- reduced latency
- eliminates conflicts common in shared caches - better for virtualization
Shared L3 cache
- 128bit 2MB
- Victim-cache architecture maximizes efficiency of cache hierarchy
- Fills from L3 leave likely shared lines in the L3
- Sharing-aware replacement policy
- Expandable
Independent DRAM controllers
- Concurrency
- More DRAM banks reduces page conflicts
- Longer burst length improves command efficiency
- Dual channel unbuffered 1066 support(applies to socket AM2+ and s1207+ QFX only)
- Channel Interleaving
Optimized DRAM paging
- Increase page hits
- Decrease page conflicts
Redesigned northbridge for higher bandwidth
- Increase buffer sizes
- Optimize schedulers
- Ready to support future DRAM technologies
Write bursting
- Minimize Rd/Wr Turnaround
DRAM prefetcher
- Track positive and negative, unit and non-unit strides
- Dedicated buffer for prefetched data
- Aggressively fill idle DRAM cycles
Core prefetchers
- DC Prefetcher fills directly to L1 Cache
- IC Prefetcher more flexible
* 2 outstanding requests to any address
HyperTransport 3
- up to four 16bit cHT links
- up to 5200MT/s per link
- un-ganging mode: each 16bit HT link can be divided in two 8bit virutal links

CPU Core IPC Enhancements:
Advanced branch prediction
- Dedicated 512-entry Indirect Predictor
- Double return stacksize
- More branch history bits and improved branch hashing
History-based pattern predictor
32B instruction fetch
- Benefits integer code too
- Reduced split-fetch instruction cases
Sideband Stack Optimizer
- Perform stack adjustments for PUSH/POP operations “on the side”
- Stack adjustments don’t occupy functional unit bandwidth
- Breaks serial dependence chains for consecutive PUSH/POPs
Out-of-order load execution
- New technology allows load instructions to bypass:
* Other loads
* Other stores which are known not to alias with the load
- Significantly mitigates L2 cache latency
TLB Optimisations
- Support for 1G pages
- 48bit physical address (256TB)
- Larger TLBs key for:
* Virtualized workloads
* Large-footprint databases and
* transaction processing
- DTLB:
* Fully-associative 48-way TLB (4K, 2M, 1G)
* Backed by L2 TLBs: 512 x 4K, 128 x 2M
- ITLB:
* 16 x 2M entries
Data-dependent divide latency
Additional fastpath instructions
– CALL and RET-Imm instructions
– Data movement between FP & INT
Bit Manipulation extensions
- LZCNT/POPCNT
SSE extensions
- EXTRQ/INSERTQ (SSE4A)
- MOVNTSD/MOVNTSS (SSE4A)
- MWAIT/MONITOR (SSE3)
Comprehensive Upgrades for SSE
- Dual 128-bit SSE dataflow
- Up to 4 dual precision FP OPS/cycle
- Dual 128-bit loads per cycle
- New vector code, SSE128
- Can perform SSE MOVs in the FP “store” pipe
- Execute two generic SSE ops + SSE MOV each cycle (+ two 128-bit SSE loads)
- FP Scheduler can hold 36 Dedicated x 128-bit ops
- SSE Unaligned Load-Execute mode:
* Remove alignment requirements for SSE ld-op instructions
* Eliminate awkward pairs of separate load and compute instructions
* To improve instruction packing and decoding efficiency

Az L1 cache mérete és késleltetése erősen kérdéses, majd kiderül, hogy melyik párosítás igaz. Jól látszik, hogy erősen rányomultak a virtualizációra, ott nagyon sok fejlődés lesz. Az SSE utasítások hatékonyságát is erősen megnövelték. A szerver piacon szerintem meg fogja verni (még integer esetben is) a Core 2 verziókat, FP esetben meg nagyon. A desktopon közel egálban lesz.

Szerkesztette: hvuk 2007. 02. 10. 12:24 -kor

Athlon 64 939 2 GHz Winchester mag, GigaByte NF4 K8N Ultra-9 (passzív chipset), GigaByte X800 (passzív), 2x512 KingMax HC 500 MHz, Hitachi 160 Gb, NEC 3520, Coolink BAT01VS (1040 ford.), Chieftec 420W, Chieftec ház, Samsung 193P TFT monitor

#2100 Felhasználó inaktív   special 

  • project 2501
  • PipaPipaPipaPipaPipa
  • Csoport: Stábtag
  • Hozzászólások: 11.962
  • Csatlakozott: 2001. jan. 16.

Elküldve: 2007. 02. 10. 12:55

két apróság:

-- az amd teljesítmény-előrejelzése a jelenlegi intel chipekkel veti össze a barcelonát.
-- az intel lépni fog gyorsabb chipekkel, ha szükségesnek látja. kivárásra játszanak. jön a 2-way szerverfrissítés is.

a K8L egyébként nem fogja tudni kifutni magát a jelenlegi hypertransport linkekkel. mire jön az új infrastruktúra, az intel 45 nanométeres high-k+metalgate termelése felfut.

nem állítom, hogy az intel fölényben lesz, viszont 2003-05 nem fog megismétlődni, ami viszont azt jelenti, hogy a következő 2-3 negyedévben  elszenvedett pénzügyi csapást nehezen fogják ellensúlyozni. a K8L-nek nagyon jónak kell lennie, mert különben kivérezteti az Intel őket.

Téma megosztása:


  • (153 Oldal)
  • +
  • « Első
  • 103
  • 104
  • 105
  • 106
  • 107
  • Utolsó »
  • Nem indíthatsz témát.
  • A téma zárva.

1 felhasználó olvassa ezt a témát.
0 felhasználó, 1 vendég, 0 anonim felhasználó