Az AMD 10h család, vagy K10, az AMD mikroprocesszorok tizedik generációs mikroarchitektúrája, a K8 és K9 utódja. A K10 mikroarchitektúrára épülő processzorok közé tartoznak az Athlon X2, Athlon II, Phenom, Phenom II és az Opteron processzorok újabb generációi. Ez az AMD második 64 bites mikroarchitektúrája. A Phenom és Athlon processzorok az Intel Core 2 és Intel Core i7/5/3 családokkal versengenek, míg az Opteronok az Intel Xeon processzorokkal.
Megjelenését hosszas várakozás és találgatások övezték (egyes korai hírek szerint a K9-es architektúrához hasonlóan ezt is törölték[1]), 2007. szeptember 10-én azonban megjelentek az első harmadik generációs Opteron szerverprocesszorok, majd röviddel ezután, 2007. november 11-én, az asztali gépekbe való Phenom processzorok. Megjelenésük a K8 sorozatú processzorokat – Athlon 64, Opteron, 64 bites Sempron – követte.
Jelölések, elnevezések
Az AMD a K8, avagy az Athlon 64 processzorcsalád után már nem használta a K sorozatú típusmegjelölést, amely eredetileg a kriptonit rövidítése volt (ld. K5) – 2005 elejétől fogva nem jelent meg ezt említő hivatalos dokumentum vagy sajtóanyag az AMD-től.[2]
A „K8L” jelölést Charlie Demerjian kreálta, az The Inquirer egyik cikkírója, még 2005-ben,[3] és ezt kapta fel az informatikai közösség alkalmas rövidítésként,[4] míg az egyidejű AMD dokumentumokban a processzorcsaládot „AMD Következő Generációs Processzortechnológia” (AMD Next Generation Processor Technology) elnevezés alatt emlegették.[5]
A mikroarchitektúrára Stars névvel is hivatkoztak, mivel az asztali processzorvonalat általában csillagokról vagy csillagképekről nevezték el – a Phenom sorozat kezdő modelljeinek kódneve pl. Agena és Toliman.
Egy videointerjúban[6] Giuseppe Amato, az AMD egyik területi igazgatója, megerősítette a K10 kódnév létezését.
Később az Inquirer maga is elismerte, hogy a „K8L” a K8 család alacsony fogyasztású változata, amelyet később Turion 64-nek neveztek el, és hogy a mikroarchitektúra hivatalos kódneve K10.[4]
Az AMD a mikroarchitektúrát a 10h processzorcsalád(Family 10h Processors) néven említi, mivel ez a 0Fh processzorcsalád, azaz a K8 kódnevű család utódja. A 10h és 0Fh a CPUIDx86 utasítás eredménye (ezeknél a processzoroknál a CPUID processzorazonosító utasítás ezeket a számokat adja eredményül). A tizenhatos számrendszerben a 0F a tízes számrendszerbeli 15 számot reprezentálja (a h a tizenhatos, hexadecimális számrendszer jele), a 10h pedig a 16. Néha előfordul a hibás „K10h” hibrid jelölés is.
Időrend
Előzmények
Korai tervek
2003-ban az AMD felvázolta a K8 után következő eljövendő processzorgenerációk jellemzőit és sok helyen előadta azt, többek között a 2003-as Microprocessor Forum-on.[7] Ezek az alábbiak:
2006. április 13-án Henri Richard, az AMD ügyvezető alelnöke és marketingigazgatója, egy interjúban véletlenül elismerte az architektúra létezését.[8]
2006 júniusában ugyanő egy másik interjúban további részleteket árult el a fejlesztésekről, így pl. az egészértékű és lebegőpontos teljesítmény javulását, a memória-sávszélesség növelését ígérve, a 2007-ben megjelenő új processzorban.[9]
Az időpontok megerősítése
2006. július 21. Dirk Meyer, az AMD elnöke és operatív igazgatója (COO) és Marty Seyer első alelnök megerősítették a Revision H nevű új mikroprocesszor kibocsátási dátumát az új architektúra alatt, amelyet 2007 közepére terveztek; valamint hogy ennek négymagos verziója is lesz a szerverek, munkaállomások és nagy teljesítményű asztali gépekhez, és kétmagos verziót is készítenek a fogyasztói asztali piacra. Egyes 2007-es Revision H Opteron modellek TDP-je 68 W (kb. lehűtendő hőtermelés).
2006. augusztus 15. Az első Socket F kétmagos Opteronok megjelenésekor az AMD bejelentette, hogy a cég elérkezett a négymagos Opteronok végső tervezési fázisához (tape-out). Ezután következik a tesztelés és kiértékelés, majd néhány hónappal később a minták gyártása.[10]
2007. június 29. Az AMD közölte, hogy a 'Barcelona kódnevű szerverprocesszorok 2007 augusztusában érkeznek, és a partnerek által készítendő megfelelő szerverrendszerek követik azokat ugyanazon év szeptemberében.[11]
Augusztus 13. Az első Barcelona processzorokra bejelentett szállítási dátumot 2007. szeptember 10-ére módosították. Bejelentették, hogy az Opteron 2348 és 2350 magfrekvenciája 1,9 GHz és 2,0 GHz lesz.[12]
TLB hiba
2007 novemberében az AMD leállította a Barcelona processzorok szállítását, mert egy hibát fedeztek fel a B2 stepping verziójú processzorok TLB-jében (címszámítási asszociatív tár), amely ritkán ugyan, de versenyhelyzetet eredményezett, ami a rendszer lefagyását okozhatta.[13] Egy szoftverjavítás (patch) kikapcsolhatta a puffert a BIOS-ból vagy szoftveresen, de ez 5–20%-os sebességcsökkenést eredményezett. Linux operációs rendszer alatt megjelent egy kernel patch, amely szinte teljesen elkerülte a sebességcsökkenést. 2008 áprilisában az AMD piacra dobta az új B3 stepping verziót, amelyben javították a hibát és néhány kisebb javítást vezettek be.[14]
Belső kódnevek
2006 novemberében néhány kiszivárgott jelentésből kiderült a hamarosan megjelenő asztali darabok kódneve: Agena és Agena FX, valamint ezek néhány műszaki adata: 2,4 GHz és 2,9 GHz órajel, 512 KiB L2 gyorsítótár magonként, 2 MiB L3 gyorsítótár, HyperTransport 3.0, TDP: 125 W.[15] A későbbi hírek szerint ugyanezen mikroarchitektúrán alapulnak az egymagos Spica kódnevű és a kétmagos, L3 gyorsítótárral rendelkező és anélküli Kuma és Rana kódnevű processzorok.[16]
Az AMD Analyst Day rendezvényen 2006. december 14-én az AMD ismertette a szerver, asztali és mobil processzorainak fejlesztési tervét.[17]
Ezek szerint a szerver szegmensben az AMD két új processzort bocsát ki, ezek kódneve Barcelona és Budapest lesz, 8/4/2 utas és 1 utas szerverekhez készülnek. 2007 második felében mutatkozik be a HyperTransport 3.0 és a Socket AM2+ amelyek speciálisan a fent említett fogyasztói négymagos asztali csipsorozathoz készülnek, de 2007 közepétől a városnevek helyett csillagok és csillagképek neveit fogják viselni, pl. Agena. Emellett az AMD Quad FX platform és közvetlen utódja támogatni fogja a csip kétprocesszoros verzióját, az Agena FX-et, amely az AMD Quad FX platform processzorait fogja felváltani. A Barcelona kódnevű szerverprocesszorokhoz hasonlóan az új négymagos asztali processzorok osztott L3 gyorsítótárral, 128 bites lebegőpontos egységgel és továbbfejlesztett mikroarchitektúrával rendelkeznek majd. Az Agena egy natív négymagos asztali gépekbe való processzor. A Kuma, ennek kétmagos változata a 3-ik negyedévben jelenik meg, míg a Rana, egy kétmagos, L3 gyorsítótár nélküli verzió, az év végére várható.
Az ezt követő megjelenések
A szerverek fejlesztési tervén felbukkant egy „Montreal” elnevezésű, AMD K10.5 kódnevű csip is,[18] amelyről nem sok információ jelent meg, csak annyi, hogy egy többcsipes (MCM) modulban két „Shanghai” mag szerepel benne, összesen 12 MiB L3 gyorsítótárral.[19][20] A Shanghai asztali változatának Ridgeback volt a kódneve.[21] Ezután következett a beágyazott grafikus magot tartalmazó Bulldozer magokon alapuló termékek ill. APU-k, valamint a Sandtiger kódnevű natív nyolcmagos szerver-architektúra és a kis fogyasztású alkalmazásokra optimalizált Bobcat mag.
A jelölés megváltoztatása
A 2007-es Computex alatt nyilvánvalóvá vált, hogy az AMD szakított a régi elnevezési gyakorlattal, és az újabb modelleket a teljesítményre és a fogyasztásra jellemző betűjelekkel látja el, amik megelőzik a 4 jegyű modellszámot.[22]
Az újabb processzorsorozatok modellszámainak már semmi közük sem volt a régi PR teljesítményszámokhoz. Az új elnevezési séma egy AA-@### sablonnal leírható betű-szám kombináció,[23] ahol az AA helyén latin betűk állnak, az első betű a processzor osztályát jelöli, a második betű a tipikus TDP fogyasztási keretre jellemző betű. A @ helyén a sorozatszám áll (ld, az alábbi táblázatot), az utolsó 3 karakter (###) pedig a modellszám, amelyekben a nagyobb szám nagyobb teljesítményt jelent.
Nem sokat tudunk a modellszámok részleteiről és mibenlétéről, de a processzorok általában három kategóriába sorolódnak: Premium, Intermediate, és Value A Premium szegmens modelljei a „G”, az Intermediate a „B”, a Value a „L” osztály-jelet kapják, de ez csak egy fogyasztói megfigyelés.[24] Hasonlóan, a TDP szintet is három csoport jelöli, a „több, mint 65 W”, „65 W”, és „kevesebb, mint 65 W”, ezek sorra a „P”, „S”, és „E” jelet kapták.[23]
A 2007 novemberi állapot szerint, az AMD elhagyta az X2/X3/X4 jelölésekből a magok számát jelölő számokat, így csak a négyjegyű modellszám azonosítót meghagyva, amelyben az első karakter azonosítja a processzorcsaládot,[25] míg a Sempron továbbra is használja a LE előjelet, mint az alábbi táblázatban látható:
2006. november 30-án az AMD bemutatta a nagyközönségnek a natív négymagos „Barcelona” csipet,[27] amely a Windows Server 2003 64 bites kiadását futtatta. Az AMD állítása szerint a gyakorlatban előforduló alkalmazások körében és a hasonlóan gyakorlati / általános terhelés mellett 70%-os teljesítménynövekedés mérhető, és a teljesítmény jobb, mint az IntelXeon 5355 Clovertown processzor által mutatott.[28] Erről más beszámolók is megjelentek.[29][30]
2007. január 24-én az AMD alelnöke, Randy Allen, kijelentette, hogy a gyakorlati / valódi környezetben, különböző felhasználási területeken végzett teszteken, a „Barcelona” képes volt akár 40%-kal nagyobb teljesítményt felmutatni az összehasonlításra kijelölt Intel Xeon Clovertown kódnevű processzorral szemben, ami egy kétprocesszoros (2P), négymagos kialakítás.[31] A magonkénti lebegőpontos teljesítmény ugyanazon órajelen értendő várható értéke ezekben a tesztekben körülbelül 1,8-szorosa a K8 család processzorai által felmutatott teljesítménynek.[32]
2007. május 10-én az AMD egy zártkörű rendezvényen bemutatta a készülő processzorok és csipkészletek következő nemzedékét, az Agena FX kódnév alatt, amelyet egy igen érdekes működő rendszeren mutatott be: egy RD790 csipkészletű Radeon HD 2900 XT grafikus kártyával ellátott AMD Quad FX platformon, a rendszer valós idejű 720p video-konverziót végzett egy nem meghatározott célformátumra, miközben mind a 8 mag 100%-os terhelésen végzett valami más feladatot.[33]
Elágazás
A mikroarchitektúra egy másik, a mobil platformokat megcélzó változata is létrejön, hasonló időkeretben, amelyben a csipek alacsony fogyasztására és a kis mérettényezőkre helyezik a hangsúlyt. A változat specializált jellemzőkkel rendelkezik majd, mint pl. a mobil crossbar switch, memóriavezérlő és más lapkára integrált komponensek, fogyasztáskezelő a HyperTransport 3.0 összeköttetéshez és egyebek. Az új mikroarchitektúra eleinte nem kapott külön kódnevet, az AMD egyszerűen csak „új mobil mag” (New Mobile Core) néven emlegette.
A 2006 decemberi Analyst Day rendezvényen Marty Seyer alelnök bejelentette, hogy az új Griffin nevű mobil mag 2008-ban jelenik meg, benne a K10 mikroarchitektúrából örökölt fogyasztásoptimalizáló technológiákkal, ám egészében a K8 tervein alapul.
Tulajdonságok
Gyártási technológia
A 65 nm-es csíkszélességű SOI(silicon on insulator) technológia bevezetése az AMD-nél egybeesett a K10 mikroarchitektúra kibocsátásával és a termelés növelésével.[34] A szerverprocesszorok Socket F(1207) foglalathoz készülnek, mivel ekkoriban ez az egyetlen szerverfoglalat az AMD portfoliójában, az asztali modellek a Socket AM2 vagy Socket AM2+ foglalatba illeszthetők.
A 2006-os Technology Analyst Day rendezvényen az AMD bejelentette,[35] hogy a Continuous Transistor Improvement (CTI) és a Shared Transistor Technology (STT) fog végül elvezetni a 65 nm-es szilícium-germánium szigetelőrétegen (Silicon-Germanium-On-Insulator, SGoI) folyamattal készülő processzorokhoz.[36]
A 65 nm-es technológiára való átállást az AMD már 2006 decemberében megkezdte, és 2007 közepére már csak ilyen technológiával készült csipeket gyártott az AMD drezdai Fab 36 üzeme.[37]
Később, a 45 nm-es technológiára való váltás után a fogyasztói CPU-k Socket AM3 foglalatba illeszkedő tokozással készültek, amely visszafelé kompatibilis az AM2+ és AM2-vel.
Támogatott DRAM szabványok
Az K8 család közismerten igen érzékeny a memória látenciára mivel éppen ennek csökkentésével igyekszik teljesítménynövekedést elérni, a CPU-ba épített (lapkára integrált) memóriavezérlő segítségével; ám a külső egységek magasabb látenciája semmissé teheti ennek eredményét. A DDR2 RAM a látencia újabb lehetséges forrását vezette be a tradicionális DDR RAM-hoz képest, ugyanis a DRAM memóriákat a külső órajel egynegyedére leosztott frekvencia vezérli, a DDR felezett frekvenciájával ellentétben. Azonban, mivel a vezérlő órajelet a DDR2-ben a DDR-nél használt órajel kétszeresére növelték és egyéb látenciacsökkentő módszereket is bevezettek, a CAS látencián alapuló egyszerű összehasonlítás nem megfelelő. Például, a Socket AM2-es processzorok hasonló teljesítményt nyújtanak DDR2 SDRAM használata mellett, mint Socket 939-es processzorok DDR-400 SDRAM-ok használatával. A K10 processzorok támogatják a DDR2 SDRAM-okat, egészen a DDR2-1066 (1066 MHz) sebességig.[38]
Nagyobb számítási teljesítmény
Több elemző előzetes találgatásai szerint (mint az AnandTech, The Inquirer és a Geek.com) a mikroarchitektúrát megvalósító processzorok dupla szélességű SSE végrehajtóegységeket tartalmaznak a magokban. A memória-alrendszerben végrehajtott változtatások, mint a beolvasás átrendezése és a javított előolvasási mechanizmusok, valamint a megkétszerezett utasításbetöltési ráta várhatóan kiterjeszti a processzorok felhasználási területét a tudományos és egyéb, nagy számítási teljesítményt igénylő feladatok körére is, és növeli a versenyképességet az IntelXeon, Core 2, Itanium 2 és más egyidejű processzorokkal szemben.
A számítási teljesítményt növelő javítások többsége az alábbi felsorolásban szerepel.
Socket AM3 foglalat, DDR2 vagy DDR3 a 45 nm-es Phenom II sorozatban. Az összes K10 Phenom processzor visszafelé kompatibilis a Socket AM2+ és Socket AM2 foglalatokkal, ám néhány 45 nm-es Phenom II processzor csak Socket AM2+ foglalathoz készült.
Socket F, DDR2, DDR3 a Shanghai és későbbi modellekhez
Utasításkészlet: bővítések és kiegészítések
Új bitmanipulációs utasítások az ABM utasításkészlet-bővítményben: vezető nullák számlálása (Leading Zero Count, LZCNT) és populációszámlálás (Population Count, POPCNT)
Új SSE utasítások, SSE4a kiterjesztés: kombinált maszkoló és léptető utasítások (EXTRQ/INSERTQ), skalár adatfolyamtároló utasítások (MOVNTSD/MOVNTSS); ezek nem találhatók meg az Intel SSE4 készletében.
Nem kiigazított SSE betöltőutasítások támogatása (amelyek korábban 16 bájtos határra való igazítást igényeltek)[40]
Szélesebb L1 adat-gyorsítótár interfész, ciklusonként két 128 bites betöltést tesz lehetővé (szemben a K8 két 64 bites ciklusonkénti betöltésével)
Alacsonyabb integer osztási késleltetés (látencia)
512 bejegyzéses elágazás-előrejelző és nagyobb (a K8-énak kétszerese) visszatérési verem és elágazási célpuffer
Verem-segédoptimalizáló (Side-Band Stack Optimizer), amely a veremmutató regiszter növelését-csökkentését végzi
Gyorsított végrehajtású CALL és RET-Imm utasítások (korábban ezek mikrokódoltak voltak), ugyanígy gyorsított MOVs utasítások (adatmozgatás a SIMD regiszterekből az általános célú regiszterekbe)
Szétválasztott táprétegek a CPU és a memóriavezérlő/northbridge számára a hatékonyabb fogyasztáskezelés céljából, az AMD elnevezése erre eleinte Dynamic Independent Core Engagement vagy D. I. C. E., ennek újabb elnevezése az Enhanced PowerNow! (avagy független dinamikus mag technológia, Independent Dynamic Core Technology), ami lehetővé teszi, hogy a magok és a northbridge (integrált memóriavezérlő) egymástól függetlenül szabályozza az áramfelvételét.[41]
Az áramkörök egyes részeinek kikapcsolása, mikor nincs rajtuk terhelés, ez a „CoolCore” technológia.
Javítások a memória-alrendszerben:
Javítások az elérési látenciában:
A betöltések átrendezésének támogatása: egyes betöltőutasítások előbb hajtódnak végre
Pufferelt adatlöketes visszaírás a RAM-ba, a versenyhelyzetek elkerülésére
Változtatások a memória-hierarchiában:
Előbetöltés közvetlenül az L1 gyorsítótárba, ami a K8-nál az L2-be történt
32 utas csoportasszociatív L3 victim gyorsítótár, mérete legalább 2 MiB, megosztva a feldolgozó magok között, egyetlen lapkán (egyenként 512 KiB méretű független kizárólagos L2 gyorsítótárak), a megosztást figyelembe vevő cserélési politikával
Bővíthető L3 gyorsítótár-kialakítás, 45 nm-es technológiánál a tervezett méret 6 MiB, a Shanghai kódnevű csipekben
Változások a címtér-kezelésben:
Két 64 bites független memóriavezérlő, mindkettőnek külön fizikai címmezője van; ez lehetővé teszi a rendelkezésre álló sávszélesség jobb kihasználását az igen sok szálat alkalmazó környezetekben fellépő véletlenszerű memóriahozzáféréseknél. Ez szembenáll a korábbi „átfedéses” kialakítással, amiben két 64 bites adatcsatorna volt a közös címmezőhöz kötve.
Nagyobb címkézett címfordító pufferek (tagged lookaside buffers); 1 GiB lapbejegyzés-méret és új 128 elemű lap-TLB
48 bites memóriacímzés amely 256 TiB (tebibájt) méretű memória-alrendszert enged meg[42]
HyperTransport 3.0 támogatás, HyperTransport link unganging technikával, amely a vezérlők független működtetését jelenti, ezáltal lehetővé válik 8 közvetlen összeköttetés/csatlakozóvonal használata processzorfoglalatonként (unganging: kb. szétbandázás, feloszlatás)
A K10.5 mag a K10 mag egy újabb, 45 nm-es gyártási folyamattal készülő változata. Az új gyártási folyamat alapvető célja az órajelfrekvencia növelése a Phenom sorozatban, a TDP csökkentése, és nem utolsósorban a gyártási költségek leszorítása. Az AMD állításai szerint a Deneb/Shanghai processzorok teljesítménye megelőzi az ugyanazon órajelű Agena/Barcelona processzorokét; a teljesítménynövekedés 35%-os, míg az energiafogyasztás 30%-kal alacsonyabb.
Phenom modellek
Agena (65 nm SOI)
Négy AMD K10 mag
L1 gyorsítótár: 64 KiB utasítás- és 64 KiB adat-gyorsítótár magonként
L2 gyorsítótár: 512 KiB magonként, teljes sebességű
L3 gyorsítótár: 2 MiB, az összes mag számára közös
Modellek: Phenom II X4 840T, 960T, 970(Thuban-alapú Zosma mag, csak OEM, a 970 unlocked szorzóval, de Turbo Core nélkül)
Deneb (Shanghai)
A Deneb (Shanghai) mag 758 millió tranzisztort tartalmaz, a lapka területe 243 mm² (összehasonlításul, ezek a számok a 65 nm-es technológiájú Barcelona magokban 463 millió és 283 mm², az IntelNehalem-nél 731 millió és 246 mm²). Megnövelt L3 gyorsítótár (2-től 6 MiB-ig) és néhány kisebb architekturális optimalizáció jellemzi.
A Shanghai magos Opteron processzorok 2008. november 13-án jelentek meg. Az első Deneb magon alapuló processzorokat 2009. január 8-án bocsátotta ki az AMD, Phenom II X4 néven (920 és 940 Black Edition modellek).
Deneb (45 nm SOI, immerziós litográfiával)
Négy AMD K10 mag
L1 gyorsítótár: 64 KiB utasítás- és 64 KiB adat magonként
L2 gyorsítótár: 512 KiB magonként, teljes sebességű
L3 gyorsítótár: 6 MiB, az összes mag számára közös. A 800 sorozatban az L3 gyorsítótárból 2 MiB lekapcsolva, hibák miatt.
Az AMD a Thuban után már nem fejlesztett több K10 alapú CPU-t, ehelyett a Fusion és a Bulldozer alapú termékekre koncentrált – a Fusion az általános asztali gépek és laptopok számára készül, míg a Bulldozer a nagy teljesítményű piac igényeinek megfelelő architektúra. Érdekes azonban, hogy a Fusion termékcsaládban az APU-k egyes sorozatai, mint pl. az A4, A6 és A8-as csipsorozatok (a Llano APU-k) továbbra is a K10-ből származtatott CPU magokat használnak, a Radeon grafikus mag mellett. A K10 és származékainak gyártását megszüntetik a Trinity alapú APU-k megjelenésével 2012-ben, amelyben a K10 alapú magokat Bulldozer architektúrából származtatott magokkal cserélik le.
Médiaviták
Megjegyzés: a médiaviták a megjelenési dátum szerinti sorrendben állnak itt.
„AMD To Demo K8L By Year End”, moneycontrol.com, 2006. július 23.. [2007. augusztus 18-i dátummal az eredetiből archiválva] (Hozzáférés: 2007. április 19.)
↑Charlie Demerjian: AMD's K10 is delayed or dead (angol nyelven). The Inquirer, 2005. november 3. [2007. szeptember 6-i dátummal az eredetiből archiválva]. (Hozzáférés: 2014) „„In this game, cores age about as well as mayonnaise in the sun ...””
↑Hesseldahl, Arik. „Why Cool Chip Code Names Die”, forbes.com, Forbes.com Inc, 2000. július 6. (Hozzáférés: 2007. július 14.)
Ez a szócikk részben vagy egészben az AMD 10h című angol Wikipédia-szócikk ezen változatának fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.