AMD Fusion ist der Code- und Markenname eines Prozessorkonzepts, das CPU und GPU sowie Video- und andere Hardwarebeschleuniger auf einem Die vereinigt. Es ist das Ergebnis der Übernahme ATIs durch AMD.[1] AMD nennt diese Konstruktion Accelerated Processing Unit (APU). Erste Modelle basierend auf diesem Konzept für den Einsatz in Netbooks und ähnlichen Geräten wurden im Januar 2011 vorgestellt,[2] weitere folgten im Verlauf des Jahres 2011. Sie sind Teil des HSA-Programms der HSA Foundation.[3]
AMD demonstrierte seine erste Fusion-APU am 1. Juni 2010 auf der Computex. Die Demonstration umfasste u. a. eine kurze Einspielung, die einen Ausschnitt aus dem 3D-Spiel Aliens vs. Predator zeigte, das auf einem Ontario-System in Echtzeit gelaufen sein soll.[4]
Konkrete Produkte in Form der E- und C-Serien wurden am 4. Januar 2011 vorgestellt.[2] Die Llano-Serie für Notebooks wurde am 14. Juni 2011 präsentiert.[5]
Am 15. Mai 2012 wurde die zweite Generation der mobilen A-Serie namens Trinity (basierend auf dem Piledriver-Prozessorkern der Bulldozer-Architektur) publik gemacht. Diese löst die Llano-Serie ab, die noch auf der alten K10-Architektur beruht.[6]
Marketing
Die Prozessoren oder APUs haben keine Marketingnamen, wie früher etwa mit Phenom oder Athlon üblich. Einziger Markenname in der Prozessorbezeichnung ist „AMD“. Für alle AMD-Systeme gibt es aber noch den AMD Vision-Marketingnamen. Je nach Leistung und Funktionsumfang werden entsprechende Vision-Sticker auch um Zusätze wie „Smart HD“, für günstige und schwächere Versionen, über „Brilliant HD Everyday“ und „Brilliant HD Entertainment“, für den unteren Massenmarkt, bis hin zu „Brilliant HD Performance“, für den oberen „Mainstream“-Bereich ergänzt.
Technische Umsetzung des Konzepts
Kernaspekt der Fusion-Technologie ist die direkte Verbindung wesentlicher Systemkomponenten – x86/AMD64-Prozessorkerne, Vector Engines (SIMD) und Unified Video Decoder (UVD) für High Definition-Videowiedergabe – über denselben High-Speed-Bus mit dem Systemhauptspeicher (Random-Access Memory oder RAM). Die Architektur soll so einige Nachteile umgehen, die mit integrierten Grafikprozessoren (IGPs) in bisherigen Einzelchip-Lösungen verbunden sind, wie höhere Speicherlatenz und Energieaufnahme sowie geringere Laufzeiten im Akkubetrieb.[7] AMD nennt diese Konstruktion Accelerated Processing Unit. Die Mehrkernprozessoren sollen einen oder mehrere Hauptprozessor-Kerne (CPU) und mindestens einen zusätzlichen Prozessor für spezielle Aufgaben enthalten, vorerst einen Grafikprozessor (GPU).[8] Diese Kombination soll dann besser zusammenarbeiten.
Bisher gibt es seitens AMD folgende Umsetzungen des Fusion-Konzepts für unterschiedliche Bereiche:
Subnotebooks und Tablets, Netbooks und Nettops
Ontario und Zacate (Bobcat-Architektur)
Bobcat ist der Codename für die Architektur eines Zweikernprozessors mit integrierter GPU und Northbridge, der für geringen Stromverbrauch und kleinen Preis optimiert wurde und deshalb über vergleichsweise geringe Rechenleistung verfügt. Einsatzbereiche sind günstige Systeme wie Netbooks und Nettops sowie Geräte, welche besonders niedrige Verlustleistung aufweisen sollen, etwa Subnotebooks und Tablets. Bei Bobcat handelt es sich im Gegensatz zum Konkurrenzprodukt Intel Atom um eine effizientere Out-of-Order-Prozessorarchitektur, welche die Basis für AMDs Ontario- und Zacate-APUs bildet, die in den Serien C, E und G (AMD Family 14h Processor) verwendet werden.[9]
Kabini und Temash (Jaguar-Architektur)
Die Jaguar-Architektur löst die auf Bobcat basierenden Prozessoren ab. Sie bildet die Basis für AMDs Kabini- und Temash-APUs der Serien A und E. Mit dieser Generation wird auf TSMCs 28-Nanometer-Bulkprozess umgestellt, der eine Kernfläche von 3,1 mm² erlaubt (zum Vergleich: Bobcat in 40-nm-Fertigung 4,9 mm²)[10] und somit Energieaufnahme sowie die Fläche pro Kern reduziert. Dies ermöglicht bis zu vier Kerne, die in einem sogenannten Modul zusammengefasst werden können. Durch die Modularität dieses Systems kann man besser auf Kundenwünsche eingehen (siehe Xbox One und PlayStation 4). Die Größe des Prozessorcaches, den sich alle Kerne teilen (shared), steigt auf 2 MB an und die Gleitkommaeinheit arbeitet mit 128-Bit Datenbreite. Gekoppelt werden die Jaguar-Kerne mit der Grafik-Architektur „Graphics Core Next“ („GCN“), sodass deutlich mehr Grafikleistung zur Verfügung steht als bei den Vorgängern auf Basis der VLIW-Architektur.
Mit Jaguar unterstützt AMD erstmals in Low-Voltage-Prozessoren den kompletten SSEx-Befehlssatz sowie auch AES-NI und AVX. Diese Befehlssätze waren vorher nur den großen Architekturen wie Bulldozer (SSEx, AES und AVX) oder K10 (nur SSE4a) vorbehalten. Die IPC (Instructions per Cycle) sollen um ca. 15 % steigen.[11][12]
Beema und Mullins (Puma-Architektur)
Mit der Puma-Architektur zielt AMD darauf ab, den Stromverbrauch gegenüber Jaguar weiter zu senken, ohne dabei Einbußen bei der Leistung hinzunehmen. Die Fertigung erfolgt weiter in 28 Nanometern, allerdings nicht länger im Gate-Last-Verfahren bei TSMC, sondern von GlobalFoundries.[13] Verfeinerungen in der Fertigung und beim Design sorgen aber für einen reduzierten Leckstrom und geringere Leistungsaufnahme beim Rechnen.[14]
Als Alternative zu Intels Trusted Execution Technology integriert AMD die TrustZone-Technologie aus der ARM-Welt. Zu diesem Zweck verfügt der Chip über einen ARM Cortex-A5.
Notebooks und Desktops
Llano (K10-Architektur, Husky-Kern)
Llano ist der Codename für eine Prozessorarchitektur mit integrierter GPU und Northbridge, die für den unteren „Mainstream“-Bereich konzipiert ist und in Notebooks und Desktop-Rechnern zum Einsatz kommt. Diese wird von AMD als AMD Family 12h Processors eingeordnet.[15][16] Die Fusion-Llano-APU kombiniert zwei bis vier Husky-Prozessorkerne der K10-Generation (AMD Family 10h Processor) mit Kompatibilität zu x86-Befehlssätzen und zur x64-Architektur, sowie einen DirectX-11-kompatiblen Grafikkern, wie er bei Radeon-HD-5570-Karten zu finden ist. Anders als bei der Radeon HD 5570 wurde bereits UVD 3.0 statt UVD 2.0 im Grafikchip integriert.
Die parallele Rechenleistung des GPU-Teils soll neben der Grafikbeschleunigung über Programmierschnittstellen wie OpenCL, WebGL, AMD APP (früher „ATI Stream“-SDK)[17] und Microsoft DirectCompute, die serielle der Prozessorkerne gerade im Gleitkommabereich ergänzen.[18]
Obwohl die skalaren x86-Kerne und die SIMD-Engines der APUs einen gemeinsamen Pfad zum Systemspeicher teilen, ist bei dieser ersten Generation der Speicher noch in verschiedene Regionen getrennt. Zum einen gibt es den vom Betriebssystem verwalteten Speicherbereich, welcher auf den x86-Kernen läuft, zum anderen die von der Software, welche auf den SIMD-Engines ausgeführt wird, verwalteten Speicherregionen. Für den Datenaustausch zwischen beiden Teilen hat AMD High-Speed-Block-Transfer-Engines eingerichtet. Im Gegensatz zu Datenübertragungen zwischen externen Framebuffern und Systemhauptspeicher sollen diese Transfers nie den (externen) Systembus belegen.[19]
Trinity (Piledriver-CPU-Kern)
Die APUs mit Codenamen Trinity ersetzen die Llano-Reihe mit K10-Innenleben. Die neuere Architektur mit GPU und Northbridge, ebenfalls für den Massenmarkt ausgelegt, wird gleichfalls in Notebooks und Desktops verwendet. Sie kombiniert Prozessortechnik der Piledriver-CPUs (einer optimierten Version der Bulldozer-Architektur (AMD Family 15h Processor)), ausgelegt als Module, mit aktuelleren Radeon-HD-GPUs. Hierbei handelt es sich um Kerne ähnlich den Radeon HD 7350 bis 7670 der AMD-Radeon-HD-7000-Serie. Marktstart für die Notebook-CPUs war der 15. Mai 2012, die Desktop-CPUs wurden am 2. Oktober 2012 vorgestellt.[20][21]
Richland (Piledriver-CPU-Kern)
Die Richland-APUs lösen ihre Vorgänger auf Trinity-Basis ab. Trotz neuen Codenamens setzen sie auf dieselbe Architektur und bieten nur ein neues Stepping. Die GPUs basieren auf der VLIW4-Architektur, die auch als TeraScale 3 bekannt ist. Technisch entsprechen sie den Grafikkarten der HD6900-Serie mit dem Codenamen „Northern Islands“.
Kaveri (Steamroller-CPU-Kern)
Die Kaveri-APUs folgen den Trinity- und der Richland-Reihen nach. Sie wurden für den 14. Januar 2014 angekündigt und enthalten die neue Steamroller-Architektur, welche eine weitreichende Überarbeitung der Bulldozer-Architektur darstellt. Die integrierte GPU wird auf die GCN-Architektur, wie sie mit dem Bonaire-Chip in der Radeon HD7790 im März 2013 vorgestellt wurde, umgestellt. Es sollen im Laufe des Jahres 2014 APUs für Desktoprechner (mit Sockel FM2+), Notebooks, im Embedded- und im Server-Bereich auf den Markt kommen.[22]
In moderaten Auflösungen wie 720p laufen Spiele auf einem Kaveri-System zumeist flüssig mit 40 und mehr FPS.[23] Voraussetzung hierfür ist ein schneller Hauptspeicher (Dual-Rank DDR3-RAM ab ca. 2400-MHz-Takt), da hier die Speicher-Bandbreite der limitierende Faktor ist.[24] Ein weiterer Leistungsschub soll sich mit der neuen Grafikschnittstelle AMD Mantle im Catalyst-Grafiktreiber ergeben.[25]
Carrizo-L (Puma+-Architektur)
Die Puma+-Architektur stellt eine kleine Evolution zur Puma-Architektur dar und bietet leicht erhöhte Taktraten.[26] Die Chips finden auf dem neuen FP4-Sockel Platz und besitzen je 128-Shader.
Die verfügbare Speicherbandbreite (1-Kanal DDR3-1066 oder DDR3-1333 mit 64-Bit-Speicherbreite) wird von CPU und GPU im konkurrierenden Zugriff geteilt. Die eigentliche Chipfläche (die size) liegt zwischen 75 und 77 mm².
Zacate ist der AMD-Codename für eine 18-Watt-APU für den Mainstream-Notebookmarkt in 40-nm-Technik. Die Modelle haben gegenüber der C-Serie einen höheren Takt sowohl für den Prozessor als auch für den Grafikkern.
Die Taktfrequenz der Prozessoren wird aus dem Systemtakt von 100 MHz und dem Taktmultiplikator generiert.
Ontario, C-Serie
Ontario ist der Codename für eine Dual-Core-System-on-a-Chip-Implementierung in 40-nm-Technik. Die APU integriert den Bobcat-Prozessorkern und ist für ultradünne Notebooks, Netbooks und andere Produkte unterhalb der 20-Watt-Grenze gedacht.[29][30] In einer Ontario-APU stecken ein oder zwei Bobcat-Prozessorkerne und ein DirectX-11-Grafikkern mit 280 MHz. Das BGA-Gehäuse des für Mobilgeräte optimierten Ontarios ist zum Auflöten auf Mainboards für Thin-and-Light-Notebooks und Netbooks ausgelegt.[31]
Anfang 2011 wurde die Serie mit zwei Modellen eingeführt. Die Singlecore-Version C-30 hat dabei einen Takt von 1,2 GHz für den Prozessorkern, die Dualcore-Version C-50 von 1 GHz für beide Kerne.[2] Die Dualcore-Versionen C-60 und C-70 haben nach bisheriger Kenntnis exakt gleiche technische Daten. Laut AMD wurde neben dem APU-Namen einzig das Radeon-Branding der GPU auf dem SoC geändert, um es in Einklang mit den anderen Produkten zu bringen.[32]
Die höchste Taktfrequenz im Turbomodus wird nur mit der Hälfte der Gesamtprozessorkerne erreicht. Die restlichen Kerne müssen dabei im Schlafmodus sein.
2
Die Taktfrequenz der Prozessoren wird aus dem Systemtakt von 100 MHz und dem Taktmultiplikator generiert.
Ontario, Embedded-G-Serie
Mit der Embedded-G-Serie-Plattform macht AMD die Fusion-Technologie Anfang 2011 für Embedded-Systeme verfügbar, dabei handelt es sich um weitere Ontario-Versionen. Die APUs integrieren auf einer Package-Fläche von 361 mm² (19 × 19 mm)[33] ein oder zwei 64-Bit-Prozessorkerne der Bobcat-Klasse sowie eine DirectX-11-fähige Grafikeinheit, die auch als Vektorprozessor genutzt werden kann.[34] Seit März 2011 bietet AMD auch sogenannte „Headless“-Varianten für eingebettete Systeme ohne Grafikausgabe an; diese besitzen dieselbe Package-Fläche von 361 mm².[35][36]
Die höchste Taktfrequenz im Turbomodus wird nur mit der Hälfte der Gesamtprozessorkerne erreicht. Die restlichen Kerne müssen dabei im Schlafmodus sein.
2
Die Taktfrequenz der Prozessoren wird aus dem Systemtakt von 100 MHz und dem Taktmultiplikator generiert.
Die Taktfrequenz der Prozessoren wird aus dem Systemtakt von 100 MHz und dem Taktmultiplikator generiert.
Husky-basierte Modelle (Llano)
Llano, A- und E-Serie
Die APUs der Serien A und E wurden im Sommer 2011 veröffentlicht. Sie sind vorrangig für Mainstream- und Low-End-Systeme im Notebook- und Desktop-Segment vorgesehen.[29] Auf einem Silizium-Die sind zwei bis vier x86-Architektur/AMD64-Husky-CPU-Kerne beruhend auf der K10-Architektur mit verbessertem Speichercontroller und einem DirectX-11-fähigen Grafikprozessor vereint.[43]
Die APU wird in einem 32-nm-SOI-Prozess von Globalfoundries gefertigt und strebt die gleichen Zielmärkte an wie die Athlon-II-Linie.[44]
Des Weiteren besitzt der Kombiprozessor einen integrierten PCIe-2.0-, einen Dual-Channel-DDR3-1600-Speichercontroller sowie 1 MB L2-Cache pro Kern,[44] jedoch keinen L3-Cache. Bei Bestückung des Mainboards mit nur einem Speichermodul pro Kanal ist der Speichercontroller der Desktop-Prozessoren aus der A8- und A6-Serie auch für DDR3-1866 spezifiziert, bei mobilen Prozessoren mit bis zu 35 W TDP ist maximal DDR3-1333 vorgesehen. Die Kommunikation mit dem Chipsatz/der Southbridge erfolgt über das Unified Media Interface (UMI), welches auf PCIe basiert, mit 5 GT/s (Gigatransfers/Sekunde).
Die höchste Taktfrequenz im Turbomodus wird nur mit der Hälfte der Gesamtprozessorkerne erreicht. Die restlichen Kerne müssen dabei im Schlafmodus sein.
2
Die Taktfrequenz der Prozessoren wird aus dem Systemtakt von 100 MHz und dem Taktmultiplikator generiert.
Die höchste Taktfrequenz im Turbomodus wird nur mit der Hälfte der Gesamtprozessorkerne erreicht. Die restlichen Kerne müssen dabei im Schlafmodus sein.
2
Die Taktfrequenz der Prozessoren wird aus dem Systemtakt von 100 MHz und dem Taktmultiplikator generiert.
Piledriver-basierte Modelle (Trinity, Richland)
Trinity und Richland, A-Serie
Diese zweite Generation der A-Serie wurde am 15. Mai 2012 (mobile Prozessoren)[45] und die Desktopmodelle am 2. Oktober 2012 (Desktop)[46] veröffentlicht bzw. auf der Computex 2012 angekündigt (Desktop).[47] Ihr liegt die Bulldozer-Architektur mit Piledriver-Kernen zugrunde. Der GPU-Teil verwendet ein 4D-VLIW-Shader-Design, das mit den Radeon-HD-6900-Grafikkarten vorgestellt wurde. Modelle mit angehängtem „K“ in der Bezeichnung verfügen über einen offenen Multiplikator, lassen sich also über- oder untertakten. CPUs mit deaktivierter Grafikeinheit werden unter dem Namen „Athlon II“ vermarktet.
Am 12. März 2013 stellte AMD die 2. Generation Piledriver-basierter APUs (also die 3. Generation der A-Serie) mit Namen Richland vor. Durch eine Technik namens „Resonant Clock Mesh“ konnten die Taktraten sowohl der CPU als auch der GPU gesteigert werden.
Die höchste Taktfrequenz im Turbomodus wird nur mit der Hälfte der Gesamtprozessorkerne erreicht. Die restlichen Kerne müssen dabei im Schlafmodus sein.
2
Die Taktfrequenz der Prozessoren wird aus dem Systemtakt von 100 MHz und dem Taktmultiplikator generiert.
Die höchste Taktfrequenz im Turbomodus wird nur mit der Hälfte der Gesamtprozessorkerne erreicht. Die restlichen Kerne müssen dabei im Schlafmodus sein.
2
Die Taktfrequenz der Prozessoren wird aus dem Systemtakt von 100 MHz und dem Taktmultiplikator generiert.
Die vierte Generation der A-Serie wurde am 12. November 2013 auf der AMD-Entwicklerkonferenz APU 13 angekündigt,[22] Einführung war am 14. Januar 2014. Den Anfang macht im Desktopbereich der A10-7850K, der mit zwei Steamroller-CPU-Modulen vier Threads parallel verarbeitet.
Der GPU-Teil besitzt eine Radeon-Grafikeinheit vergleichbar denen der R7-Modelle der AMD-Radeon-R200-Serie („Volcanic Islands“). Sie basiert auf der GCN-Architektur („Graphics Core Next“) der Version 1.1. Diese wurde mit dem Bonaire-Chip, der AMD-Radeon-HD-7000-Serie eingeführt. Die GPU nimmt fast die Hälfte der Die-Fläche in Anspruch und ist kompatibel zu DirectX 11.2, OpenGL 4.3 und der AMD-getriebenen 3D-Schnittstelle Mantle.[22]
Die APU besitzt eine erstmals im Desktop-Bereich umgesetzte heterogene Systemarchitektur (Heterogeneous System Architecture bzw. HSA), die die Zusammenarbeit von CPU und GPU über GPGPU hinaus verbessern soll. Hierbei wird der Grafikteil intensiver als bisher verwendet, um die Prozessorkerne bei ihren Berechnungen zu unterstützen. Dazu gehören der direkte Austausch von Informationen ohne Umweg über ein Betriebssystem (Heterogeneous Queuing bzw. hQ) und das Zugreifen auf denselben Adressraum des Arbeitsspeichers (Heterogeneous Uniform Memory Access oder hUMA), sodass Berechnungsergebnisse beiden Teilen schnell zur Verfügung stehen.[22] Darüber hinaus ist ein Audio-Coprozessor in die APU integriert.
Mittels Custom Thermal Design Power (cTDP) kann im BIOS die Thermal Design Power der CPU konfiguriert werden, dies ermöglicht es z. B. den A10-7850 mit 45 W oder 65 W TDP zu betreiben. Die Taktfrequenz der CPU wird dann in Abhängigkeit von der cTDP auf bestimmte Werte gedrosselt. Aktiv beworben wird dies im Moment nur für den A8-7600, welcher explizit mit 65 W und 45 W gelistet wird.
Durch eine nochmalige Überarbeitung kamen 2015 unter der Bezeichnung Kaveri-Refresh (inoffiziell Godavari) vor allem bei der integrierten Grafik optimierte APUs mit geringen Taktsteigerungen auf den Markt. Das Topmodell A10-7870K weist z.Bsp. gegenüber dem bisherigen A10-7850K beim CPU-Teil mit 200 MHz mehr Basis-Takt, aber nur 100 MHz mehr Turbo-Takt auf. Die Kaveri- und Kaveri-Refresh-APUs sind für den Sockel FM2+ ausgelegt und sollen nach den Empfehlungen des Herstellers mit den Fusion Controller Hubs A58, A68H, A78 oder A88X kombiniert werden.[53]
Die höchste Taktfrequenz im Turbomodus wird nur mit der Hälfte der Gesamtprozessorkerne erreicht. Die restlichen Kerne müssen dabei im Schlafmodus sein.
2
Die Taktfrequenz der Prozessoren wird aus dem Systemtakt von 100 MHz und dem Taktmultiplikator generiert.
Die CPUs mit dem Kürzel M (z. B. A10-5750M) sind Mobilprozessoren, Modelle mit angehängtem B sind Business-Modelle mit längerer garantierter Verfügbarkeit (z. B. A8-Pro 7600B). Diese werden mindestens 24 Monate verfügbar sein und die zugrundeliegende Software wird über 18 Monate keine Anpassungen erfahren, die für Aufwand bei der Administration der Rechner sorgen.[54]
Mit dem Kaveri- Codenamen hat AMD auch wie vom Athlon FX bekannt die Bezeichnung FX eingeführt, z. B. bei dem FX-7600P. Das P steht für 35 Watt TDP bei den Kaveris für Notebooks, während die Modelle ohne das Kürzel mit 19 Watt oder 17 Watt auskommen.
Die CPUs mit dem Kürzel K (z. B. A10-7700K) haben den Multiplikator nicht gesperrt, bekannt aus der Phenom-Serie in den Black-Edition-CPUs.
Auf Excavator-CPU-Kernen basieren die Ein-Chip-Systeme mit dem Codenamen Carrizo.[55] Verschiedene Modelle mit aktivierter GPU wurden bereits 2015 vorgestellt; sie sind für den Einsatz in mobilen Computern vorgesehen. Im Februar 2016 und im Januar 2019 folgten mit dem Athlon X4 845 und dem A8-7680 zwei Carrizo-Modelle für den Einsatz in Desktopcomputern, deren Hauptplatine mit dem Sockel FM2+ ausgestattet ist.[56][57] Als Bristol Ridge sollen 2016 APUs für Desktopcomputer mit dem Sockel AM4 erscheinen.[58]
Mit Summit Ridge, basierend auf der Zen-Architektur, folgte dann eine komplett neue Prozessorentwicklung.
Die höchste Taktfrequenz im Turbomodus wird nur mit der Hälfte der Gesamtprozessorkerne erreicht. Die restlichen Kerne müssen dabei im Schlafmodus sein.
2
Die Taktfrequenz der Prozessoren wird aus dem Systemtakt von 100 MHz und dem Taktmultiplikator generiert.
↑Whats new in AMD APP. In: AMD Blog. 21. Dezember 2010, archiviert vom Original (nicht mehr online verfügbar) am 16. Januar 2011; abgerufen am 16. Januar 2011 (englisch).
↑Manne Kreuzer: Fusion bald für Embedded verfügbar? In: elektroniknet.de. 3. November 2010, archiviert vom Original (nicht mehr online verfügbar) am 10. November 2010; abgerufen am 17. April 2015.