Наприкінці 1990-х років 3D-прискорювачі PowerVR змагалися з розробками 3dfx на ринку настільних комп'ютерів та ігрових консолях, але обидва компанії були змушені залишити цей ринок через розвиток технологій DirectX та OpenGL, а також через значний успіх ATI і Nvidia, які краще підтримували ці технології. Після цього розвиток PowerVR сконцентрувалися на область різних мобільних та побутових пристроїв, таких як комунікатори, смартфони та Smart TV.
Чипи PowerVR використовують метод 3D-рендерингу, відомий як відкладений рендеринг на основі тайлів (часто скорочується як TBDR - Tile Based Deferred Rendering). Як тільки програма, що генерує полігони, передає трикутники драйверу PowerVR, він зберігає їх у пам'яті у вигляді безперервної смуги або разом з індексами вершин. На відміну від інших архітектур, рендеринг полігонів (як правило) не виконується, доки інформація про всі полігони не буде зібрана для поточного кадру. Крім того, операції текстурування та затінення пікселів (або їх фрагментів), що вимагають великих ресурсів, відкладаються, поки не буде визначено видимий піксель — отже, рендеринг відкладений.
Для того щоб це зробити, дисплей розділений на прямокутні секції в сітці. Кожен розділ відомий як тайл. Кожен тайл - список трикутників, які помітно перекриваються. Для отримання остаточного зображення тайли обробляються по черзі.
Тайл відображається за допомогою процесу, подібного до рейкастингу. Промені трасуються на трикутники, пов'язані з тайлом, після чого піксель формується з трикутника, розташованого найближче до камери. Обладнання PowerVR зазвичай за 1 цикл обчислює значення буфера глибини, пов'язані з кожним полігоном, для одного рядка тайла.
Цей метод має ту перевагу, що, на відміну від традиційнішої Z-буферизації в конвеєрі рендерингу, відсутні розрахунки. Необхідно внести, щоб визначити, як полігон виглядає в районі, де він заслонений іншими геометріями. Він також дозволяє правильно передати часткову прозорість полігонів незалежно від їх порядку. (Ця можливість була реалізована тільки в Series 2 і MBX варіанті. Вони, як правило, не включені через відсутність підтримки API та економічні причини). Що ще важливіше, так як рендеринг обмежується одним тайлом за раз, то весь тайл може перебувати у швидкій пам'яті OnChip, яка очищається у відеопам'яті перед обробкою наступного тайлу. За нормальних умов кожен тайл обробляється один раз за кадр.
Imagination Technologies є єдиною компанією, що успішно випустила TBDR-рішення на ринок. Microsoft теж внесла концептуальну ідею із занедбаним проєктом Talisman. Gigapixel, компанія, яка розробила IP для тайла на основі відкладеної 3D-графіки, була куплена 3dfx, яка, у свою чергу, згодом була придбана Nvidia. Nvidia використовує рендеринг тайлу в мікроархітектурахMaxwell і Pascal для обмеженої кількості геометрії.[1]
Після придбання Falanx, ARM розпочала розробку іншої великої архітектури на основі тайлів, відому як Mali.
Intel використовує подібну концепцію у своїх інтегрованих графічних рішеннях. Тим не менш, придуманий ними метод зони рендерингу не виконує повного прихованого визначення поверхні (HSR) і відкладеного текстурування, таким чином витрата ресурсів на заповнення текстур і смуг пропускання на пікселі, не видно в остаточному зображенні. Останні досягнення в ієрархічній Z-буферизації, фактично враховані ідеї раніше використовувані тільки у відкладеному рендерингу, включаючи здатність розділити сцену на тайл та потенційну можливість приймати або відхиляти розмір шматків полігону.
Перша серія карт PowerVR була в основному розроблена як плати прискорювача лише для 3D, які використовували б пам'ять основної 2D відеокарти як буфер кадру через PCI. Першим продуктом PowerVR для ПК від Videologic PowerVR був 3-чиповий Midas3, доступність якого була дуже обмежена в деяких OEM комп’ютерах Compaq.[4][5]. Ця карта мала дуже погану сумісність з усіма відеоіграми, крім перших Direct3D ігор, і навіть більшість ігор SGL не запускалися. Однак його внутрішня 24-бітна точна передача кольору була помітною для того часу.
Одночиповий PCX1 був випущений в роздрібну торгівлю як VideoLogic Apocalypse 3D[6] і мав покращену архітектуру з більшою текстурною пам'яттю, що забезпечує кращу сумісність ігор. За ним вийшов подальший удосконалений PCX2, який працював на 6 МГц вище, вивантажив частину роботи драйвера, включивши більше функцій мікросхеми[7] і додавши білінійну фільтрацію, був випущений в роздрібну торгівлю на картах Matrox M3D[8] і Videologic Apocalypse 3Dx. Також був Videologic Apocalypse 5D Sonic, який поєднав прискорювач PCX2 з ядром Tseng ET6100 2D і звуком ESS Agogo на одній платі PCI.
Карти PowerVR PCX були представлені на ринку як бюджетні продукти і добре працювали в іграх свого часу, але вони не були настільки повнофункціональними, як прискорювачі 3dfx Voodoo (наприклад, через недоступність деяких режимів складання). Однак підхід PowerVR до відтворення в пам’яті 2D-карти означав, що теоретично можливі набагато вищі роздільні здатності 3D-рендерингу, особливо в іграх PowerSGL, які повністю використовували апаратне забезпечення карти.
Усі моделі підтримують DirectX 3.0 і PowerSGL, драйвери MiniGL, доступні для деяких ігор
2 Midas3 є 3-чиповим (порівняно з одночиповою серією PCX) і використовує архітектуру розділеної пам'яті: 1 МБ 32-біт SDRAM (240 МБ/с пікової пропускної здатності)для текстур і 1 МБ 16-розрядної FPM DRAM для геометричних данних (і, ймовірно, для зв’язку PCI). Серія PCX має лише текстурну пам'ять.
Series2 (NEC)
Друге покоління PowerVR2 («PowerVR Series 2», чип з кодовою назвою «CLX2»), був присутній на ринку в консолі Dreamcast у період між 1998 та 2001 роками. В рамках внутрішньої конкуренції в Sega при розробці наступника Saturn PowerVR2 отримала ліцензію від NEC і виявилася попереду суперника, заснованого на 3dfx Voodoo 2. Під час розробки він називався «the Highlander Project»[9]. PowerVR2 був у парі з процесором Hitachi SH-4 у Dreamcast, де SH-4 обробляв геометричний рушій T&L а PowerVR2 обробляв візуалізацію.[10] PowerVR2 також працював у Sega Naomi, модернізований системній платі аркадних ігрових автоматів, аналог Dreamcast.
Тим не менш, успіх Dreamcast означав, що ПК-варіант, який продавався як Neon 250, з'явиться на ринку через рік і на той час у кращому випадку знаходився в середньому класі. Проте, Neon 250 був конкурентоспроможним з RIVA TNT2 і Voodoo3.[11] Neon 250 має слабші апаратні характеристики в порівнянні з тією частиною PowerVR2, яка використовується в Dreamcast, наприклад, зменшений вдвічі розмір тайлу, серед іншого.
3 Швидкість заповнення для напівпрозорих полігонів з апаратною товщиною сортування 60
4Hitachi SH-4 обчислює геометричний рушій T&L для понад 10 мільйонів трикутників за секунду. Пропускна здатність механізму рендеринга CLX2 становить 7 мільйонів трикутників на секунду.
Series3 (STMicro)
У 2001 році було випущено третє покоління PowerVR3 STG4000 KYRO, вироблене новим партнером STMicroelectronics. Архітектура була перероблена для кращої сумісності з іграми та розширена до конструкції з подвійним конвеєром для підвищення продуктивності. Оновлений STM PowerVR3 KYRO II, випущений пізніше того ж року, ймовірно, мав подовжений конвеєр для досягнення більш високої тактової частоти[12] був в змозі конкурувати з дорожчими ATIRadeon DDR та NVIDIAGeForce 2 GTS показував високі показники у графічних тестах того часу, незважаючи на скромніші характеристики та відсутність апаратної трансформації та освітлення (T&L), цей факт, Nvidia використала в конфіденційному документі, який вони розіслали рецензентам, задля популяризації GeForce 2.[13] В іграх все більшою мірою оптимізували під апаратне T&L, і тому KYRO II втратила свою перевагу у продуктивності.
Серія KYRO мала пристойний набір функцій для бюджетно-орієнтованого графічного процесора свого часу, включаючи кілька функцій, сумісних з Direct3D 8.1, таких як 8-шарове мультитекстурування (не 8-прохідне) і Environment Mapped Bump Mapping (EMBM); Також були присутні Full Scene Anti-Aliasing (FSAA) і трилінійна/анізотропна фільтрація.[14][15][16] KYRO II також міг виконувати Dot Product (Dot3) Bump Mapping з такою ж швидкістю, як GeForce 2 GTS у тестах.[17] Упущення включало апаратну T&L (додаткова функція в Direct3D 7), Cube Environment Mapping та підтримку застарілої 8-бітової палітри текстур. Хоча чип підтримував стиснення текстур S3TC/DXTC, підтримувався лише (найпоширеніший) формат DXT1.[18] Підтримка власного API PowerSGL також була припинена з цією серією.
Якість 16-розрядного виводу була чудовою в порівнянні з більшістю своїх конкурентів, завдяки відтворенню внутрішнього 32-бітного кешу тайлу і зниженню дискретизації до 16-розрядного замість прямого використання 16-бітного кадрового буфера.[19] Це могло б зіграти роль у покращенні продуктивності без втрати якості зображення, оскільки пропускна здатність пам’яті була недостатньою. Однак через свою унікальну концепцію на ринку, архітектура іноді могла виявляти недоліки, такі як відсутня геометрія в іграх, і тому драйвер мав значну кількість налаштувань сумісності, таких як вимкнення внутрішнього Z-буфера.
Друге оновлення KYRO було заплановано на 2002 рік, STG4800 KYRO II SE. Зразки цієї картки були надіслані рецензентам, але, схоже, вона не була представлена на ринку. Окрім збільшення тактової частоти, це оновлення було анонсоване разом із емуляцією програмного забезпечення «EnT&L» HW T&L, яка врешті-решт потрапила до драйверів для попередніх карт KYRO, починаючи з версії 2.0. STG5500 KYRO III, заснований на наступному поколінні PowerVR4, був завершений і включав би апаратний T&L, але був відкладений через закриття свого графічного підрозділу STMicro.
PowerVR досягла великих успіхів на ринку мобільної графіки з низьким енергоспоживанням за допомогою PowerVR MBX. MBX, та його наступники SGX ліцензовані сім'ю з десяти провідних виробників напівпровідників у тому числі Intel, Texas Instruments, Samsung, NEC, NXP SemiconductorsFreescale, Renesas та Sunplus. Чипи використовувалися у багатьох мобільних телефонах колись високого класу, включаючи оригінальні iPhone і iPod Touch, Nokia N95, Sony Ericsson P1 і Motorola RIZR Z8. Він також використовувався в деяких КПК, таких як Dell Axim X50V і X51V з MBX Lite Intel 2700G, а також у приставках із процесором Intel CE 2110 на базі MBX Lite.
Є два варіанти: MBX та MBX Lite. Обидва мають однаковий набір функцій. MBX оптимізовано для швидкості, а MBX Lite – для низького споживання енергії. MBX може працювати в парі з FPU, Lite FPU, VGP Lite та VGP.
PowerVR Series5XT SGXMP – чипи з багатоядерним варіантами серії SGX з деякими оновленнями. Його включають у PlayStation Vita (портативний ігровий пристрій з PoweVR SGX543 MP4+). Модель PowerVR SGX543, має єдину передбачувану різницю, крім функцій, що вказують +, налаштованих для Sony – це ядра, де MP4 позначає 4 ядра (чотири ядра), тоді як MP8 позначає 8 ядер (восьмиядерні). Allwinner A31 (чотириядерний мобільний процесор) має двоядерний процесор SGX544 MP2. AppleiPad 2, iPhone 4S та iPad Mini на SoC A5 оснащені двоядерним графічним процесором SGX543MP2. iPad (3-го покоління) на SoC A5X SoC має чотириядерний процесор SGX543MP4[21]. iPhone 5, iPhone 5c на SoC A6 має три ядра SGX543MP3. iPad (4-го покоління) на SoC A6X має чотириядерний графічний процесор SGX554MP4. Exynos - варіант Samsung Galaxy S4 і Meizu MX3 використовує швидкий триядерний графічний процесор SGX544MP3 з тактовою частотою 533 МГц.
Intel використовує SGX544MP2 у своїй платформі Clover Trail.
Представлений у 2014 році, графічний процесор PowerVR GX5300[22] заснований на архітектурі SGX і є найменшим у світі графічним ядром з підтримкою Android. надає продукти з низьким енергоспоживанням для смартфонів початкового рівня, носимих пристроїв, інтернету речей та інших вбудованих програм малого розміру, включаючи корпоративні пристрої, такі як принтери.
Series6 (Rogue)
Графічні процесори PowerVR Series6[23] засновані на архітектурі SGX яка еволюціювала під кодовою назвою Rogue. ST-Ericsson оголосила, що нова версія платформи Nova міститиме ГПУ наступного покоління Imagination Technologies, PowerVR Series6[24]. MediaTek анонсувала чотириядерну систему на чіпі (SoC) MT8135 (два ядра ARM Cortex-A15 і два ядра ARM Cortex-A7) для планшетів.[25] Renesas оголосила, що його R-Car H2 SoC включає G6400.[26]Allwinner Technology A80 SoC (4 Cortex-A15 і 4 Cortex-A7), яка доступна в планшеті Onda V989, оснащена графічним процесором PowerVR G6230.[27] У процесорі Apple A7 (на базі якого побудований зокрема AppleiPhone 5s, iPad Air та iPad Mini 2) використовується ГПУ PowerVR G6430 (що входить до серії Imagination PowerVR Series 6), який AnandTech вважає PowerVR G6430 у конфігурації з чотирма кластерами.[28].
Графічні процесори PowerVR Series 6 мають 2 TMU на кластер.[29]
Intel використовує PowerVR G6400 у своїй платформі Merrifield.
Графічні процесори PowerVR Series6XE[30] засновані на Series6 і розроблені як чипи початкового рівня, спрямовані на пристрої приблизно із такою ж швидкості заповнення порівняно з серією Series5XT. Однак вони мають оновлену підтримку API, наприклад Vulkan, OpenGL ES 3.1, OpenCL 1.2 і DirectX 9.3 (9.3 L3).[31] Rockchip і Realtek використовували графічні процесори Series6XE у своїх SoC.
Графічні процесори PowerVR Series 6XE були анонсовані 6 січня 2014 року.[31][32]
Графічні процесори PowerVR Series6XT[33] спрямовані на подальше зниження енергоспоживання за рахунок площі кластера та оптимізації продуктивності, що забезпечує збільшення продуктивності до 50% порівняно з графічними процесорами Series6. Ці чипи мають оптимізацію на системному рівні PVR3C з потрійним стисненням і Ultra HD насичений колір.[34] Цей продукт став відповіддю на висококласну графіку NVIDIA Tegra K1 із архітектурою Kepler.[35]. Apple iPhone 6, iPhone 6 Plus та iPod Touch (6‑го покоління) з SoC A8 оснащені чотириядерним процесором GX6450.[36][37] Не анонсований варіант із 8 кластерами використовувався в SoC Apple A8X для моделі iPad Air 2 (випущеної в 2014 році). SoC MediaTek MT8173 і Renesas R-Car H3 використовують графічні процесори Series6XT.[38]
Графічні процесори PowerVR Series 6XT були представлені 6 січня 2014 року.[39][40]
Графічні процесори PowerVR Series 7XE були анонсовані 10 листопада 2014 року.[41] Було оголошено, що серія 7XE містила найменший графічний процесор, сумісний із Android Extension Pack. Компанії вдалося покращити енергоефективність та зменшити фізичні розміри чипів, хоча у плані архітектури вони практично не відрізняються від представників сімейства PowerVR Series6XT.
Графічні процесори PowerVR Series7XT[42] доступні в конфігураціях від двох до 16 кластерів, пропонуючи різко масштабовану продуктивність від 100 GFLOPS до 1,5 TFLOPS. GT7600 використовується в моделях AppleiPhone 6s і iPhone 6s Plus (випущених у 2015 році), а також моделі Apple iPhone SE (випущена в 2016 році) і Apple iPad моделі 2017 року відповідно. Не анонсований варіант із 12 кластерами використовувався в Apple A9X SoC для їхніх моделей iPad Pro (випущених у 2015 році).
Графічні процесори PowerVR Series 7XT були представлені 10 листопада 2014 року.[43][44]
Графічні процесори PowerVR Series7XT Plus є еволюцією сімейства Series7XT і додають спеціальні функції, призначені для прискорення комп’ютерного зору на мобільних і вбудованих пристроях, включаючи нові шляхи даних INT16 і INT8, які підвищують продуктивність до 4 разів для ядер OpenVX.[45] Подальші вдосконалення спільної віртуальної пам’яті також забезпечують підтримку OpenCL 2.0. GT7600 Plus використовується в моделях Apple iPhone 7 і iPhone 7 Plus (випущених у 2016 році), а також моделі Apple iPad (випущеному в 2018 році).
Графічні процесори PowerVR Series 7XT Plus були анонсовані на Міжнародній виставці CES, у Лас-Вегасі – 6 січня 2016 року.
Series7XT Plus забезпечує до 4-кратного збільшення продуктивності для додатків бачення.
Графічні процесори розроблені, щоб запропонувати покращену ефективність внутрішньої системи, покращену енергоефективність та скорочену пропускну здатність для бачення та обчислювальної фотографії в споживчих пристроях, смартфонах середнього та популярного рівня, планшетах та автомобільних системах, таких як передові системи допомоги водієві (ADAS), інформаційно-розважальні, комп'ютерного зору і передову обробка для комбінацій приладів.
Нові графічні процесори включають нові покращення набору функцій з акцентом на обчислення наступного покоління:
У 4 рази вища продуктивність для алгоритмів OpenVX/vision порівняно з попереднім поколінням завдяки покращеній цілочисельній (INT) продуктивності (2x INT16; 4x INT8)
Покращення пропускної здатності та затримки за рахунок спільної віртуальної пам’яті (SVM) у OpenCL 2.0
Динамічний паралелізм для більш ефективного виконання та контролю завдяки підтримці черги пристроїв у OpenCL 2.0
Series8XE (Rogue)
Графічні процесори PowerVR Series8XE підтримують OpenGL ES 3.2 і Vulkan 1.x і доступні в конфігураціях 1, 2, 4 і 8 пікселів/частоту,[46] забезпечуючи новітні ігри та програми та ще більше знижуючи вартість високоякісних інтерфейсів, чутливих до вартості. пристроїв. PowerVR Series 8XE було анонсовано 22 лютого 2016 року на Mobile World Congress 2016. Є ітерація мікроархітектури Rogue і цільовий ринок графічних процесорів SoC початкового рівня.[47]. Нові графічні процесори покращують продуктивність/мм2 для найменшого силіконового сліду та профілю потужності, а також включають апаратну віртуалізацію та багатодоменну безпеку.[48] Новіша модель була випущена пізніше в січні 2017 року з новою частиною низького та високого класу.[49]
PowerVR Series8XEP було анонсовано у січні 2017 року. Є ітерація мікроархітектури Rogue і орієнтована на ринок графічних процесорів середнього класу, на 1080p. Series8XEP залишається зосередженим на розмірі кристалу та продуктивності на одиницю
Furian, анонсований 8 березня 2017 року, є першою новою архітектурою PowerVR після того, як Rogue був представлений п’ятьма роками раніше.[50][51][52]
PowerVR Series 8XT було анонсовано 8 березня 2017 року. Це перший графічний процесор серії, заснований на новій архітектурі Furian. За даними Imagination, GFLOPS/мм2 покращено на 35%, а швидкість заповнення/мм2 покращено на 80% порівняно з серією 7XT Plus на тому ж вузлі. Конкретні проєкти не оголошуються станом на березень 2017 року. Series8XT має 32-широкий конвеєрний кластер.
Анонсований у вересні 2017 року, сімейство графічних процесорів Series9XE економить до 25% пропускної спроможності в порівнянні з графічними процесорами попереднього покоління.[54] Сімейство Series9XE призначене для приставок (STB), цифрових телевізорів (DTV) і недорогих смартфонів.
Примітка. Дані в таблиці наведено для кластера.[55]
Сімейство графічних процесорів Series9XM досягає до 50% кращої продуктивності, ніж попереднє покоління 8XEP. [56] Сімейство Series9XM націлено на SoC для смартфонів середнього класу.
Сімейство графічних процесорів Series9XMP було анонсовано 4 грудня 2018 року.[57] Сімейство Series9XMP підтримує стиснення зображень PVRIC4.[58]Сімейство Series9XMP націлена на SoC для смартфонів середнього класу.
Сімейство графічних процесорів Series9XTP було анонсовано 4 грудня 2018 року.[57] Сімейство Series9XTP підтримує стиснення зображень PVRIC4.[58] Сімейство Series9XTP націлено на високоякісні SoC для смартфонів. Series9XTP має 40-широкого конвеєрного кластеру.
IMG A-Series (Albiorix)
Графічні процесори A-серії забезпечують до 250% кращу продуктивность, ніж попередні серії 9. Ці графічні процесори більше не називаються PowerVR, вони називаються IMG.[59] 2 січня 2020 року компанія Imagination Technologies підписала нову «багаторічну угоду про оренду» з Apple для інтеграції в майбутні пристрої iOS.[60] Відновлення партнерства між двома компаніями відбувається після закінчення терміну дії ліцензій Apple на IP-телефонію Imagination graphics в кінці 2019 року.[61]
Поряд з сімейством Series3NX було анонсовано ще одно сімейство прискорювачів нейронних мереж (NNA) Series3NX-F. Сімейство Series3NX-F поєднує Series 3NX з підтримкою GPGPU (NNPU) і локальною оперативною пам'яттю. Це дозволяє підтримувати програмованість і рухому кому.[73]
Реалізація
Варіанти PowerVR ГПУ можна знайти в наступній таблиці систем на чипах (SoC). Реалізації прискорювачів PowerVR у продуктах наведено тут.