Алгоритм SHA-3 побудований за принципом криптографічної губки (дана структура криптографічних алгоритмів була запропонована авторами алгоритму Keccak раніше)[5].
Історія
У 2004—2005 роках кілька алгоритмів гешування були атаковані, в тому числі були опубліковані серйозні атаки проти алгоритму SHA-1, затвердженого Національним інститутом стандартів і технологій (NIST). У відповідь NIST провів відкриті семінари та 2 листопада 2007 року анонсував конкурс на розробку нового алгоритму гешування. 2 жовтня 2012 року переможцем конкурсу став алгоритм Keccak і був сертифікований як новий алгоритм SHA-3[6]. 5 серпня 2015 року алгоритм затверджено та опубліковано в якості стандарту FIPS 202[7][2].
Алгоритм заснований на більш ранніх геш-функціях Panama і RadioGatún[9]. Panama був розроблений Джоаном Дайменом і Крейгом Клеппом в 1998 році, RadioGatún був реалізований на основі Panama Дайменом, Пітерсом і Ван Аше у 2006 році.
В ході конкурсу учасникам дозволялося вносити зміни у свій алгоритм для виправлення знайдених проблем. Зміни, внесені в алгоритм Keccak[10][11]:
Кількість раундів було збільшено з 12 + до 12 + 2
Padding був змінений зі складної форми на більш просту, описану нижче
Швидкість (rate) r була збільшена до межі безпеки (раніше округлялася вниз до найближчого ступеня 2)
Алгоритм
Геш-функції сімейства SHA-3 побудовані на основі конструкції криптографічної губки, в якій дані спочатку «вбираються» в губку, при якому початкове повідомлення піддається багатораундовим перестановкам , потім результат «віджимається» з губки. На етапі «вбирання» блоки повідомлення додаються за модулем 2 з підмножиною стану, який потім перетвориться з допомогою функції перестановки . На етапі «віджимання» вихідні блоки зчитуються з одного і того ж підмножинного стану, зміненого функцією перестановок . Розмір частини стану, який записується і зчитується, називається «швидкістю» (англ. rate) і позначається , а розмір частки, яка незаймана введенням / виведенням, називається «ємністю» (англ. capacity) і позначається .
Алгоритм отримання значення хеш-функції можна розділити на кілька етапів:
Вихідне повідомлення додається до рядка довжини, кратній ,за допомогою функції доповнення (pad-функції).
Рядок ділиться на блоків довжини :
«Всмоктування»: кожен блок доповнюється нулями до рядка довжини біт і підсумовується по модулю 2 з рядком стану , де — рядок довжини біт ( = + ). Перед використанням цієї функції всі елементи дорівнюють нулю. Для кожного наступного блоку стан — рядок, отриманий застосуванням функції перестановок до результату попереднього кроку.
«Віджимання»: поки довжина менша ( — кількість біт в результаті геш-функції), до додається перших біт стану , після кожного додавання до , застосовується функція перестановок . Потім обрізається до довжини біт
Рядок довжини біт повертається в якості результату
Завдяки тому, що стан містить додаткових біт, алгоритм стійкий до атаки подовженням повідомлення, до якої прийняті алгоритми SHA-1 і SHA-2.
У SHA-3 стан — це масив 5 × 5 слів довжиною = 64 біта, всього 5 × 5 × 64 = 1600 біт. Також в Keccak можуть використовуватися довжини , рівні меншим ступенями 2 (від = 1 до = 32).
Додаток
Для того, щоб вихідне повідомлення M можна було розділити на блоки довжини r, необхідно доповнення. У SHA-3 використовується патерн pad10*1[12]: до повідомлення додається 1, після нього 0 або більше нульових бітів (до r-1), в кінці -1.
r-1 нульових бітів може бути додано, коли останній блок повідомлення має довжину r-1 біт. Цей блок доповнюється одиницею, наступний блок складатиметься з r-1 нулів і одиниць.
Два одиничні біти додаються і в тому випадку, якщо довжина вихідного повідомлення M ділиться на r. У цьому випадку до повідомлення додається блок, який починається і закінчується одиницями, між якими r-2 нульових бітів. Це необхідно для того, щоб повідомлення, що закінчується послідовністю бітів як у функції доповнення, і для повідомлення без цих бітів значення геш-функції були різні.
Перший одиничний біт необхідний для того, щоб результати геш-функції від повідомлень, що відрізняються кількома нульовими бітами в кінці, були різними.
Стан можна подати у вигляді тривимірного масиву розміром 5 × 5 × . Тоді елемент масиву - це біт рядка стану .
Функція містить кілька кроків: , , , , , які виконуються декілька раундів. На кожному кроці позначимо вхідний масив A, вихідний масив A'.
Крок
Для всіх і таких, що , , покладемо
Для всіх таких, що , , ,
Крок
Для всіх , таких, як ,
Нехай на початку . Для від 0 до 23:
, таких, що , ,
Крок
Для всіх таких, що ,
Крок
Для всіх , таких, що , ,
Крок
Введемо додаткову функцію , де вхід — ціле число , а на виході біт.
Алгоритм
Якщо , то повертається 1
Нехай
Для t від 1 до 255:
R = 0 || R
Повертати
Алгоритм
— номер раунду.
Для всіх , таких, як , ,
Нехай — масив довжини , заповнений нулями.
Для від 0 до :
Для всіх , таких, як ,
Алгоритм перестановок
Переклад рядка в масив
Для від до
Переклад масиву в рядок довжини
Гешування повідомлення довільної довжини
Основою функції стиснення алгоритму є функція f, яка виконує перемішування внутрішнього стану алгоритму. Стан (позначимо його A) представляється у вигляді масиву 5×5, елементами якого є 64-бітові слова, ініційовані нульовими бітами (тобто, розмір стану складає 1600 бітів). Функція f виконує 24 раунди, в кожному з яких проводяться наступні дії:
C[x] = A[x, 0] A[x, 1] A[x, 2] A[x, 3] A[x, 4], x = 0…4;
D[x] = C[x — 1] (С[x + 1] >>> 1), x = 0…4;
A[x, y] = A[x, y] D[x], x = 0…4, y = 0…4;
B[y, 2x + 3y] = A[x, y] >>> r[x, y], x = 0…4, y = 0…4;
A[x, y] = B[x, y] (~B[x + 1, y] & B[x + 2, y]), x = 0…4, y = 0…4,
B — тимчасовий масив, аналогічний за структурою масиву стану;
C та D — тимчасові масиви, що містять по п'ять 64-бітних слів;
r — масив, що визначає величину циклічного зсуву для кожного слова стану;
та операції з індексами масиву виконуються по модулю 5.
Крім наведених вище операцій, в кожному раунді також виконується накладення операцією XOR раундової константи на слово A[0, 0].
Перед виконанням функції стискання накладається операція XOR фрагментів вихідного повідомлення з фрагментами вихідного стану. Результат обробляється функцією f. Дане накладення в сукупності з функцією стискання, що виконуються для кожного блоку вхідних даних, являють собою «вбираючу» (absorbing) фазу криптографічного губки.
Варто зазначити, що функція f використовує лише операції, стійкі до атак, що використовують витік даних по побічних каналах.
Результуюче геш-значення обчислюється в процесі виконання «вичавлень» (squeezing) фази криптографічної губки, основу якої становить описана вище функція f. Можливі розміри геш-значень — 224, 256, 384 512 біт.
Налаштування
Оригінальний алгоритм Keccak має безліч параметрів, що налаштовуються з метою забезпечення оптимального співвідношення криптостійкості і швидкодії для певного застосування алгоритму на певній платформі. Регульованими величинами є: розмір блоку даних, розмір стану алгоритму, кількість раундів у функції f() та інші.
Протягом конкурсу гешування Національного інституту стандартів і технологій учасники мали право налаштовувати свої алгоритми для вирішення виникаючих проблем. Так, були внесені деякі зміни в Keccak: кількість раундів було збільшено з 18 до 24 з метою збільшення запасу безпеки.
Автори Keccak заснували ряд призів за досягнення в криптоаналізі даного алгоритму.
Версія алгоритму, прийнята в якості остаточного стандарту SHA-3, має кілька незначних відмінностей від оригінальної пропозиції Keccak на конкурс. Зокрема, були обмежені деякі параметри (відкинуті повільні режими c=768 і c=1024), в тому числі для збільшення продуктивності[13][14][15][16]. Також у стандарті були введені функції з подовжуваним результатом» (XOF, Extendable Output Functions) SHAKE128 і SHAKE256, для чого гешоване повідомлення необхідно було доповнювати «суфіксом» з 2 або 4 біт, в залежності від типу функції.
Мала зміна повідомлення призводить до значних змін у значенні геш-функції завдяки лавинному ефекту як показано в наступних прикладах:
SHA3-224("The quick brown fox jumps over the lazy dog")
d15dadceaa4d5d7bb3b48f446421d542e08ad8887305e28d58335795
SHA3-224("The quick brown fox jumps over the lazy dog.")
2d0708903833afabdd232a20201176e8b58c5be8a6fe74265ac54db0
SHA3-256("The quick brown fox jumps over the lazy dog")
69070dda01975c8c120c3aada1b282394e7f032fa9cf32f4cb2259a0897dfc04
SHA3-256("The quick brown fox jumps over the lazy dog.")
a80f839cd4f83f6c3dafc87feae470045e4eb0d366397d5c6ce34ba1739f734d
SHA3-384("The quick brown fox jumps over the lazy dog")
7063465e08a93bce31cd89d2e3ca8f602498696e253592ed26f07bf7e703cf328581e1471a7ba7ab119b1a9ebdf8be41
SHA3-384("The quick brown fox jumps over the lazy dog.")
1a34d81695b622df178bc74df7124fe12fac0f64ba5250b78b99c1273d4b080168e10652894ecad5f1f4d5b965437fb9
SHA3-512("The quick brown fox jumps over the lazy dog")
01dedd5de4ef14642445ba5f5b97c15e47b9ad931326e4b0727cd94cefc44fff23f07bf543139939b49128caf436dc1bdee54fcb24023a08d9403f9b4bf0d450
SHA3-512("The quick brown fox jumps over the lazy dog.")
18f4f4bd419603f95538837003d9d254c26c23765565162247483f65c50303597bc9ce4d289f21d1c2f1f458828e33dc442100331b35e7eb031b5d38ba6460f8
SHAKE128("The quick brown fox jumps over the lazy dog", 256)
f4202e3c5852f9182a0430fd8144f0a74b95e7417ecae17db0f8cfeed0e3e66e
SHAKE128("The quick brown fox jumps over the lazy dof", 256)
853f4538be0db9621a6cea659a06c1107b1f83f02b13d18297bd39d7411cf10c
↑Guido Bertoni, Joan Daemen, Michaël Peeters, Gilles Van Assche.The Road from Panama to Keccak via RadioGatún : [арх. 22 грудня 2017] // Symmetric Cryptography. — Dagstuhl, Germany : Schloss Dagstuhl - Leibniz-Zentrum fuer Informatik, Germany, 2009.
↑Keccak Team. keccak.team. Архів оригіналу за 13 листопада 2017. Процитовано 12 листопада 2017.
↑Keccak Team. keccak.team. Архів оригіналу за 13 листопада 2017. Процитовано 12 листопада 2017.