Distance de Hamming

La distance de Hamming est une notion mathématique, définie par Richard Hamming, et utilisée en informatique, en traitement du signal et dans les télécommunications. Elle joue un rôle important en théorie algébrique des codes correcteurs. Elle permet de quantifier la différence entre deux séquences de symboles. C'est une distance au sens mathématique du terme. À deux suites de symboles de même longueur, elle associe le nombre de positions où les deux suites diffèrent.

Le poids de Hamming correspond au nombre d'éléments différents de zéro dans une chaîne d'éléments d'un corps fini.

Intérêt du concept

Histoire et domaine d'applications

La distance de Hamming doit son nom à Richard Hamming (1915-1998). Elle est décrite dans un article[1] fondateur pour la théorie des codes. Elle est utilisée en télécommunications pour compter le nombre de bits altérés dans la transmission d'un message d'une longueur donnée. Le poids de Hamming correspond au nombre de bits différents de zéro, il est utilisé dans plusieurs disciplines comme la théorie de l'information, la théorie des codes et la cryptographie. Néanmoins, pour comparer des séquences de longueurs variables, ou des chaines de caractères pouvant subir non seulement des substitutions, mais aussi des insertions ou des effacements, des métriques plus sophistiquées comme la distance de Levenshtein sont plus adaptées.

Motivation

Illustration d'un code non correcteur et d'un code correcteur.

Les codes correcteurs ont leurs sources dans un problème de la transmission de données. Parfois, une transmission de données se fait en utilisant une voie de communication non entièrement fiable. L'objectif d'un code correcteur est l'apport d'une redondance de l'information de telle manière que l'erreur puisse être détectée, voire corrigée.

Un message est un élément d'un ensemble E constitué de suites finies de lettres choisies dans un alphabet A. L'apport de la redondance est le résultat d'une application injective φ de E dans un ensemble F constitué aussi de suite finies de lettres d'un alphabet A'. Les suites de l'ensemble F sont choisies a priori plus longues que celle de E. L'ensemble φ(E) est appelé code et un élément de cet ensemble φ(m) mot du code. L'intérêt de transmettre φ(m) à la place de m est illustré par la figure à droite.

Le cas d'un code sans redondance est illustré à gauche sur la figure. F est alors égal à E et φ est l'identité. Si un message en vert subit, lors de sa transmission, une altération, un nouveau message en rouge est transmis. Aucune information ne laisse supposer qu'une erreur a été commise.

Pour pallier cet état, l'objectif est d'entourer les mots du code, correspondant, sur la figure de droite aux points verts, par des messages connus pour contenir des erreurs. Ces redondances sont illustrées par les intersections du quadrillage orange. Si une unique erreur se produit, alors le message transmis correspond à un point rouge. Si la redondance a été habilement construite, il n'existe qu'un point vert proche du point rouge reçu, l'erreur est corrigible.

La distance de Hamming correspond sur la figure au plus petit nombre de segments du quadrillage à traverser pour joindre deux points.

Définition et exemples

Définitions

  • Soit A un alphabet et F l'ensemble des suites de longueur n à valeur dans A. La distance de Hamming entre deux éléments a et b de F est le nombre d'éléments de l'ensemble des images de a qui diffèrent de celle de b.

Formellement, si d(.,.) désigne la distance de Hamming :

La notation #E désigne le cardinal de l'ensemble E.

Un cas important dans la pratique est celui des symboles binaires. Autrement dit A= {0,1}, On peut alors écrire, si ⊕ désigne le ou exclusif.

Dans le cas, fréquent, où l'alphabet est un corps fini, F possède une structure d'espace vectoriel de dimension n. La distance dérive alors d'une pseudo-norme[réf. nécessaire] :

  • Soit K est un corps fini et F l'ensemble des suites de longueur n à valeur dans K. Le poids de Hamming p(a) d'un élément a de F est le cardinal de l'ensemble des images de a non nulles.

L'alphabet est souvent F2 le corps à deux éléments {0,1}. Le poids de Hamming est une pseudo-norme car :

Néanmoins, si l'alphabet est un corps fini, alors la distance dérive du poids de Hamming, en effet:

Exemples

Considérons les suites binaires suivantes :

La distance entre a et b est égale à 3 car 3 bits diffèrent.

  • La distance de Hamming entre 1011101 et 1001001 est 2.
  • La distance de Hamming entre 2143896 et 2233796 est 3.
  • La distance de Hamming entre "ramer" et "cases" est 3.

Cas binaire

Cube binaire de dimension trois.
Hypercube binaire de dimension quatre.

Un cas important est celui où l'alphabet est le corps à deux éléments {0,1}. Une lettre est alors appelée bit. Il est largement utilisé en informatique et en télécommunications.

Il est possible d'illustrer graphiquement le code et les distances entre les différents mots.

Le cas où un mot comporte trois lettres est illustré sur la figure de gauche. La distance entre 010 et 111 est égale à deux car il est nécessaire de parcourir deux segments pour joindre les deux points. La distance pour joindre les points 100 et 011 est égale à trois.

La figure de droite illustre un hypercube binaire de dimension quatre. La distance entre 0110 et 1110 est égale à un, alors que la distance entre 0100 et 1001 est égal à trois.

Le poids de Hamming d'un élément a correspond à la distance entre le mot zéro n'ayant que des coordonnées nulles et a.

Propriété

Distance

La distance de Hamming est une distance au sens mathématique du terme :

(symétrie)
(séparation)
(inégalité triangulaire)

La troisième propriété se démontre par une récurrence sur n.

Capacité de correction et distance minimale

La distance minimale δ est le minimum de distance entre deux mots du code. Elle permet de déterminer le nombre maximal d'erreurs t corrigibles de manière certaine. La valeur de t est en effet celle du plus grand entier strictement inférieur à δ/2.

Si M désigne le nombre de mots du code, q le nombre de lettres de l'alphabet A de F et Vt le cardinal d'une boule fermée de rayon t, alors la majoration suivante est vérifiée:

Cette majoration porte le nom de Borne de Hamming.

Dans le cas d'un code linéaire, et si k désigne la longueur des mots du code, il existe une autre majoration, dite borne de Singleton :

Applications

Somme de contrôle

Données sur 7 bits avec bit de parité
0000000 00000000
1010001 11010001
1101001 01101001
1111111 11111111

La somme de contrôle est un exemple simple d'utilisation de la distance de Hamming. La distance minimale entre deux mots du code est égale à deux. En conséquence, si une unique erreur se produit elle est détectée. En revanche, elle n'est pas corrigeable sans retransmission. En effet, il existe a priori plusieurs mots de code à distance de un du message erroné.

L'exemple le plus simple est celui du bit de parité. Il correspond à une somme de contrôle dans le cas où le corps est binaire, c'est-à-dire qu'il contient deux éléments zéro et un.

Supposons que l'objectif soit la transmission de sept bits. Un bit de parité est défini comme étant égal à zéro si la somme des autres bits est paire et à un dans le cas contraire. Les huit bits transmis sont d'abord le bit de parité puis les sept bits du message. Il correspond au bit de parité pair, c'est-à-dire la deuxième colonne du tableau de droite. Les messages envoyés sur huit bits ont toujours la parité zéro, ainsi si une erreur se produit, un zéro devient un un, ou l'inverse; le récepteur sait qu'une altération a eu lieu. En effet la somme des bits devient impaire ce qui n'est pas possible sans erreur de transmission.

Code de Hamming

Le code de Hamming est un exemple un peu plus complexe que le précédent. La distance minimale entre deux mots du code est égale à trois. Si une unique altération se produit, alors le message reçu est à une distance de un d'un unique point du code. Il est ainsi possible de corriger automatiquement une erreur, si l'on sait que l'erreur est unique.

Code linéaire

Les codes linéaires forment une famille contenant les deux exemples précédents. L'alphabet est un corps fini, les ensembles E et F sont des espaces vectoriels et l'application φ est linéaire. La distance de Hamming dérive de la pseudo-norme : le poids de Hamming. Ce contexte est très généralement celui qu'utilise l'industrie.

Code cyclique

Cette famille de codes correspond à un cas particulier de code linéaire. Les structures E et F sont enrichies d'une structure d'anneau leur conférant le statut d'algèbre. Cette structure, se fondant sur la théorie polynômes sur les extensions de corps finis permet de construire des distances minimales aussi élevées qu'on le souhaite.

De nombreux codes sont construits sur cette théorie. Le code de Hamming apparaît comme un cas particulier de ceux-là. On peut citer aussi les codes BCH ou les codes de Reed-Solomon utilisés par exemple pour les disques compacts.

Notes et références

  1. Richard Hamming error-detecting and error-correcting codes Bell System Technical Journal 29(2):147-160, 1950

Voir aussi

Article connexe

Liens externes

Bibliographie

Read other articles:

هذه المقالة يتيمة إذ تصل إليها مقالات أخرى قليلة جدًا. فضلًا، ساعد بإضافة وصلة إليها في مقالات متعلقة بها. (يوليو 2019) أودري هانا معلومات شخصية الميلاد 29 سبتمبر 1982 (42 سنة)  ساربروكن  مواطنة ألمانيا  الحياة العملية المهنة مغنية،  ومقدمة تلفزيونية  اللغات الألمانية…

西維珍尼亞 美國联邦州State of West Virginia 州旗州徽綽號:豪华之州地图中高亮部分为西維珍尼亞坐标:37°10'N-40°40'N, 77°40'W-82°40'W国家 美國加入聯邦1863年6月20日(第35个加入联邦)首府(最大城市)查爾斯頓政府 • 州长(英语:List of Governors of {{{Name}}}]]) • 副州长(英语:List of lieutenant governors of {{{Name}}}]])吉姆·賈斯蒂斯(R)米奇·卡邁克爾(英…

此条目序言章节没有充分总结全文内容要点。 (2019年3月21日)请考虑扩充序言,清晰概述条目所有重點。请在条目的讨论页讨论此问题。 哈萨克斯坦總統哈薩克總統旗現任Қасым-Жомарт Кемелұлы Тоқаев卡瑟姆若马尔特·托卡耶夫自2019年3月20日在任任期7年首任努尔苏丹·纳扎尔巴耶夫设立1990年4月24日(哈薩克蘇維埃社會主義共和國總統) 哈萨克斯坦 哈萨克斯坦政府與…

Навчально-науковий інститут інноваційних освітніх технологій Західноукраїнського національного університету Герб навчально-наукового інституту інноваційних освітніх технологій ЗУНУ Скорочена назва ННІІОТ ЗУНУ Основні дані Засновано 2013 Заклад Західноукраїнський на…

Holds the penis close to the pubic bone and supports it when erect Suspensory ligament of penisVertical section of bladder, penis, and urethraDetailsIdentifiersLatinligamentum suspensorium penisTA98A04.5.02.019MTA23690FMA18086Anatomical terminology[edit on Wikidata] The suspensory ligament of the penis is attached to the pubic symphysis, which holds the penis close to the pubic bone and supports it when erect. The ligament does not directly connect to the corpus cavernosum penis, but may sti…

Si ce bandeau n'est plus pertinent, retirez-le. Cliquez ici pour en savoir plus. Cet article ne cite pas suffisamment ses sources (février 2023). Si vous disposez d'ouvrages ou d'articles de référence ou si vous connaissez des sites web de qualité traitant du thème abordé ici, merci de compléter l'article en donnant les références utiles à sa vérifiabilité et en les liant à la section « Notes et références ». En pratique : Quelles sources sont attendues ? Com…

Political ideology and movement Not to be confused with English nationalism. The Union Jack of the United Kingdom, adopted in this version in 1801 bearing the England's red cross with white border (England in 1801 included Wales within it), Ireland's Saint Patrick's Saltire with a white border, and Scotland's Saint Andrew's Saltire and blue background. This is a common symbol used by British nationalists Anne was the first monarch of the Kingdom of Great Britain King Arthur, the king of the anci…

Saint-Quentin-sur-le-HommecomuneSaint-Quentin-sur-le-Homme – Veduta LocalizzazioneStato Francia Regione Normandia Dipartimento Manica ArrondissementAvranches CantonePontorson TerritorioCoordinate48°39′N 1°19′W48°39′N, 1°19′W (Saint-Quentin-sur-le-Homme) Superficie16,78 km² Abitanti1 285[1] (2009) Densità76,58 ab./km² Altre informazioniCod. postale50220 Fuso orarioUTC+1 Codice INSEE50543 CartografiaSaint-Quentin-sur-le-Homme Sito istituzionaleModi…

1593–1603 Irish war against Tudor conquest For the war of the 1690s, see Nine Years' War. This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Nine Years' War Ireland – news · newspapers · books · scholar · JSTOR (November 2021) (Learn how and when to remove this message) Nine Years' WarPart of the Tudor conq…

Indian economist and former governor of Reserve Bank of India Raghuram RajanRajan in 200423rd Governor of the Reserve Bank of IndiaIn office4 September 2013 – 4 September 2016Prime MinisterManmohan SinghNarendra ModiPreceded byDuvvuri SubbaraoSucceeded byUrjit Patel15th Chief Economic Adviser to the Government of IndiaIn office10 August 2012 – 4 September 2013Prime MinisterManmohan SinghPreceded byKaushik BasuSucceeded byArvind Subramanian7th Chief Economist of the Internat…

Type of worship service within many Christian denominations Painting of a 15th-century MassPart of a series on theEucharist Lord's Supper Communion Elements Bread Wine Ritual and liturgy Divine Liturgy Holy Qurobo Holy Qurbana Divine Service Mass Requiem Solemn Consecration/Anaphora Epiclesis Words of Institution Anamnesis Practices and customs Closed and open table Communion under both kinds Adoration Discipline Thanksgiving Reserved sacrament Feast of Corpus Christi First Communion Infant comm…

Men's Greco-Roman 57 kgat the Games of the XIX OlympiadVenueInsurgentes Ice RinkDates23–26 OctoberCompetitors24 from 24 nationsMedalists János Varga  Hungary Ion Baciu  Romania Ivan Kochergin  Soviet Union← 19641972 → Wrestling at the1968 Summer OlympicsFreestyleFlyweightmenBantamweightmenFeatherweightmenLightweightmenWelterweightmenMiddleweightmenLight heavyweightmenHeavyweightmenGreco-RomanFlyweightmenBantamweightmenFeatherweightmenLightweightm…

1994 video gameJazz JackrabbitDeveloper(s)Epic MegaGamesPublisher(s)Epic MegaGamesProducer(s)Mark ReinTim SweeneyDesigner(s)Robert A. AllenCliff BleszinskiArjan BrusseeProgrammer(s)Arjan BrusseeArtist(s)Nick StadlerComposer(s)Robert A. AllenSeriesJazz JackrabbitPlatform(s)MS-DOSReleaseWW: August 1, 1994[1]Jazz Jackrabbit CDWW: November 28, 1994[2]Holiday Hare '94WW: December 15, 1994[3]Holiday Hare '95WW: November 17, 1995[4]Genre(s)PlatformMode(s)Single-player Ja…

الحروب العثمانية الهابسبورغية جزء من الحروب العثمانية في أوروبا معركة ليبانت البحرية (1571) في لوحة مجهولة تعود لأواخر القرن السادس عشر في المتحف البحري الوطني معلومات عامة التاريخ 1526 (معركة موهاج) إلى 1761 (معاهدة زيشتوف) (265 سنة) الموقع وسط وشرق أوروبا النتيجة نهاية التوسع العث…

This is a dynamic list and may never be able to satisfy particular standards for completeness. You can help by adding missing items with reliable sources. This article has multiple issues. Please help improve it or discuss these issues on the talk page. (Learn how and when to remove these template messages) This article may require cleanup to meet Wikipedia's quality standards. The specific problem is: many entries appear to be non-notable, if not outright spam. Please help improve this article …

عالم كيمياء أو مهني متخصص يضيف كمية محددة من مادة كيميائية لصنع مركب معين - مكون دواء في هذه الحالة. الاصطناع[1] أو التخليق الكيميائي (بالإنجليزية: Chemical synthesis)‏ مصطلح يطلق على عملية تصنيع مادة كيميائية ما اعتبارا من مركبات كيميائية أولية غاية في البساطة، تتضمن العملية است…

يفتقر محتوى هذه المقالة إلى الاستشهاد بمصادر. فضلاً، ساهم في تطوير هذه المقالة من خلال إضافة مصادر موثوق بها. أي معلومات غير موثقة يمكن التشكيك بها وإزالتها. (نوفمبر 2019) هذه المقالة يتيمة إذ تصل إليها مقالات أخرى قليلة جدًا. فضلًا، ساعد بإضافة وصلة إليها في مقالات متعلقة بها. (…

Artikel ini tidak memiliki referensi atau sumber tepercaya sehingga isinya tidak bisa dipastikan. Tolong bantu perbaiki artikel ini dengan menambahkan referensi yang layak. Tulisan tanpa sumber dapat dipertanyakan dan dihapus sewaktu-waktu.Cari sumber: Relasi biner – berita · surat kabar · buku · cendekiawan · JSTOR Empat jenis relasi biner Relasi biner dalam matematika, singkatnya relasi, adalah hubungan antara dua elemen himpunan . Hubungan ini bersifat…

British judge (born 1953) The Right HonourableLord HodgePCDeputy President of the Supreme Court of the United KingdomIncumbentAssumed office 27 January 2020Nominated byRobert BucklandAppointed byElizabeth IIPresidentThe Lord Reed of AllermuirPreceded byLord ReedJustice of the Supreme Court of the United KingdomIn office1 October 2013 – 26 January 2020Nominated byChris GraylingPreceded byThe Lord Hope of CraigheadNon-Permanent Judge of the Court of Final Appeal of Hong KongIn offic…

Parliamentary constituency in the United Kingdom, 1983–1997 This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Inverness, Nairn and Lochaber UK Parliament constituency – news · newspapers · books · scholar · JSTOR (December 2007) (Learn how and when to remove this message) Inverness, Nairn and LochaberForme…