Відстань Геммінга

Матеріал з testwiki
Версія від 15:28, 19 вересня 2022, створена imported>Lxlalexlxl (Див. також)
(різн.) ← Попередня версія | Поточна версія (різн.) | Новіша версія → (різн.)
Перейти до навігації Перейти до пошуку

Відстань Геммінга (Шаблон:Lang-en)  — число позицій, у яких відповідні цифри двох двійкових слів однакової довжини різні[1]. У загальнішому випадку відстань Геммінга застосовується для рядків однакової довжини будь-яких абеток, що складаються з q символів, і служить метрикою відмінності (функцією, що визначає відстань в метричному просторі) об'єктів однакової вимірності.

Іншими словами, відстань Геммінга вимірює мінімальну кількість замін, необхідних для зміни одного рядка в інший, або мінімальну кількість помилок, які могли перетворити одну стрічку в іншу. У більш загальному контексті відстань Хеммінга є однією з Шаблон:Нп для вимірювання Шаблон:Нп між двома послідовностями.

Спочатку метрика була сформульована Річардом Геммінгом під час його роботи в Bell Labs для визначення міри відмінності між кодовими комбінаціями (двійковими векторами) у векторному просторі кодових послідовностей, в цьому випадку відстанню Геммінга d(x,y) між двома двійковими послідовностями (векторами) x і y довжини n називається кількість позицій, в яких вони різні — в такому формулюванні відстань Геммінга увійшла в Шаблон:Нп національного інституту стандартів і технологій США.

Приклади

  • d(1011101,1001001)=2
  • d(2173896,2233796)=3
  • d(toned,roses)=3

Властивості

Відстань Геммінга має властивості метрики, задовольняючи таким умовам:

  • d(x,y)0
  • d(x,x)=0
  • d(x,y)=d(y,x)
  • d(x,z)d(x,y)+d(y,z)

Відстань Геммінга в біоінформатиці та геноміці

Для нуклеїнових кислот (ДНК та РНК) можливість гібридизації двох полінуклеотидних ланцюгів з утворенням вторинної структури — подвійної спіралі — залежить від ступеня комплементарності нуклеотидних послідовностей обох ланцюгів. При збільшенні відстані Геммінга кількість водневих зв'язків, утворених комплементарними парами основ зменшується і, відповідно, зменшується стабільність подвійного ланцюга. Починаючи з деякої граничної відстані Геммінга гібридизація стає неможливою.

При еволюційному розходженні гомологічних ДНК-послідовностей відстань Геммінга є мірою, за якою можна судити про час, що пройшов з моменту розбіжності гомологів, наприклад, про тривалість еволюційного відрізку, що розділяє гени-гомолог і ген-попередник.

Див. також

Примітки

Шаблон:References

Література

  • Блейхут Р. Теория и практика кодов, контролирующих ошибки = Theory and Practice of Error Control Codes. — М.: Мир, 1986. — 576 с.
  • Шаблон:Citation.

Шаблон:Рядки

  1. Hamming distance: The number of digit positions in which the corresponding digits of two binary words of the same length are different (Federal Standard 1037C Шаблон:Webarchive).