Hamming távolság

Hamming távolság (kód távolság) - azon pozíciók száma, amelyekben két azonos hosszúságú szó megfelelő karakterei különböznek [1] . Általánosabban fogalmazva, a Hamming-távolságot bármely q - ary ábécé azonos hosszúságú karakterláncaira alkalmazzák, és az azonos méretű objektumok különbségi metrikájaként (egy metrikus tér távolságát meghatározó függvényként) szolgál.

A mérőszámot eredetileg Richard Hamming fogalmazta meg a Bell Labs -nál töltött ideje alatt, hogy meghatározza a kódszavak (bináris vektorok ) közötti különbség mértékét a kódszavak vektorterében: ebben az esetben a Hamming-távolságot két bináris sorozat (vektor) között és a hosszúságot . azoknak a pozícióknak a száma, amelyekben különböznek. Ebben a megfogalmazásban a Hamming - távolság szerepelt a NIST Algorithms and Data Structures szótárában . A Hamming-távolság a Minkowski-metrika speciális esete (a kivonás megfelelő definíciójával):  

.

Két szót, amelyek Hamming-távolsága 1, szomszédoknak nevezzük.

Egyes számrendszerekben, például a Gray-kódban , az 1-gyel eltérő kódolt egész számok Hamming-távolsága 1. Az ilyen számokat "szomszédosnak" nevezik.

A szomszédos kódolás fontos a logikai eszközök tervezésében, ahol el kell kerülni a logikai versenyeket .

Példák

Tulajdonságok

Egyenlő hosszúságú szavak halmaza egy metrikus teret alkot , ahol minden térelempárhoz egy szám van megadva - a Hamming-távolság , amely kielégíti a metrika axiómáit:

  1. ( identitás axiómája ).
  2. ( szimmetria-axióma ).
  3. ( háromszög axióma vagy háromszög egyenlőtlenség ).
akkor az azonosság axiómájából és a háromszög egyenlőtlenségből következik a szimmetriaxióma.

Hamming távolság mindig:

hol  a szavak hossza karakterekben.

Hamming-távolság a bioinformatikában és a genomikában

Nukleinsavak ( DNS és RNS ) esetében két polinukleotid lánc hibridizációjának lehetősége egy másodlagos szerkezet - kettős hélix  - kialakításával mindkét lánc nukleotidszekvenciájának komplementaritási fokától függ. A Hamming-távolság növekedésével a komplementer bázispárok által alkotott hidrogénkötések száma csökken, és ennek megfelelően csökken a kettős lánc stabilitása. Valamilyen határ Hamming távolságból kiindulva a hibridizáció lehetetlenné válik.

A homológ DNS-szekvenciák evolúciós divergenciájában a Hamming-távolság egy olyan mérték, amely alapján meg lehet ítélni a homológok eltérése óta eltelt időt, például a homológ géneket és a prekurzor gént elválasztó evolúciós szegmens hosszát.

Lásd még

Jegyzetek

  1. Hamming-távolság: Azon számjegyek száma, amelyekben két azonos hosszúságú bináris szó megfelelő számjegyei különböznek ( szövetségi szabvány, 1037C , archiválva : 2009. március 2., a Wayback Machine -nél ).

Irodalom