A kis torzítási lemma (más néven Johnson-Lindenstrauss lemma ) kimondja, hogy egy többdimenziós térben egy ponthalmaz leképezhető egy sokkal kisebb térre oly módon, hogy a pontok közötti távolságok szinte változatlanok maradnak. Sőt, egy ilyen leképezés megtalálható az ortogonális vetületek között is .
A lemma lehetővé teszi a többdimenziós térben lévő pontok által reprezentált adatok tömörítését, és ami még fontosabb, az adatok méretének csökkentését jelentős információvesztés nélkül.
A lemmát William Johnson és Yoram Lindenstrauss bizonyította . [egy]
Hadd . Ekkor bármely és ponthalmazra létezik olyan lineáris leképezés , hogy
mindenkinek .
Ráadásul egy véletlenszerű merőleges vetítés egy -dimenziós altérre pozitív valószínűséggel teljesíti a feltételt.
Az egyik bizonyíték a mérték koncentrációs tulajdonságán alapul .
Egy rokon lemma a Johnson-Lindenstrauss eloszlási lemma. Ez az eloszlási lemma kimondja, hogy bármely 0 < ε , δ < 1/2 és d pozitív egész esetén létezik egy R k × d eloszlás , amelyből az A mátrixot úgy nyerjük ki , hogy k = O esetén ( ε −2 log(1/ δ ) )) és bármely x ∈ R d egységnyi hosszúságú vektorra igaz a következő állítás [2]
A megfelelő A mátrixokat Johnson-Lindenstrauss mátrixoknak ( JL mátrixoknak ) nevezik . Ez a lemma lényegében egy többváltozós eloszlás mátrixvetületének közelítésének pontosságát jellemzi.
A lemma disztributív változatának az eredeti megfelelőjével való kapcsolatát úgy kaphatjuk meg, hogy X -ben adunk meg és bizonyos u , v párokat .
A jelzett lemmák nagyon fontos eredménye az alacsonyabb dimenziójú vetületek beszerzésének lehetősége, de szükséges, hogy az ilyen vetületek a lehető legrövidebb időn belül elérhetők legyenek. Az A mátrix x vektorral való megszorzása a disztributív lemmában O ( kd ) időt vesz igénybe . Ezért számos tanulmányt végeztek olyan eloszlások meghatározására, amelyeknél a mátrix-vektor szorzat O ( kd ) időnél rövidebb idő alatt kiszámítható.
2006-ban Eilon és Bernard Chazelle bevezette az úgynevezett gyors Johnson-Lindenstrauss transzformációt (BPTL) , amely lehetővé teszi a mátrix-vektor szorzat időbeni kiszámítását bármely állandó esetén . [3]
Speciális esetet képviselnek a tenzoros véletlen vetületek, amelyekre az x egységhosszú vektor tenzorszerkezettel rendelkezik, és a vetületi A JL mátrixok több, azonos számú független sorral rendelkező mátrix végtermékével is kifejezhetők .
A BPDL-ben használt tenzorvetületek ábrázolására többdimenziós esetben, két azonos sorszámú JL-mátrix kombinációjaként, V. I. Slusar által 1996-ban javasolt arcfelosztási szorzat használható . [4] [5] [6] [7] [8] [9] .
Tekintsük egy többdimenziós tér vetületeinek két JL-mátrixát: és . A végtermékük [4] [5] [6] [7] [8] a következő:
Az így definiált JL mátrixok kevesebb véletlenszerű bitet használnak, és gyorsan megszorozhatók tenzorszerkezetű vektorokkal, köszönhetően a következő azonosságnak [6] :
,hol van az elemenkénti Hadamard szorzat .
Az A vetületi mátrixról a végtermékre való átmenet lehetővé teszi, hogy az eredeti szorzást a Hadamard szorzattal helyettesítsük, amely kisebb dimenziójú mátrixokkal operál. Ebben az összefüggésben a végtermék ötletét 2010-ben [10] használták a különböző adatvédelmi probléma megoldására . Emellett számos más lineáris algebrai algoritmusban is alkalmaztak hasonló számításokat a kernel módszer hatékony megvalósítására [11] .
2020-ban kimutatták, hogy kis dimenziós vetületek létrehozásához a végtermékben elegendő bármilyen véletlenszerű, független sorokat tartalmazó mátrixot használni, azonban nagyobb garanciák a kis torzítások elérésére nagydimenziós terekben valós Gauss-Johnson segítségével érhetők el. -Lindenstrauss mátrixok [12] .
Ha a mátrixok függetlenek, elemeket vagy Gauss-mátrixokat tartalmaznak, akkor az összevont mátrix akkor teljesíti a Johnson-Lindenstrauss-eloszlás lemmáját, ha a sorok száma legalább
[12] .Nagy esetén a Johnson-Lindenstrauss-eloszlási lemma szigorúan teljesül, míg a közelítési hiba alsó korlátja exponenciális függő [12] . A JL mátrixok alternatív konstrukcióit javasolják ennek a korlátozásnak a megkerülésére [12] .