Kis Torzítás Lemma

A kis torzítási lemma (más néven Johnson-Lindenstrauss lemma ) kimondja, hogy egy többdimenziós térben egy ponthalmaz leképezhető egy sokkal kisebb térre oly módon, hogy a pontok közötti távolságok szinte változatlanok maradnak. Sőt, egy ilyen leképezés megtalálható az ortogonális vetületek között is .

A lemma lehetővé teszi a többdimenziós térben lévő pontok által reprezentált adatok tömörítését, és ami még fontosabb, az adatok méretének csökkentését jelentős információvesztés nélkül.

A lemmát William Johnson és Yoram Lindenstrauss bizonyította . [egy]

Megfogalmazás

Hadd . Ekkor bármely és ponthalmazra létezik olyan lineáris leképezés ,  hogy

mindenkinek .

Ráadásul egy véletlenszerű merőleges vetítés egy -dimenziós altérre pozitív valószínűséggel teljesíti a feltételt.

A bizonyítékokról

Az egyik bizonyíték a mérték koncentrációs tulajdonságán alapul .

Alternatív megfogalmazás

Egy rokon lemma a Johnson-Lindenstrauss eloszlási lemma. Ez az eloszlási lemma kimondja, hogy bármely 0 <  ε , δ < 1/2 és d  pozitív egész esetén létezik egy R k × d eloszlás , amelyből az A mátrixot úgy nyerjük ki , hogy k = O esetén ( ε −2 log(1/ δ ) )) és bármely x ∈ R d egységnyi hosszúságú vektorra igaz a következő állítás [2]

A megfelelő A mátrixokat Johnson-Lindenstrauss mátrixoknak ( JL mátrixoknak ) nevezik .  Ez a lemma lényegében egy többváltozós eloszlás mátrixvetületének közelítésének pontosságát jellemzi.

A lemma disztributív változatának az eredeti megfelelőjével való kapcsolatát úgy kaphatjuk meg, hogy X -ben adunk meg és bizonyos u , v párokat .

A jelzett lemmák nagyon fontos eredménye az alacsonyabb dimenziójú vetületek beszerzésének lehetősége, de szükséges, hogy az ilyen vetületek a lehető legrövidebb időn belül elérhetők legyenek. Az A mátrix x vektorral való megszorzása a disztributív lemmában O ( kd ) időt vesz igénybe . Ezért számos tanulmányt végeztek olyan eloszlások meghatározására, amelyeknél a mátrix-vektor szorzat O ( kd ) időnél rövidebb idő alatt kiszámítható.

2006-ban Eilon és Bernard Chazelle bevezette az úgynevezett gyors Johnson-Lindenstrauss transzformációt (BPTL) , amely lehetővé teszi a mátrix-vektor szorzat időbeni kiszámítását bármely állandó esetén . [3]

Speciális esetet képviselnek a tenzoros véletlen vetületek, amelyekre az x egységhosszú vektor tenzorszerkezettel rendelkezik, és a vetületi A JL mátrixok több, azonos számú független sorral rendelkező mátrix végtermékével is kifejezhetők .

Többdimenziós terek tenzor vetületei

A BPDL-ben használt tenzorvetületek ábrázolására többdimenziós esetben, két azonos sorszámú JL-mátrix kombinációjaként, V. I. Slusar által 1996-ban javasolt arcfelosztási szorzat használható .  [4] [5] [6] [7] [8] [9] .

Tekintsük egy többdimenziós tér vetületeinek két JL-mátrixát: és . A végtermékük [4] [5] [6] [7] [8] a következő:

Az így definiált JL mátrixok kevesebb véletlenszerű bitet használnak, és gyorsan megszorozhatók tenzorszerkezetű vektorokkal, köszönhetően a következő azonosságnak [6] :

,

hol van az elemenkénti Hadamard szorzat .

Az A vetületi mátrixról a végtermékre való átmenet lehetővé teszi, hogy az eredeti szorzást a Hadamard szorzattal helyettesítsük, amely kisebb dimenziójú mátrixokkal operál. Ebben az összefüggésben a végtermék ötletét 2010-ben [10] használták a különböző adatvédelmi probléma megoldására .  Emellett számos más lineáris algebrai algoritmusban is alkalmaztak hasonló számításokat a kernel módszer hatékony megvalósítására [11] .

2020-ban kimutatták, hogy kis dimenziós vetületek létrehozásához a végtermékben elegendő bármilyen véletlenszerű, független sorokat tartalmazó mátrixot használni, azonban nagyobb garanciák a kis torzítások elérésére nagydimenziós terekben valós Gauss-Johnson segítségével érhetők el. -Lindenstrauss mátrixok [12] .

Ha a mátrixok függetlenek, elemeket vagy Gauss-mátrixokat tartalmaznak, akkor az összevont mátrix akkor teljesíti a Johnson-Lindenstrauss-eloszlás lemmáját, ha a sorok száma legalább

[12] .

Nagy esetén a Johnson-Lindenstrauss-eloszlási lemma szigorúan teljesül, míg a közelítési hiba alsó korlátja exponenciális függő [12] . A JL mátrixok alternatív konstrukcióit javasolják ennek a korlátozásnak a megkerülésére [12] .

Jegyzetek

  1. Johnson, William B. és Lindenstrauss, Joram (1984), Konferencia a modern elemzésben és valószínűségben (New Haven, Conn., 1982) , in Beals, Richard; Beck, Anatole & Bellow, Alexandra et al., Conference in modern analysis and probability (New Haven, Conn., 1982) , 1. kötet. 26, Contemporary Mathematics, Providence, RI: American Mathematical Society, pp. 189–206, ISBN 0-8218-5030-X , DOI 10.1090/conm/026/737400 . 
  2. Johnson, William B. és Lindenstrauss, Joram (1984), Konferencia a modern elemzésben és valószínűségben (New Haven, Conn., 1982) , in Beals, Richard; Beck, Anatole & Bellow, Alexandra et al., Conference in modern analysis and probability (New Haven, Conn., 1982) , 1. kötet. 26, Contemporary Mathematics, Providence, RI: American Mathematical Society, pp. 189–206 , ISBN 0-8218-5030-X , doi : 10.1090/conm/026/737400 , < https://archive.org/details/conferenceinmode0000conf/page/189 > . 
  3. Ailon, Nir & Chazelle, Bernard (2006), Proceedings of the 38th Annual ACM Symposium on Theory of Computing , Proceedings of the 38th Annual ACM Symposium on Theory of Computing , New York: ACM Press, pp. 557–563, ISBN 1-59593-134-1 , DOI 10.1145/1132516.1132597 . 
  4. 1 2 Slyusar, VI (1996. december 27.). „Végtermékek mátrixokban radar alkalmazásokban” (PDF) . Radioelectronics and Communications Systems. – 1998, Vol. 41; 3. szám : 50-53. Archivált (PDF) az eredetiből ekkor: 2020-07-27 . Letöltve: 2020-07-30 . Elavult használt paraméter |deadlink=( súgó )
  5. 1 2 Slyusar, VI (1997-05-20). „A digitális antennatömb analitikai modellje arcfelosztó mátrixtermékek alapján” (PDF) . Proc. ICATT-97, Kijev : 108-109. Archivált (PDF) az eredetiből ekkor: 2020-01-25 . Letöltve: 2020-07-30 . Elavult használt paraméter |deadlink=( súgó )
  6. 1 2 3 Slyusar, VI (1997-09-15). „Új mátrixműveletek termék radarok alkalmazásához” (PDF) . Proc. Az elektromágneses és akusztikus hullámelmélet direkt és inverz problémái (DIPED-97), Lviv. : 73-74. Archivált (PDF) az eredetiből ekkor: 2020-01-25 . Letöltve: 2020-07-30 . Elavult használt paraméter |deadlink=( súgó )
  7. 1 2 Slyusar, VI (1998. március 13.). „A mátrixok arctermékeinek családja és tulajdonságai” (PDF) . Kibernetika és rendszerelemzés C/C of Cybernetika I Sistemnyi Analiz.- 1999 . 35 (3): 379-384. DOI : 10.1007/BF02733426 . Archivált (PDF) az eredetiből ekkor: 2020-01-25 . Letöltve: 2020-07-30 . Elavult használt paraméter |deadlink=( súgó )
  8. 1 2 Slyusar, VI (2003). „A nem azonos csatornákkal rendelkező digitális antennatömbök modelljei mátrixainak általánosított arcszorzatai” (PDF) . Rádióelektronika és kommunikációs rendszerek . 46 (10): 9-17.
  9. Anna Esteve, Eva Boj és Josep Fortiana (2009): Interaction Terms in Distance-Based Regression, Communications in Statistics – Theory and Methods, 38:19, P. 3501 [1] Archiválva : 2021. április 26. a Wayback Machine -nél
  10. Kasiviswanathan, Shiva Prasad és mások. "A privát kiadású kontingenciatáblázatok ára és a véletlenszerű mátrixok spektrumai korrelált sorokkal." Proceedings of the negyvenkettedik ACM szimpózium on Theory of Computing. 2010.
  11. Woodruff, David P. "A vázlatkészítés mint eszköz a numerikus lineáris algebrához." Elméleti Számítástudomány 10.1-2 (2014): 1-157.
  12. 1 2 3 4 Ahle, Thomas; Kapralov, Michael; Knudsen, Jacob; Pagh, Rasmus; Velingker, Ameya; Woodruff, David; Zandieh, Amir (2020). Magas fokú polinom kernelek önfeledt vázlata . ACM-SIAM Szimpózium a diszkrét algoritmusokról. Számítógépek Szövetsége. DOI : 10,1137/1,9781611975994,9 .

Irodalom