Az idézetelemzés a dokumentumokban található hivatkozások gyakoriságának, mintázatainak és ütemezésének tanulmányozása. Használja az idézetmintát, hivatkozásokat egyik dokumentumról a másikra, hogy felfedezze a dokumentumok tulajdonságait. Tipikus cél a gyűjtemény legfontosabb dokumentumainak azonosítása. Klasszikus példa erre az idézet a tudományos dolgozatok és a könyvek között. [1] [2] A bírói döntések az angolszász jogrendszerben döntéseik megerősítése érdekében korábbi ügyekben hozott döntésekre hivatkoznak, ezért fontos az idézet jogi kontextusban történő elemzése. Egy másik példa a korábbi találmányokat tartalmazó szabadalmak, a jelen igényponthoz kapcsolódó, korábban hivatkozott szabadalmak.
A dokumentumokhoz a hivatkozásokon kívül sok más jellemző is társítható, mint például szerzők, kiadók, folyóiratok, valamint azok tényleges szövegei. A dokumentumgyűjtemények általános elemzését bibliometriának nevezik , és ennek az iránynak a kulcsfontosságú eleme a hivatkozáselemzés. Például a bibliográfiai hivatkozás és a megosztás hivatkozáselemzésen alapuló társított mérőszámok (megosztott hivatkozások vagy megosztott hivatkozások). A közlemények gyűjteményében található idézetek a következő hivatkozási grafikonok formájában is bemutathatók, amint azt Derek de Solla Price megjegyezte az 1965-ös "Networks of Scientific Papers" című közleményében. [3] Ez azt jelenti, hogy az idézetelemzés a közösségi hálózatelemzés és a hálózattudomány szempontjaira támaszkodik.
Az automatikus hivatkozás-indexelés korai példája a CiteSeer volt , amelyet tudományos jelentések idézésére használtak, a Google Scholar pedig egy olyan modern rendszer példája, amely nemcsak tudományos könyveket és cikkeket foglal magában, és az információforrások szélesebb körét tükrözi. Napjainkban az automatizált idézetindexelés [4] megváltoztatta az idézetelemzési kutatások természetét, lehetővé téve több millió hivatkozás elemzését nagyszabású modellek és tudásfeltárás céljából. A tudósok az idézetelemző eszközöket használhatják a hatás különböző mértékeinek kiszámítására az idézettségi index adatai alapján . [5] [6] [7] Alkalmazásaik a szakértői bírák azonosításától a dokumentumok és támogatási javaslatok áttekintéséig, a tanulmányi érdemekre, a hivatali időre és a döntéshozatalra vonatkozó döntések alátámasztására szolgáló átlátható adatok biztosításáig terjednek. Ez a korlátozott erőforrásokért folytatott verseny etikailag megkérdőjelezhető magatartáshoz vezethet a megnövekedett hivatkozások miatt. [8] [9]
Erősen bírálták azt a gyakorlatot, hogy a hivatkozáselemzést naivan használják a különböző tudományos cikkek hatásának összehasonlítására anélkül, hogy figyelembe vennének más, az idézési mintákat befolyásoló tényezőket. [10] A kritikák között következetesen az „ipar függetlenségére” helyezik a hangsúlyt, nevezetesen arra, hogy az egyik tudományterületen alkalmazott idézési gyakorlatok eltérnek egy másik, sőt egy tudományterületen belüli kutatási ágak gyakorlatától. [tizenegy]
Míg az idézési indexeket eredetileg információ-visszakeresésre fejlesztették ki , egyre gyakrabban használják bibliometriai és egyéb kutatási értékelést magában foglaló tanulmányokhoz. A hivatkozási adatok egy népszerű folyóirat befolyási hányadosának alapját is képezik.
Számos irodalom létezik az idézetelemzésről, amelyet néha scientometriának is neveznek, amelyet Vaszilij Nalimov alkotott meg , vagy pontosabban bibliometriának . Az ipar virágzásnak indult a Science Citation Index megjelenésével, amely az 1900 óta megjelent irodalmat foglalja magában. Az iparág vezető folyóiratai a Scientometrics , az Informatics és a Journal of the Association for Information Science and Technology. Utóbbi Sigmetrica néven elektronikus levelezőlistát is szervez az ATIT-nél. [12] Ezt a módszert újjáélesztik az adatbázisok széles körű elterjedése, a Web Science és a Scopus előfizetések számos egyetemen, valamint a nyilvános ingyenes idézőeszközök, mint például a CiteBase, CiteSeerX , Google Scholar és a korábbi Windows Live Academic program (most olyan további funkciókkal is elérhető, mint pl. mint például a Microsoft Academic Search). Az idézetelemzés kutatási módszerei közé tartoznak a kvalitatív, kvantitatív és számítási megközelítések. Az ilyen scientometriai vizsgálatok fő fókuszai a teljesítmény benchmarking, az intézményi kutatási rangsorok, a folyóiratok osztályozása [13] a teljesítménytényezők és a tulajdonosi standardok meghatározása tekintetében, [14] a legjobb tudományos közlemények hatásának értékelése, [15] egy tudomány pályájának nyomon követése, ill. technológiai ipar [16] , valamint a kutatási eredmények szempontjából vezető szerzők és intézmények profiljának kialakítása. [17]
A jogi hivatkozás-elemzés egy hivatkozáselemzési technika jogi dokumentumok elemzésére, amely megkönnyíti a kapcsolódó normatív dokumentumok megértését azáltal, hogy megvizsgálja azokat az idézeteket, amelyek egy rendelkezést ugyanabban a dokumentumban vagy különböző dokumentumok között kapcsolnak össze más rendelkezésekkel. A jogi hivatkozások elemzése egy szabályozási dokumentumból vett idézési grafikont használ, amely kiegészítheti az elektronikus felfedezést, amely folyamat befolyásolja a technológiai innovációt a big data elemzésében . [18] [19] [20] [21]
Egy 1965-ös közleményében Derek de Solla Price az SCI eredendő kötőképességét "tudományos közlemények hálózataként" írta le. Az idézetek és az idézett közlemények közötti kapcsolatok dinamikussá váltak, amikor az SCI elkezdte az online publikálást. A Social Science Citation Index volt az egyik első adatbázis, amelyet 1972-ben telepítettek a Dialog rendszerbe [22] . A CD-k megjelenésével a hivatkozások még egyszerűbbé váltak, lehetővé téve a bibliográfiai hivatkozások használatát a kapcsolódó rekordok megtalálásához. 1973-ban Henry Small publikálta klasszikus munkáját a co-citation elemzésről, amely önszerveződő osztályozási rendszerré vált, amely a dokumentumcsoportosítással kapcsolatos kísérletekhez, végül pedig a Tudomány Atlaszához vezetett, amely később Research Reviews lett.
Ralph Garner (Drexel Egyetem) 1965-ben írta le a tudományos irodalomban rejlő világméretű idézőháló topológiai és grafikus jellegét. [23]
A 19. század első felében bevett gyakorlat volt az idézettségi pontszámok használata rangsorolt folyóiratokban, de ezeknek a pontszámoknak a tudományos folyóiratoknál történő szisztematikus folyamatos mérését Eugene Garfield kezdeményezte a Tudományos Információs Intézetben, aki egyben az elsődleges forrás is lett. amiért ezeket a pontszámokat használja a szerzők és cikkek értékelésére. Egy mérföldkőnek számító 1965-ös tanulmányban ő és Irving Sher megmutatták a gyakoriság és az idézettség növekedése közötti kapcsolatot, bemutatva, hogy a Nobel-díjasok átlagosan ötször publikálták dolgozataikat, míg tanulmányaikat átlagosan 30-50 alkalommal idézték. Garfield a Nobel-díjról és más díjakról szóló esszéiben számolt be erről a jelenségről. A szokásos végeredményt befolyási aránynak nevezzük , a folyóiratban az előző két évben megjelent idézetek számát osztva az abban az években megjelent cikkek számával. Széles körben használják közönséges és speciális célokra is, különösen a szerzők és dokumentumok értékelésére való használata meglehetősen ellentmondásos .
Egy korai, 1964-es tanulmányban, amelyben a DNS -történet írásában az idézetelemzést alkalmazták, Garfield és Sher bemutatta a történetírás , a tudományos témák történetének főbb lépéseiről szóló topológiai térképek készítésének lehetőségét. Ezt a munkát később E. Garfield, A. I. Pudovkin, a Nemzeti Tudományos Akadémia Tengerbiológiai Intézetének munkatársa és V. S. Istomin, a Washingtoni Állami Egyetem Oktatási, Tanulási és Technológiai Központjának munkatársa automatizálta, és ez vezetett a Histcite szoftver létrehozásához . 24] 2002-ig.
Az automatikus hivatkozás-indexelést 1998-ban vezette be Lee Giles, Steve Lawrence és Kurt Bollacker, és lehetővé tette az idézetek automatikus algoritmikus törlését és csoportosítását bármely digitális tudományos és tudományos dokumentum esetében. Ahol a hivatkozások előzetes visszavonása manuális folyamat volt, az idézettségi arányok mostantól növelhetők és kiszámíthatók bármely akadémiai ágra vagy helyszínre, nem csak az olyan szervezetekre, mint az ISI. Ez a nyilvános és automatikus hivatkozások indexelésére szolgáló új rendszerek létrehozásához vezetett, amelyek közül az első a CiteSeer (ma CiteSeerX , amelyet hamarosan a Cora rendszer örökölt, amely elsősorban a számítástechnikára és a számítástechnikára összpontosított . Később a főbb akadémiai domain névrendszerek, mint pl. mint a Google Scholar és a Microsoft Academic Ezt az offline hivatkozás-indexelést még nem tökéletesítették az idézetek kinyerésében vagy az idézetek klaszterezésében a becslések szerint valahol 10% körüli hibaaránnyal, bár a gondos statisztikai mintavételezés még nem történt meg.Szerzők, mint Ann Arbor , Milton Keynes és Walton Hall hatalmas mennyiségű tanulmányi eredményt produkált.25 Az SCI azt állítja, hogy pusztán programozási módszerekkel hoz létre automatikus hivatkozás-indexelést. Még a régebbi bejegyzések is ugyanazzal a hibahatárral rendelkeznek.
A jogi dokumentumok hivatkozáselemzése egy olyan megközelítés, amely segít megérteni és elemezni a kapcsolódó normatív dokumentumokat azáltal, hogy megvizsgálja azokat az idézeteket, amelyek egy rendelkezést más rendelkezésekhez kapcsolnak egyazon dokumentumon belül és különböző dokumentumok között. Az idézetelemzés egy normatív dokumentumból származó idézési grafikont használ, amely kiegészítheti az elektronikus felfedezést, egy olyan folyamatot, amely előmozdítja a technológiai innovációt a big data elemzésében. [26]
Elektronikus kiadványok . Az elektronikus források elérhetőségének példátlan növekedése miatt az egyik égető kérdés, amelyet jelenleg vizsgálnak, a „milyen gyakran idéznek elektronikus forrásokat az interneten az én iparágamban?” kérdés. [27] Például azzal érveltek, hogy a számítástechnikai irodalom online elérése magasabb hivatkozási arányt eredményez, [28] azonban a humán cikkek károsodhatnak, ha nem léteznek nyomtatott formában.
Ön idéző . Sokat kritizálták azt a gyakorlatot, hogy a szerzők idézetek halmozásával, önmaguk túlzott idézésével „játszanak” a rendszerrel [29] . Ugyanakkor például azt találták, hogy a férfiak gyakrabban idézik magukat, mint a nők.