A Scottish Corpus of Text and Speech ( Scottish Corpus of Text and Speech) a skót (germán) nyelv nemzeti korpusza , amelyet 2004 -ben hozott létre egy szakértői csoport: az angol nyelvi projekt és a School of Critical Stella projektjei. Tanulmányok a Glasgow-i Egyetemen .
Az elmúlt években jelentős változások mentek végbe Skócia politikai helyzetében. Az új politikai mozgalom felélesztette az érdeklődést a helyi nyelvek és kultúra iránt. Skóciában a nyelvi örökség fényes, elszigetelt a többiektől. A modern nyelvi helyzet itt nagyon gazdag, mert itt együtt él a skót, az angol, a gael és sok más nyelvi közösség. Az olyan kérdésekre azonban, mint a skót nyelv megőrzése, a skót angol jellegzetességei vagy a nem őshonos nyelvek, például a kínai vagy az urdu használata, nincs elegendő adat és egyértelmű válasz. Ez az információhiány pedig jelentős problémákat okoz azoknak, akik az oktatás területén dolgoznak, vagy egyszerűen csak érdeklődnek e kérdés iránt.
A modern technológiák nagyon nagy mennyiségű információ tárolását és elemzését tették lehetővé. A "The SCOTS" pedig az első nagyszabású projekt, amelyet kizárólag Skócia nyelveinek szenteltek. Írott és beszélt szövegek nagy elektronikus korpuszát biztosítja az ország nyelvein. A korpusz 2004 novembere óta létezik, rendszeres frissítések és kiegészítések után 2007 májusára az oldalon található szavak száma elérte a 4 milliót. A skóciai nyelvi sokszínűség iránt érdeklődők számára a THE SCOTOK minden kérdésükre választ adnak. A korpusznak lehetősége van arra, hogy Skócia nyelveit új módokon tárja fel, és áthidalja a tudásunkban jelenleg meglévő hiányosságokat.
Ami magát a tokot illeti, egy modern, rendkívül kényelmes, könnyen használható tok benyomását kelti, folyamatosan fejlődik és számos kérdésre választ tud adni. Így például, akinek bármiféle észrevétele van, az e-mailben elküldheti kívánságait az alkotóknak, ahol ők pedig megfontolhatják azokat és a megfelelő módosításokat elvégezhetik.
A skót korpusz jelenleg több mint 1100 írott és beszélt szöveget tartalmaz, összesen több mint 4 000 000 szót. 80%-a írott, 20%-a szóbeli szöveg, melyeket ortográfiai átírás formájában, a hang- vagy videóforrással szinkronban bocsátunk rendelkezésünkre.
A korpusz egyik funkciója, hogy lehetőség szerint teljes szövegeket jelenítsen meg, ami érezhetően népesebbé teszi a korpuszt. Bizonyos esetekben a szerzői jogi engedély miatt csak a szöveg egy része jeleníthető meg. A "A SKÓTOK"-ban a bemutatott információk 1945-től napjainkig terjedő forrásokból származnak. A SCOTS arra törekszik, hogy a szövegek széles skálája, a különböző nyelvű szövegek, műfajok és regiszterek méltányosságát érje el; műfaj, életkor, nem, szakmai és földrajzi jellemzők szerint a lehető legnagyobb mértékben mutassa be az előadókat vagy írókat.
Három különböző keresési módszer létezik. Azok a felhasználók, akiket érdekelnek a statisztikai információk, például egyes szavak relatív gyakorisága a különböző műfajokban, felhasználhatják a skót adatokat ebben az irányban. A kért információ mennyiségétől függően választhat gyors, normál vagy speciális keresési típust.
A Gyorskeresés a legegyszerűbb módja annak, hogy megtalálja az Önt érdeklő szó használati gyakoriságát különböző hangfájlokban és szöveges dokumentumokban. Ennek eredményeként megkapja a szó gyakoriságát és a használt fájlok formátumát.
A szabványos keresés lehetővé teszi néhány egyszerű keresési típus végrehajtását, valamint lehetővé teszi a korpusz összes dokumentumának megtekintését.
A részletes keresés a hagyományosnál szélesebb lehetőségeket kínál. Itt találhatók a fő statisztikai adatok, a konkordancia és a térképek, amelyeken az eredmények megjelennek. A bővített keresés keresési feltételekre van osztva, amelyek beállíthatók úgy, hogy korlátozzák a szavak keresését egy adott módú (szóbeli vagy írásbeli beszéd), műfajú (levelezés, szépirodalom, interjúk) vagy bizonyos kritériumrendszer (beszélgetések) szövegeiben. 2000 után szakmai tudományos cikkek stb.). Tovább). Így a különböző keresési lekérdezések eredményei konzisztensek lehetnek egymással.
Ha gyors vagy normál kereséssel keres, akkor egy két fő részből álló eredményoldalra kerül: a keresési eredmények összefoglalása és a dokumentumok listája.
A projektben a Glasgow-i Egyetemen kívül a következő szervezetek szakemberei vettek részt:
Jelenleg csak a korpuszkeresés ingyenes.
Korpusznyelvészet | |
---|---|
angol korpuszok |
|
Orosz nyelvű korpuszok |
|
Korpuszok más nyelveken |
|
Szervezetek |