Korpus GOSP (Govorni korpus Ospa) je narečni korpus, ki ga je financiralo Ministrstvo za kulturo.
Metodološko ga je zasnovala Klara Šumenjak, ki je prispevala tudi narečna gradiva, za izdelavo spletnega vmesnika pa je poskrbel Jernej Vičič. Gradivo Besedilo je bilo pripravljeno z vnašalnim sistemom ZRCola (http://ZRCola.zrc-sazu.si), ki ga je na Znanstvenoraziskovalnem centru SAZU v Ljubljani (http://www.zrc-sazu.si) razvil dr. Peter Weiss.
Med junijem in avgustom so bile na terenu zbrane pripovedi, vključene v koprus. Korpus je bil zgrajen in označen v skladu z edinim obstoječim dialektološkim korpusom GOKO.
Zbrano besedilo je zapisano v dveh različicah, in sicer a) fonetični zapis, ki upošteva vse glasoslovne značilnosti govora Ospa – ta oblika je namenjena jezikoslovni, zlasti dialektološki analizi zapisanega govora. Fonetični zapis je »dogovorjen sistem znakov, ki zaznamuje kakovost in kolikost glasov, vključno z naglaševanjem (jakostnim/dinamičnim ali tonemskim)« (Smole, 150). Taka transkripcija je zelo zahtevna tudi za dialektologa, saj od njega zahteva veliko znanja, zbranosti in potrpljenja. »Je pa edini način, ki ohranja največ prvin, s katerimi je pripovedovalec oblikoval pripoved« (Ivančič Kutin, 61); b) poknjiženi zapis, kjer so besede (ne pa tudi besedne zveze in stavki) zapisane v slovenskem knjižnem jeziku – taka različica je nujna za iskanje po korpusu, saj bi bilo po fonetičnem zapisu nemogoče iskati, kajti v iskalnik ni mogoče vnesti diakelktoloških znakov, s katerimi se zapisuje govor. Posameznik ima možnost, da izbere, katera različica se mu prikaže.
Korpus je označen tudi z dodatnimi razlagalnimi transkripcijskimi in diskurznimi oznakami.
Razlagalne transkripcijske oznake
začetek narečnega izraza ali besedne zveze, konec narečnega izraza ali besedne zveze. Kriterij za uvrščanje leksemov med narečne je, da izraza ni med gesli v Slovarju slovenskega knjižnega jezika, če pa se tam nahaja, ne sme biti označen z nar., pog. ali imeti drugačnega pomena, kot ga ima v korpusovih besedilih. Oznaka ni vidna uporabnikom korpusa – tekst, označen z narečno, je vizualno ločen od ostalega dela besedila. Zapisan je v svetlo modri barvi, njegov pomen pa je zapisan v oblačku.
začetek lastnega imena, konec lastnega imena.
Med lastna imena so uvrščena osebna, zemljepisna in stvarna lastna imena. Oznaka ni vidna uporabnikom korpusa – tekst, označen z lastno ime, je vizualno ločen od ostalega dela besedila.
_ (podčrtaj) povezuje dve besedi v narečnem zapisu, ki sta v poknjiženi različici »prevedeni« v eno besedo. Število in zaporedje besed obeh oblikah mora namreč biti enako, ker računalnik avtomatsko prevaja iz ene obliko v drugo – podčrtaj tako omogoči računalniku, da dve besedi prepozna kot eno.
Primer fonetične transkripcije: ˈbəl_ˈvelik ...
Primer poknjižene različice: večji ...
Diskurzne oznake
<neraz/> nerazumljivo.
Pri zapisovanju govora ni vedno mogoče ugotoviti, kaj je govorec povedal, zato je na mestih, kjer kot zapisovalka nisem razumela, kaj je pripovedovalka povedala, zapisan <?>.
Uporabnik ima možnost izbrati, ali se mu ta oznaka v korpusu prikaže ali pa ne.
začetek nedokončane besede. Večina zapisovalcev se odloča, da mesta zarekov, to so mesta, kjer se pripovedovalec zmoti, pri prepisovanju izpusti (prim. Ivančič Kutin, 83). Sama menim, da je bolje te podatke zapisati in pomembno je, da jih ne enačimo s pojavom, ko je celotna beseda ali besedna zveza nerazumljena.
s polglasnikom in dolžino (əː) je označen znak obotavljanja. Uporabnik korpusa ima možnost, da izbere, če želi, da se mu ta del besedila prikaže v korpusu ali pa ne.
[ ] – v oglatem oklepaju so zapisane vse izjave in vsi neverbalni glasovi, ki jih je izrekla izpraševalka. Uporabnik ima možnost, da izbere, če želi, da se mu to besedilo prikaže v korpusu ali ne.
Osp (it. Ospo) je istrska vas, ki leži v Osapski dolini blizu slovensko-italijanske meje. Je med najstarejšimi slovenskimi vasmi, saj je bila prvič omenjena že v 11. stoletju. Po podatkih Statističnega urada Republike Slovenije (2002) živi v Ospu 166 ljudi (74 moških in 92 žensk). Osp je tudi eden najpomembnejših in najlepših plezalskih centrov v Evropi.
Govor Ospa uvrščamo v primorsko narečno skupino, med istrske govore, natančneje v rižansko podnarečje.
Literatura:
BURGER: http://www.burger.si/Osp/Osp.htm.
ENCIKLOPEDIJA SLOVENIJE (8. zvezek): Ljubljana : Mladinska knjiga, 1994, 94.
STATISTIČNI URAD REPUBLIKE SLOVENIJE (2012): http://www.stat.si/, 1. 11. 2013.
ŠUMENJAK, Klara, 2012: Zasnova dialektološkega korpusa na primeru govora Koprive na Krasu. Boža Krakar Vogel (ur.): Slavistika v regijah - Koper. Ljubljana: Zveza društev Slavistično društvo Slovenije: Znanstvena založba Filozofske fakultete. 73–78.
ŠUMENJAK, Klara, VIČIČ, Jernej, 2012: Izzivi pri izdelavi dialektološkega korpusa GOKO. Boža Krakar Vogel (ur.): Slavistika v regijah - Koper. Ljubljana: Zveza društev Slavistično društvo Slovenije: Znanstvena založba Filozofske fakultete. 79–87.
ŠUMENJAK, Klara, 2013: Opis govora Koprive na Krasu na osnovi dialektološkega korpusa. Doktorska disertacija. Koper: Univerza na Primorskem, Fakulteta za humanistične študije Koper https://share.upr.si/fhs/PUBLIC/doktorske/Sumenjak-Klara.pdf.
ŠUMENJAK, Klara, 2013: Priprava gradiva in standardizacija nivojev zapisa za
potrebe dialektološkega korpusa GOKO. Andreja Žele (ur.): Družbena funkcijskost jezika (vidiki, merila, opredelitve). Obdobja 32. Ljubljana: Center za
slovenščino kot drugi/tuji jezik pri Oddelku za slovenistiko Filozofske fakultete. 443–449 http://www.centerslo.net/files/file/simpozij/simp32/zbornik/Sumenjak.pdf.
WIKIPEDIJA: http://sl.wikipedia.org/wiki/Osp.