ŠOLAR

Solar_basic Če želite brskati po Šolarju na spletu v orodju Sketch Engine kliknite na sličico na levi ali na povezavo. Korpus lahko tudi prenesete in shranite.

KAJ JE ŠOLAR?

Korpusi so elektronske zbirke avtentičnih besedil, nastale po vnaprej določenih merilih in z določenim ciljem ter opremljena z orodji, ki omogočajo večplastno iskanje jezikovnih podatkov. Korpus šolskih pisnih izdelkov Šolar je korpus besedil, ki so jih učenci slovenskih osnovnih in srednjih šol samostojno tvorili pri pouku. Korpus je nastal v okviru projekta Sporazumevanje v slovenskem jeziku v letih 2009-2010, vsebuje pa skoraj milijon besed oz. natančno 967.477 besed. Gre za prvi tovrstni korpus besedil v Sloveniji, ki je narejen po vzoru korpusov usvajanja jezikov, vendar pa se od večine teh korpusov razlikuje v tem, da (a) besedila niso nastala na pobudo projekta, ampak predstavljajo dejansko šolsko produkcijo učencev in dijakov, (b) so jezikovni popravki, ki so označeni v korpusu, realni, naredili pa so jih učitelji in ne raziskovalci. Zaradi izrabe učiteljskih popravkov za namene označevanja jezikovnih napak učencev je korpus edinstven ne samo v slovenskem, ampak tudi v evropskem oziroma svetovnem merilu.

ZAKAJ SMO ZGRADILI KORPUS ŠOLAR?

Korpus Šolar je velika pridobitev za slovensko korpusno jezikoslovje, saj ponuja vpogled v pisanje šolajoče se mladine, torej populacije, katere jezikovna produkcija je bila doslej s korpusnim pristopom še neraziskana. To je deloma botrovalo pomanjkanju problemsko naravnanih jezikovnih priročnikov in učnih gradiv za osnovne in srednje šole, osnovanih na analizah dejanske jezikovne rabe. Korpus Šolar predstavlja velik korak k zapolnitvi tega manka, ne zgolj zaradi vanj vključenih besedil, temveč tudi zaradi zabeleženih učiteljskih popravkov, ki že predstavljajo delno analizo in posledično hiter vpogled v pisno produkcijo učencev, navsezadnje pa nudijo tudi vpogled v to, kaj učitelji popravljajo.

KOMU JE ŠOLAR NAMENJEN?

Šolar je bil narejen za namene raziskovanja pisne jezikovne zmožnosti šolajoče se populacije. S korpusno analizo bo mogoče detektirati jezikovne probleme in težave, ki jih imajo učenci pri pisanju, ter na tej osnovi pripraviti smiselne didaktične rešitve. Korpus seveda omogoča raziskovanje pisanja na različnih jezikovnih ravneh, analize pa – poleg oblikoskladenjskih oznak – olajšuje sistem označevanja učiteljskih popravkov, ki smo ga razvili posebej za ta korpus. Šolar je zato edinstveno orodje in gradivo hkrati, ki je namenjeno jezikoslovcem in učiteljem za raziskovanje jezikovne zmožnosti v času šolanja ter pripravo učnih vsebin in gradiv.

KATERA BESEDILA VSEBUJE ŠOLAR?

Šolar vsebuje 2.703 pisnih besedil srednješolcev in učencev zadnjega triletja osnovnih šol, nekaj pa je tudi besedil učencev 6. razreda osnovne šole. Največji delež besedil predstavljajo eseji oziroma spisi (64,2 %), v korpusu pa najdemo še pisne izdelke, nastale pri učni uri, kot so obnove, opisi, prošnje ipd. (18 %) in teste, ki smo jih razdelili v dve skupini: odgovori na vprašanja (16,1 %) predstavljajo klasične teste z vprašanji in (esejskimi) odgovori, ki so nastali pri različnih predmetih, v skupino daljše besedilo (1,7 %) pa sodijo različna praktična besedila (prošnje, zahvale …), ki so jih učenci morali napisati v okviru daljšega testa iz slovenščine.

Šola

Število besedil

Delež

osnovna šola

505

18,7 %

gimnazija

1.172

43,3 %

strokovno izobraževanje

843

31,2 %

poklicno izobraževanje

183

6,8 %

Tabela: Delež besedil po šolah

Slika: Delež besed po razredu/letniku

UČITELJSKI POPRAVKI V KORPUSU ŠOLAR

Velik delež besedil, ki smo jih prejeli, je vseboval učiteljske popravke. Ti so bili narejeni za namene ocenjevanja ali pa so služili le kot povratna informacija učencem o jezikovni, besedilni in tudi vsebinski ustreznosti njihovih besedil. Učiteljski popravki tako po eni strani predstavljajo neke vrste analizo jezikovnih problemov učencev, po drugi pa nudijo vpogled v to, kaj in do kakšne mere učitelji v pisanju učencev vidijo kot problematično. Ker tako dragocene informacije nismo hoteli izgubiti, smo se odločili popravke zabeležiti, in to na način, ki omogoča enostavno iskanje tovrstnih Informacij v korpusu. Za ta namen je bil izdelan sistem metajezikovnih oznak in oblikovana načela označevanja učiteljskih popravkov. Za ilustracijo, kako je potekala transkripcija, prilagamo sliko dela besedila v rokopisu in njegovo transkripcijo s primeri oznak za učiteljev popravek napake, besedilni in likovni komentar.

drugim pa nastavijo zanke, <u tip="B">za<p>v</p></u> katere se ni težko uloviti. Ženske je Linhart predstavil kot ljudi, ki imajo glavo na pravem mestu in jih v pravi meri vodita enkrat razum, drugič srce. Ženske tudi pomagajo <u k="Konkretno!" l="obkroženo">nekaterim</u> moškim likom, da se <u tip="Z" podtip="SN">nebi<p>ne bi</p></u> ne bi preveč zapletli ali si škodili.

LICENCA IN PRENOS

Lastnik korpusa Šolar je Ministrstvo za izobraževanje, znanost in šport Republike Slovenije. Pogodba med Ministrstvom in izvajalci projekta določa, da se za prenos baz podatkov na tretje osebe in označevanje avtorskih del uporabi licenca »priznanje avtorstva« + »nekomercialno« + »deljenje pod istimi pogoji«, ki dovoli uporabnikom avtorsko delo in njegove predelave reproducirati, distribuirati, dajati v najem, priobčiti javnosti in predelovati samo pod pogojem, da navedejo avtorja, da ne gre za komercialno uporabo in da tudi oni naprej širijo izvirna dela ali predelave pod istimi pogoji.

Creative Commons licenca
To delo je ponujeno pod licenco Creative Commons Priznanje avtorstva-Nekomercialno-Deljenje pod enakimi pogoji 2.5 Slovenija

Korpus Šolar je dostopen v repozitoriju CLARIN.SI: http://hdl.handle.net/11356/1036.

KORPUS ŠOLAR KOT PODATKOVNA ZBIRKA

Avtorji: Tadeja Rozman, Mojca Stritar, Iztok Kosem, Simon Krek, Irena Krapš Vodopivec, Špela Arhar Holdt, Marko Stabej

KONKORDANČNIK ZA KORPUS ŠOLAR (projekt Finalizacija korpusa Šolar)

Avtorji: Iztok Kosem, Špela Arhar Holdt, Vojtech Kovar, Vit Baisa, Adam Kilgarriff

SODELAVCI (po nalogah)

Zasnova projekta: Simon Krek, Marko Stabej, Tadeja Rozman, Špela Arhar, Irena Krapš Vodopivec
Zbiranje besedil: Tadeja Rozman in učitelji:

Vanja Benko (OŠ Prežihovega Voranca, Ravne na Koroškem)
Barbara Bolarič (Gimnazija Šentvid)
Tatjana Dorman (Srednja šola za gostinstvo in turizem Maribor)
Katja Dragar in David Puc (Škofijska klasična gimnazija Ljubljana)
Andreja Dvornik in Tatjana Rupnik Hladnik (OŠ Poljane Ljubljana)
Nataša Felc in Vanda Trošt (OŠ Spodnja Idrija)
Janja Florjančič, Valentina Madjar Sitar, Katja Jović in Nada Fortuna Makar (Srednja zdravstvena in kemijska šola Novo mesto – Šolski center NM)
Vesna Gubenšek Bezgovšek (Srednja ekonomska šola Celje)
Polona Gujtman Maučec (OŠ II Murska Sobota)
Terezija Gujtman (OŠ III Murska Sobota)
Mojca Hafner in Mija Injac Ožbolt (Srednja ekonomska šola Ljubljana)
Tatjana Hafner (OŠ Sava Kladnika Sevnica)
Irena Hočevar, Tanja Luštek in Marinka Cerinšek (OŠ Frana Metelka Škocjan)
Ksenija Horvat (Srednja šola za farmacijo, kozmetiko in zdravstvo Ljubljana)
Irena Humar Kobal in Petra Gabriel (OŠ Dornberk)
Silva Kastelic, Katja Peršič in Lidija Jesenovec (Srednja zdravstvena šola Ljubljana)
Marjana Klemenčič Glavica, Darja Mlakar in Peter Prhavc (Gimnazija Ledina)
Petra Knapič (OŠ Jurija Vege Moravče)
Romana Kokošar (Gimnazija Jurija Vege Idrija)
Katja Koren Valenčič (Srednja šola Postojna – Šolski center Postojna)
Sanja Kostanjšek, Gordana Stepanovska, Jožica Jožef Beg, Tina Cvijanović, Magdalena Udovč, Barbara Grabnar Kregulj in Zlata Kocjan (Srednja elektro šola in tehniška gimnazija – Šolski center NM)
Nataša Kralj (Srednja elektro-računalniška šola Maribor)
Irena Krapš Vodopivec, Tatjana Božič in Bojana Kompara (Škofijska gimnazija Vipava)
Bernarda Kričej (Srednja šola Zagorje)
Jelka Kvartič (Gimnazija Velenje)
Katja Lasbaher (Srednja šola za elektrotehniko in računalništvo Ljubljana)
Mateja Medvešek Rjavec (Osnovna šola Milke Šobar Nataše, Črnomelj)
Andreja Mlakar in Erika Koren-Plahuta (OŠ Antona Globočnika Postojna)
Mojca Osvald (Gimnazija Bežigrad)
Katja Pobega (Pomorski in tehniški izobraževalni center Portorož)
Duška Safran (Srednja šola za gostinstvo in turizem Celje)
Suzana Skočaj Kavčič (Osnovna šola dr. Bogomirja Magajne Divača)
Mitja Spreizer (OŠ Križe)
Maja Sušin (Osnovna šola Trebnje)
Jožica Šalehar (OŠ Šentjernej)
Jana Škoda, Mateja Traven, Alenka Vene in Simona Karl (Šolski center Krško – Sevnica)
Nuša Šorn (Gimnazija Šiška)
Marija Velkovrh Petrič in Meta Rogelj (OŠ Livada Ljubljana)

Avtorji sistema označevanja: Tadeja Rozman, Mojca Stritar, Simon Krek, Irena Krapš Vodopivec, Iztok Kosem
Kodiranje besedil: Tadeja Rozman, Matic Korošec
Transkribiranje: Marjeta Burja, Maja Dichlberger, Ana Fonda, Andreja Jankovič, Karmen Jordan, Alenka Laharnar, Melita Perkovič, Tomaž Potočnik, Eva Radič, Maja Rajh, Nina Stankovič, Simon Šuster, Andrej Tomažin, Martin Uranič, Barbara Vojsk, Urška Vranjek, Matic Korošec, Tadeja Rozman, Irena Krapš Vodopivec
Pregledovanje transkripcij: Mojca Stritar, Melita Perkovič, Eva Radič, Matic Korošec, Tadeja Rozman
Konverzija v XML format: Iztok Kosem, Mihael Arčan
Validacija: Iztok Kosem, Karmen Kosem, Miro Romih
Oblikoskladenjsko označevanje: Peter Holozan, Miro Romih

BIBLIOGRAFIJA

Članki, monografije

Tadeja Rozman, Mojca Stritar in Iztok Kosem (2012): Šolar – korpus šolskih pisnih izdelkov. V: T. Rozman, I. Krapš Vodopivec, M. Stritar, I. Kosem: Empirični pogled na pouk slovenskega jezika. Ljubljana: Trojina, zavod za uporabno slovenistiko.

Iztok Kosem, Tadeja Rozman in Mojca Stritar (2011): How do Slovenian primary and secondary school students write and what their teachers correct: a corpus of student writing. V: Proceedings of The Corpus Linguistics Conference 2011 (Birmingham, 20-22 July 2011). Birmingham: University of Birmingham.

Iztok Kosem, Sara Može (2011): Rešitve slovničnih zagat na dosegu miške: analiza napak v besedilih učencev in dijakov za potrebe elektronskega slovničnega vira. V: S. Krajnc (ur.) Meddisciplinarnost v slovenistiki, (Obdobja, Simpozij, = Symposium, 30). Ljubljana: Znanstvena založba Filozofske fakultete, str. 249-257.

Videolectures

Tadeja Rozman (2011): Šola(r) in slovnica. VideoLectures.net, 4. feb. 2011.