Digitalni repozitorij raziskovalnih organizacij Slovenije

Iskanje po repozitoriju
A+ | A- | Pomoč | SLO | ENG

Iskalni niz: išči po
išči po
išči po
išči po

Možnosti:
  Ponastavi


Iskalni niz: "ključne besede" (verski tisk) .

1 - 1 / 1
Na začetekNa prejšnjo stran1Na naslednjo stranNa konec
1.
Korpus CVET 1.0 : Izdelava, opis in analiza zbirke starejših besedil v verski periodiki
Diana Košir, Tomaž Erjavec, 2024, objavljeni znanstveni prispevek na konferenci

Povzetek: V prispevku je predstavljen proces izdelave in jezikoslovnega označevanja korpusa CVET 1.0, ki vsebuje besedila patra Hijacinta Repiča v starejšem slovenskem jeziku, objavljena v verskem glasilu Cvetje z vertov sv. Frančiškav obdobju 1881–1916. Besedila so bila v obliki PDF pridobljena s portala dLib, urejena v urejevalniku Word in nato pretvorjena v zapis TEI. Starejše besedje je bilo z odprtokodnim orodjem za normalizacijo avtomatsko posodobljeno, kar olajša iskanje po korpusu in nadaljnjo analizo gradiva. V članku so izpostavljene nekatere napake, ki so nastale pri posodabljanju in bodo v naslednji verziji korpusa ročno popravljene. Posodobljena besedila so bila nato še avtomatsko jezikoslovno označena z oblikoskladnjo in skladnjo po sistemu Universal Dependencies. Zapis TEI smo pretvorili v več izvedenih formatov in zbirko objavili pod odprto licenco na repozitoriju in konkordančnikih CLARIN.SI, ki so primerni za jezikoslovne analize gradiva. V drugem deluprispevkaje prikazan primer analize avtorjevega pripovednega stila, opravljene s konkordančnikom noSketch Engine, ki temelji na frekvenčnih spremenljivkah najpogostejših in najmanj pogostih besed terključnih besed
Ključne besede: starejša slovenščina, verski tisk, TEI, normalizacija, stilistična analiza, leksika
Objavljeno v DiRROS: 23.01.2025; Ogledov: 205; Prenosov: 134
.pdf Celotno besedilo (21,69 MB)
Gradivo ima več datotek! Več...

Iskanje izvedeno v 0.05 sek.
Na vrh