Digitalni repozitorij raziskovalnih organizacij Slovenije

Iskanje po repozitoriju
A+ | A- | Pomoč | SLO | ENG

Iskalni niz: išči po
išči po
išči po
išči po

Možnosti:
  Ponastavi


Iskalni niz: "avtor" (Erjavec Tomaž) .

1 - 4 / 4
Na začetekNa prejšnjo stran1Na naslednjo stranNa konec
1.
2.
Korpus CVET 1.0 : Izdelava, opis in analiza zbirke starejših besedil v verski periodiki
Diana Košir, Tomaž Erjavec, 2024, objavljeni znanstveni prispevek na konferenci

Povzetek: V prispevku je predstavljen proces izdelave in jezikoslovnega označevanja korpusa CVET 1.0, ki vsebuje besedila patra Hijacinta Repiča v starejšem slovenskem jeziku, objavljena v verskem glasilu Cvetje z vertov sv. Frančiškav obdobju 1881–1916. Besedila so bila v obliki PDF pridobljena s portala dLib, urejena v urejevalniku Word in nato pretvorjena v zapis TEI. Starejše besedje je bilo z odprtokodnim orodjem za normalizacijo avtomatsko posodobljeno, kar olajša iskanje po korpusu in nadaljnjo analizo gradiva. V članku so izpostavljene nekatere napake, ki so nastale pri posodabljanju in bodo v naslednji verziji korpusa ročno popravljene. Posodobljena besedila so bila nato še avtomatsko jezikoslovno označena z oblikoskladnjo in skladnjo po sistemu Universal Dependencies. Zapis TEI smo pretvorili v več izvedenih formatov in zbirko objavili pod odprto licenco na repozitoriju in konkordančnikih CLARIN.SI, ki so primerni za jezikoslovne analize gradiva. V drugem deluprispevkaje prikazan primer analize avtorjevega pripovednega stila, opravljene s konkordančnikom noSketch Engine, ki temelji na frekvenčnih spremenljivkah najpogostejših in najmanj pogostih besed terključnih besed
Ključne besede: starejša slovenščina, verski tisk, TEI, normalizacija, stilistična analiza, leksika
Objavljeno v DiRROS: 23.01.2025; Ogledov: 169; Prenosov: 98
.pdf Celotno besedilo (21,69 MB)
Gradivo ima več datotek! Več...

3.
Kaj sta korpusa ccGigafida in cc Kres? : proste zbirke
Nataša Logar, Tomaž Erjavec, Simon Krek, Miha Grčar, Peter Holozan, 2012, zaključena znanstvena zbirka raziskovalnih podatkov

Ključne besede: slovenska besedila, pisno sporazumevanje, korpusi (jezikoslovje)
Objavljeno v DiRROS: 08.01.2016; Ogledov: 6160; Prenosov: 1174
URL Povezava na celotno besedilo

4.
KRES
Nataša Logar, Simon Krek, Tomaž Erjavec, Miha Grčar, Peter Holozan, zaključena znanstvena zbirka raziskovalnih podatkov

Ključne besede: slovenska besedila, korpusi (jezikoslovje)
Objavljeno v DiRROS: 08.01.2016; Ogledov: 5916; Prenosov: 1192
URL Povezava na celotno besedilo

Iskanje izvedeno v 0.14 sek.
Na vrh