<?xml version="1.0" encoding="utf-8"?>
<Gradivo ID="21294" NadgradivoID="1903" NRID="25762774" OceID="0" DomainUrl="https://dirros.openscience.si/" IzpisPolniUrl="https://dirros.openscience.si/IzpisGradiva.php?lang=slv&amp;id=21294" StOgledov="713" StPrenosov="484" StOcen="0" VsotaOcen="0" DatumIzvoza="2026-04-29 23:09:16" OcenaSkupna="0" StPodgradiv="0" StudijskiProgramEvsID="" JeIndeksirano="0" JeVecAvtorjev="0" DovoliZahtevkeZaDostop="0">
  <PID Url="http://hdl.handle.net/20.500.12556/DiRROS-21294">20.500.12556/DiRROS-21294</PID>
  <Naslov>Korpus CVET 1.0</Naslov>
  <Podnaslov>Izdelava, opis in analiza zbirke starejših besedil v verski periodiki</Podnaslov>
  <TujJezik_Naslov>Corpus CVET 1.0: Creation, description and analysis of a collection of older texts in religious periodicals</TujJezik_Naslov>
  <TujJezik_Podnaslov></TujJezik_Podnaslov>
  <Opis>V prispevku je predstavljen proces izdelave in jezikoslovnega označevanja korpusa CVET 1.0, ki vsebuje besedila patra Hijacinta Repiča v starejšem slovenskem jeziku, objavljena v verskem glasilu Cvetje z vertov sv. Frančiškav obdobju 1881–1916. Besedila so bila v obliki PDF pridobljena s portala dLib, urejena v urejevalniku Word in nato pretvorjena v zapis TEI. Starejše besedje je bilo z odprtokodnim orodjem za normalizacijo avtomatsko posodobljeno, kar olajša iskanje po korpusu in nadaljnjo analizo gradiva. V članku so izpostavljene nekatere napake, ki so nastale pri posodabljanju in bodo v naslednji verziji korpusa ročno popravljene. Posodobljena besedila so bila nato še avtomatsko jezikoslovno označena z oblikoskladnjo in skladnjo po sistemu Universal Dependencies. Zapis TEI smo pretvorili v več izvedenih formatov in zbirko objavili pod odprto licenco na repozitoriju in konkordančnikih CLARIN.SI, ki so primerni za jezikoslovne analize gradiva. V drugem deluprispevkaje prikazan primer analize avtorjevega pripovednega stila, opravljene s konkordančnikom noSketch Engine, ki temelji na frekvenčnih spremenljivkah najpogostejših in najmanj pogostih besed terključnih besed</Opis>
  <TujJezik_Opis>The e paper presents the process of creation and linguistic tagging of the CVET 1.0 corpus, which contains the texts of Father Hijacint Repič in the older Slovenian language, published in the religious journal Cvetje z vertov sv.Frančiškain the period 1881–1916. The texts were obtained in PDF format from the dLib portal, edited in the Word editor and then converted to TEI. Older words were automatically updated using an open-source normalisation tool, which facilitates corpus search and further analysis of the material. The article points out some errors that occurred during normalisation,which will be corrected manually in the next version of the corpus(e.g. keterim&gt; ketim* &gt; katerim; kesneje&gt; kosno* &gt; kasneje; sobrat&gt; zbrat* &gt; sobrat). The updated texts were then automatically linguistically annotated,including morphosyntactic annotationsas well asmorphological and syntactic annotations according to the Universal Dependencies Formalism for Slovenian. We converted the TEI-encoded versions into various formats and published the collection under an open licence in the CLARIN.SI repository and concordancers suitable for linguistic analysis of the material. The second partof the paperpresentsan example of the analysis of the author&#039;s narrative styleperformed withnoSketchEngine, based on the frequency variables of the most and least frequent words and keywords</TujJezik_Opis>
  <KljucneBesede>
    <Beseda>starejša slovenščina</Beseda>
    <Beseda>verski tisk</Beseda>
    <Beseda>TEI</Beseda>
    <Beseda>normalizacija</Beseda>
    <Beseda>stilistična analiza</Beseda>
    <Beseda>leksika</Beseda>
  </KljucneBesede>
  <TujJezik_KljucneBesede>
    <Beseda>historical Slovenian language</Beseda>
    <Beseda>religious texts</Beseda>
    <Beseda>TEI</Beseda>
    <Beseda>normalisation</Beseda>
    <Beseda>stylistic analysis</Beseda>
    <Beseda>lexis</Beseda>
  </TujJezik_KljucneBesede>
  <Potrjeno>true</Potrjeno>
  <JeZaklenjeno>false</JeZaklenjeno>
  <JeRecenzirano>false</JeRecenzirano>
  <Zaloznik></Zaloznik>
  <Izvor></Izvor>
  <Jezik ID="1060" ISO639-3="slv">Slovenski jezik</Jezik>
  <TujJezik ID="1033" ISO639-3="eng">Angleški jezik</TujJezik>
  <Povezave></Povezave>
  <Pokrivanje></Pokrivanje>
  <CasovnoPokritje></CasovnoPokritje>
  <AvtorskePravice></AvtorskePravice>
  <VrstaGradiva ID="" DRIVER="info:eu-repo/semantics/other">Neznano</VrstaGradiva>
  <DatumVstavljanja>2025-01-23 13:01:59</DatumVstavljanja>
  <DatumObjave>2025-01-23 13:01:59</DatumObjave>
  <DatumSpremembe>2025-01-24 03:42:45</DatumSpremembe>
  <DatumTrajnegaHranjenja>0000-00-00 00:00:00</DatumTrajnegaHranjenja>
  <LetoIzida>2024</LetoIzida>
  <LetoIzidaDo>0</LetoIzidaDo>
  <KrajIzida></KrajIzida>
  <LetoIzvedbe>0</LetoIzvedbe>
  <KrajIzvedbe></KrajIzvedbe>
  <Opomba>Nasl. z nasl. zaslona;
Opis vira z dne 23. 12. 2024;
</Opomba>
  <StStrani>Str. 184-204</StStrani>
  <StevilcenjeNivo1></StevilcenjeNivo1>
  <StevilcenjeNivo2></StevilcenjeNivo2>
  <Kronologija></Kronologija>
  <Patent_Stevilka></Patent_Stevilka>
  <Patent_DatumVeljavnosti>0000-00-00</Patent_DatumVeljavnosti>
  <VerzijaDokumenta>Zaloznikova</VerzijaDokumenta>
  <StatusObjaveDrugje>NiDoloceno</StatusObjaveDrugje>
  <VrstaStroskaObjave>NiDoloceno</VrstaStroskaObjave>
  <DatumPoslanoVRecenzijo>0000-00-00</DatumPoslanoVRecenzijo>
  <DatumSprejetjaClanka>0000-00-00</DatumSprejetjaClanka>
  <DatumObjaveClanka>0000-00-00</DatumObjaveClanka>
  <Licence>
    <Licenca ID="5" Kratica="CC BY-SA 4.0" Naziv="Creative Commons Priznanje avtorstva-Deljenje pod enakimi pogoji 4.0 Mednarodna" URL="http://creativecommons.org/licenses/by-sa/4.0/deed.sl" Logo="by-sa.png" LogoPolniUrl="https://dirros.openscience.si/teme/dirros/img/licence/by-sa.png" DatumZacetkaLicenciranja="" VezanoNa="" VezanoNaAng="" Besedilo="" BesediloAng=""></Licenca>
  </Licence>
  <EmbargoDo></EmbargoDo>
  <VrstaEmbarga ID="1" Naziv="Takojšnja javna objava" OpenAIREDostop="openAccess"></VrstaEmbarga>
  <Osebe>
    <Oseba ID="13679" Ime="Diana" Priimek="Košir" AltIme="" VlogaID="70" VlogaNaziv="Avtor" ConorID="247947875" Afiliacija="" ArrsID="55915" ORCID="https://orcid.org/0009-0009-4428-9698"></Oseba>
    <Oseba ID="420" Ime="Tomaž" Priimek="Erjavec" AltIme="" VlogaID="70" VlogaNaziv="Avtor" ConorID="2355555" Afiliacija="" ArrsID="05023" ORCID=""></Oseba>
  </Osebe>
  <Identifikatorji>
    <Identifikator ID="4" Sifra="UDK" Naziv="UDK" URL="">81&#039;32</Identifikator>
    <Identifikator ID="3" Sifra="CobissID" Naziv="COBISS_ID" URL="https://plus.cobiss.net/cobiss/si/sl/bib/223670531">223670531</Identifikator>
    <Identifikator ID="13" Sifra="OceCobissID" Naziv="OceCobissID" URL="https://plus.cobiss.net/cobiss/si/sl/bib/211315971">211315971</Identifikator>
  </Identifikatorji>
  <Datoteke>
    <Datoteka ID="30252" DatotekaNRID="14089388" NamenDatotekeID="2" NamenDatoteke="Predstavitvena datoteka" FormatDatotekeID="2" FormatDatoteke=".pdf" MIME="application/pdf" IkonaFormata="pdf.gif" IkonaFormataPolniUrl="https://dirros.openscience.si/teme/dirros/img/fileTypes/pdf.gif" VelikostDatoteke="22744254" VelikostDatotekeKratko="21,69 MB" DatumVstavljanja="2025-01-23 13:03:37" JeZbrisana="false" JeJavnoVidna="true" JeIndeksirana="true" JeVidno="true" VidnoOd="01.01.1970" Zaporedje="0">
      <Naziv>25_01_23_Kosir_223670531.pdf</Naziv>
      <OrgNaziv>25_01_23_Kosir_223670531.pdf</OrgNaziv>
      <URL></URL>
      <Opis></Opis>
      <OpisTujJezik></OpisTujJezik>
      <UrlObdelave></UrlObdelave>
      <FrekvencaAzuriranjaID>1</FrekvencaAzuriranjaID>
      <Verzija></Verzija>
      <MD5>4F3B47542E4F6641935966099EF65AE2</MD5>
      <SHA256>e8b77585b4b349f9833115c4e9f84789d78ac71c5db6ac8daabda9afae7bc78b</SHA256>
      <UUID>13a3a9ff-d982-11ef-ba3f-001a4af901a5</UUID>
      <PID></PID>
      <PrenosPolniUrl>https://dirros.openscience.si/Dokument.php?lang=slv&amp;id=30252</PrenosPolniUrl>
      <Vsebine>
        <Vsebina TipVsebine="GoloBesedilo" JezikID="1060" Oznaka="" Dolzina="1534269"></Vsebina>
      </Vsebine>
    </Datoteka>
    <Datoteka ID="30251" DatotekaNRID="0" NamenDatotekeID="5" NamenDatoteke="Izvorni URL" FormatDatotekeID="56" FormatDatoteke="URL" MIME="text/url" IkonaFormata="html.gif" IkonaFormataPolniUrl="https://dirros.openscience.si/teme/dirros/img/fileTypes/html.gif" VelikostDatoteke="0" VelikostDatotekeKratko="0,00 KB" DatumVstavljanja="2025-01-23 13:02:01" JeZbrisana="false" JeJavnoVidna="true" JeIndeksirana="false" JeVidno="true" VidnoOd="01.01.1970" Zaporedje="1">
      <Naziv></Naziv>
      <OrgNaziv></OrgNaziv>
      <URL>https://zenodo.org/records/13912515</URL>
      <Opis></Opis>
      <OpisTujJezik></OpisTujJezik>
      <UrlObdelave></UrlObdelave>
      <FrekvencaAzuriranjaID>1</FrekvencaAzuriranjaID>
      <Verzija></Verzija>
      <MD5></MD5>
      <SHA256></SHA256>
      <UUID>daff0aa0-d981-11ef-ba3f-001a4af901a5</UUID>
      <PID></PID>
      <PrenosPolniUrl>https://dirros.openscience.si/Dokument.php?lang=slv&amp;id=30251</PrenosPolniUrl>
      <Vsebine>
      </Vsebine>
    </Datoteka>
  </Datoteke>
  <Organizacije>
    <Organizacija OrganizacijaID="37" Kratica="ZRS Koper" ZavodEvsID="3700370" Logo="zrs.png" LogoPolniUrl="https://dirros.openscience.si/teme/dirros/img/logo/zrs.png">Znanstveno-raziskovalno središče Koper / Centro di Ricerche Scientifiche Capodistria</Organizacija>
  </Organizacije>
  <OrganizacijeVira>
  </OrganizacijeVira>
  <MetodeZbiranjaPodatkov>
  </MetodeZbiranjaPodatkov>
  <TipologijaDela ID="1.08" Koda="1.08" Naziv="Objavljeni znanstveni prispevek na konferenci" SchemaOrg="Article"></TipologijaDela>
  <Ostalo>
    <StIrodsDatotek>0</StIrodsDatotek>
    <StDatotekPodTrajnimEmbargom>0</StDatotekPodTrajnimEmbargom>
    <StDatotekZOmejenimDostopom>0</StDatotekZOmejenimDostopom>
  </Ostalo>
</Gradivo>
