<?xml version="1.0" encoding="utf-8"?>
<Gradivo ID="25065" NadgradivoID="2181" NRID="27994624" OceID="0" DomainUrl="https://dirros.openscience.si/" IzpisPolniUrl="https://dirros.openscience.si/IzpisGradiva.php?lang=slv&amp;id=25065" StOgledov="451" StPrenosov="199" StOcen="0" VsotaOcen="0" DatumIzvoza="2026-05-01 13:19:48" OcenaSkupna="0" StPodgradiv="0" StudijskiProgramEvsID="" JeIndeksirano="0" JeVecAvtorjev="0" DovoliZahtevkeZaDostop="0">
  <PID Url="http://hdl.handle.net/20.500.12556/DiRROS-25065">20.500.12556/DiRROS-25065</PID>
  <Naslov>Zasnova in oblikovanje Korpusa znanstvenih besedil sodobne slovenščine</Naslov>
  <Podnaslov></Podnaslov>
  <TujJezik_Naslov>Design and Construction of the Corpus of Scientific Texts of Contemporary Slovenian</TujJezik_Naslov>
  <TujJezik_Podnaslov></TujJezik_Podnaslov>
  <Opis>V prispevku predstavljamo Korpus znanstvenih besedil sodobne slovenščine, specializirani pisni korpus slovenščine, ki obsega 33.604.256 pojavnic iz 884 znanstvenih in strokovnih besedil zlasti s področij družboslovja in humanistike, nastalih predvsem med letoma 2000 in 2023. Osredotočamo se na prikaz besedilnotipske sestave korpusa, tehničnih postopkov predpriprave korpusnih besedil, korpusne anotacije, formatov zapisa korpusnih besedil in dostopnosti korpusa. Predstavljamo tudi motivacijo za izgradnjo korpusa in njegovo aplikativno vrednost, pri čemer skušamo opredeliti specifike in prednosti Korpusa znanstvenih besedil sodobne slovenščine glede na druge slovenske korpuse, ki vključujejo strokovna in znanstvena besedila.</Opis>
  <TujJezik_Opis>This paper presents the Corpus of Scientific Texts of Contemporary Slovenian, a specialized written corpus of Slovenian comprising 33,604,256 tokens from 884 scientific and expert texts, primarily in the fields of social sciences and the humanities, published mainly between 2000 and 2023. We focus on describing the text-type composition of the corpus, the technical procedures used in the preprocessing of corpus texts, corpus annotation, text encoding formats and corpus accessibility. We also discuss the rationale for constructing the corpus and its practical applications, aiming to outline the specific characteristics and advantages of the Corpus of Scientific Texts of Contemporary Slovenian in comparison with other Slovenian corpora that include specialized texts.</TujJezik_Opis>
  <KljucneBesede>
    <Beseda>korpus znanstvenih besedil</Beseda>
    <Beseda>specializirani korpus</Beseda>
    <Beseda>korpusno označevanje</Beseda>
    <Beseda>CoNNl-U</Beseda>
  </KljucneBesede>
  <TujJezik_KljucneBesede>
    <Beseda>corpus of scientific texts</Beseda>
    <Beseda>specialized corpus</Beseda>
    <Beseda>corpus annotation</Beseda>
    <Beseda>CoNNI-U</Beseda>
  </TujJezik_KljucneBesede>
  <Potrjeno>true</Potrjeno>
  <JeZaklenjeno>false</JeZaklenjeno>
  <JeRecenzirano>true</JeRecenzirano>
  <Zaloznik></Zaloznik>
  <Izvor></Izvor>
  <Jezik ID="1060" ISO639-3="slv">Slovenski jezik</Jezik>
  <TujJezik ID="1033" ISO639-3="eng">Angleški jezik</TujJezik>
  <Povezave></Povezave>
  <Pokrivanje></Pokrivanje>
  <CasovnoPokritje></CasovnoPokritje>
  <AvtorskePravice>Imetniki avtorskih pravic na prispevkih so avtorji</AvtorskePravice>
  <VrstaGradiva ID="dk_c" DRIVER="info:eu-repo/semantics/article">Članek v reviji</VrstaGradiva>
  <DatumVstavljanja>2026-01-08 17:29:56</DatumVstavljanja>
  <DatumObjave>2026-01-08 17:29:56</DatumObjave>
  <DatumSpremembe>2026-02-20 13:52:24</DatumSpremembe>
  <DatumTrajnegaHranjenja>0000-00-00 00:00:00</DatumTrajnegaHranjenja>
  <LetoIzida>2025</LetoIzida>
  <LetoIzidaDo>0</LetoIzidaDo>
  <KrajIzida></KrajIzida>
  <LetoIzvedbe>0</LetoIzvedbe>
  <KrajIzvedbe></KrajIzvedbe>
  <Opomba>Raziskovalni podatki, na katerih temelji objava, so dostopni na http://hdl.handle.net/11356/1872 in http://hdl.handle.net/11356/1774.</Opomba>
  <StStrani>str. 119-132</StStrani>
  <StevilcenjeNivo1>št. 2</StevilcenjeNivo1>
  <StevilcenjeNivo2>letn. 31</StevilcenjeNivo2>
  <Kronologija>2025</Kronologija>
  <Patent_Stevilka></Patent_Stevilka>
  <Patent_DatumVeljavnosti>0000-00-00</Patent_DatumVeljavnosti>
  <VerzijaDokumenta>Zaloznikova</VerzijaDokumenta>
  <StatusObjaveDrugje>Objavljeno</StatusObjaveDrugje>
  <VrstaStroskaObjave>NiDoloceno</VrstaStroskaObjave>
  <DatumPoslanoVRecenzijo>0000-00-00</DatumPoslanoVRecenzijo>
  <DatumSprejetjaClanka>0000-00-00</DatumSprejetjaClanka>
  <DatumObjaveClanka>2025-11-12</DatumObjaveClanka>
  <Licence>
    <Licenca ID="5" Kratica="CC BY-SA 4.0" Naziv="Creative Commons Priznanje avtorstva-Deljenje pod enakimi pogoji 4.0 Mednarodna" URL="http://creativecommons.org/licenses/by-sa/4.0/deed.sl" Logo="by-sa.png" LogoPolniUrl="https://dirros.openscience.si/teme/dirros/img/licence/by-sa.png" DatumZacetkaLicenciranja="2025-11-12" VezanoNa="VoR" VezanoNaAng="" Besedilo="" BesediloAng=""></Licenca>
  </Licence>
  <EmbargoDo></EmbargoDo>
  <VrstaEmbarga ID="1" Naziv="Takojšnja javna objava" OpenAIREDostop="openAccess"></VrstaEmbarga>
  <Osebe>
    <Oseba ID="4112" Ime="Nina" Priimek="Ledinek" AltIme="" VlogaID="70" VlogaNaziv="Avtor" ConorID="81520995" Afiliacija="" ArrsID="29395" ORCID="https://orcid.org/0000-0003-1068-3856"></Oseba>
    <Oseba ID="24356" Ime="Mitja" Priimek="Trojar" AltIme="" VlogaID="70" VlogaNaziv="Avtor" ConorID="182308451" Afiliacija="" ArrsID="35533" ORCID="https://orcid.org/0000-0003-3334-2413"></Oseba>
  </Osebe>
  <Identifikatorji>
    <Identifikator ID="4" Sifra="UDK" Naziv="UDK" URL="">811.163.6&#039;322.3</Identifikator>
    <Identifikator ID="9" Sifra="ISSN-clanka" Naziv="ISSN pri članku" URL="">0354-0448</Identifikator>
    <Identifikator ID="15" Sifra="DOI" Naziv="DOI" URL="http://dx.doi.org/10.3986/JZ.31.2.06">10.3986/JZ.31.2.06</Identifikator>
    <Identifikator ID="3" Sifra="CobissID" Naziv="COBISS_ID" URL="https://plus.cobiss.net/cobiss/si/sl/bib/262990339">262990339</Identifikator>
  </Identifikatorji>
  <Datoteke>
    <Datoteka ID="37680" DatotekaNRID="0" NamenDatotekeID="5" NamenDatoteke="Izvorni URL" FormatDatotekeID="56" FormatDatoteke="URL" MIME="text/url" IkonaFormata="html.gif" IkonaFormataPolniUrl="https://dirros.openscience.si/teme/dirros/img/fileTypes/html.gif" VelikostDatoteke="0" VelikostDatotekeKratko="0,00 KB" DatumVstavljanja="2026-01-08 20:19:28" JeZbrisana="false" JeJavnoVidna="true" JeIndeksirana="false" JeVidno="true" VidnoOd="01.01.1970" Zaporedje="0">
      <Naziv></Naziv>
      <OrgNaziv></OrgNaziv>
      <URL>https://ojs.zrc-sazu.si/jz/article/view/14633</URL>
      <Opis></Opis>
      <OpisTujJezik></OpisTujJezik>
      <UrlObdelave></UrlObdelave>
      <FrekvencaAzuriranjaID>0</FrekvencaAzuriranjaID>
      <Verzija></Verzija>
      <MD5></MD5>
      <SHA256></SHA256>
      <UUID>f38e82e3-ecc6-11f0-94a7-001a4af901a5</UUID>
      <PID></PID>
      <PrenosPolniUrl>https://dirros.openscience.si/Dokument.php?lang=slv&amp;id=37680</PrenosPolniUrl>
      <Vsebine>
      </Vsebine>
    </Datoteka>
    <Datoteka ID="37634" DatotekaNRID="14549387" NamenDatotekeID="2" NamenDatoteke="Predstavitvena datoteka" FormatDatotekeID="2" FormatDatoteke=".pdf" MIME="application/pdf" IkonaFormata="pdf.gif" IkonaFormataPolniUrl="https://dirros.openscience.si/teme/dirros/img/fileTypes/pdf.gif" VelikostDatoteke="1876828" VelikostDatotekeKratko="1,79 MB" DatumVstavljanja="2026-01-08 17:44:34" JeZbrisana="false" JeJavnoVidna="true" JeIndeksirana="true" JeVidno="true" VidnoOd="01.01.1970" Zaporedje="1">
      <Naziv>JZ+31.2_Ledinek_Trojar_splet.pdf</Naziv>
      <OrgNaziv>JZ+31.2_Ledinek_Trojar_splet.pdf</OrgNaziv>
      <URL></URL>
      <Opis></Opis>
      <OpisTujJezik></OpisTujJezik>
      <UrlObdelave></UrlObdelave>
      <FrekvencaAzuriranjaID>1</FrekvencaAzuriranjaID>
      <Verzija></Verzija>
      <MD5>7712723F03DF50B60440634B4F47B32B</MD5>
      <SHA256>806037c210205e113a5c470921e39d3a6dddd0a18cc824b248edbddd75aec372</SHA256>
      <UUID>50556016-ecb1-11f0-94a7-001a4af901a5</UUID>
      <PID></PID>
      <PrenosPolniUrl>https://dirros.openscience.si/Dokument.php?lang=slv&amp;id=37634</PrenosPolniUrl>
      <Vsebine>
        <Vsebina TipVsebine="GoloBesedilo" JezikID="1060" Oznaka="" Dolzina="40407"></Vsebina>
      </Vsebine>
    </Datoteka>
  </Datoteke>
  <Organizacije>
    <Organizacija OrganizacijaID="61" Kratica="ZRC SAZU" ZavodEvsID="" Logo="zrcsazu.png" LogoPolniUrl="https://dirros.openscience.si/teme/dirros/img/logo/zrcsazu.png">Znanstvenoraziskovalni center Slovenske akademije znanosti in umetnosti</Organizacija>
  </Organizacije>
  <OrganizacijeVira>
  </OrganizacijeVira>
  <MetodeZbiranjaPodatkov>
  </MetodeZbiranjaPodatkov>
  <TipologijaDela ID="1.01" Koda="1.01" Naziv="Izvirni znanstveni članek" SchemaOrg="Article"></TipologijaDela>
  <Podgradiva>
    <Potomci>
    </Potomci>
    <Starsi>
      <Gradivo ID="27395" NRID="28121415" Zaporedje="22" JeZaklenjeno="false" JePotrjeno="true">Jezikoslovni zapiski</Gradivo>
    </Starsi>
  </Podgradiva>
  <OpenAIRE>
    <OpenAIRE ProjektID="info:eu-repo/grantAgreement/ARIS//P6-0038-2015" Stevilka="P6-0038-2015" Naslov="Slovenski jezik v sinhronem in diahronem razvoju" Akronim="" Delez="0"></OpenAIRE>
    <OpenAIRE ProjektID="" Stevilka="" Naslov="eSSKJ in korpus – na poti k najsodobnejšim jezikovnim podatkom" Akronim="" Delez="0"></OpenAIRE>
  </OpenAIRE>
  <Ostalo>
    <StIrodsDatotek>0</StIrodsDatotek>
    <StDatotekPodTrajnimEmbargom>0</StDatotekPodTrajnimEmbargom>
    <StDatotekZOmejenimDostopom>0</StDatotekZOmejenimDostopom>
  </Ostalo>
</Gradivo>
