Digitalni repozitorij raziskovalnih organizacij Slovenije

Izpis gradiva
A+ | A- | Pomoč | SLO | ENG

Naslov:Zasnova in oblikovanje Korpusa znanstvenih besedil sodobne slovenščine
Avtorji:ID Ledinek, Nina (Avtor)
ID Trojar, Mitja (Avtor)
Datoteke:URL URL - Izvorni URL, za dostop obiščite https://ojs.zrc-sazu.si/jz/article/view/14633
 
.pdf PDF - Predstavitvena datoteka, prenos (1,79 MB)
MD5: 7712723F03DF50B60440634B4F47B32B
 
Jezik:Slovenski jezik
Tipologija:1.01 - Izvirni znanstveni članek
Organizacija:Logo ZRC SAZU - Znanstvenoraziskovalni center Slovenske akademije znanosti in umetnosti
Povzetek:V prispevku predstavljamo Korpus znanstvenih besedil sodobne slovenščine, specializirani pisni korpus slovenščine, ki obsega 33.604.256 pojavnic iz 884 znanstvenih in strokovnih besedil zlasti s področij družboslovja in humanistike, nastalih predvsem med letoma 2000 in 2023. Osredotočamo se na prikaz besedilnotipske sestave korpusa, tehničnih postopkov predpriprave korpusnih besedil, korpusne anotacije, formatov zapisa korpusnih besedil in dostopnosti korpusa. Predstavljamo tudi motivacijo za izgradnjo korpusa in njegovo aplikativno vrednost, pri čemer skušamo opredeliti specifike in prednosti Korpusa znanstvenih besedil sodobne slovenščine glede na druge slovenske korpuse, ki vključujejo strokovna in znanstvena besedila.
Ključne besede:korpus znanstvenih besedil, specializirani korpus, korpusno označevanje, CoNNl-U
Status publikacije:Objavljeno
Verzija publikacije:Objavljena publikacija
Datum objave:12.11.2025
Leto izida:2025
Št. strani:str. 119-132
Številčenje:letn. 31, št. 2
PID:20.500.12556/DiRROS-25065 Novo okno
UDK:811.163.6'322.3
ISSN pri članku:0354-0448
DOI:10.3986/JZ.31.2.06 Novo okno
COBISS.SI-ID:262990339 Novo okno
Avtorske pravice:Imetniki avtorskih pravic na prispevkih so avtorji
Datum objave v DiRROS:08.01.2026
Število ogledov:146
Število prenosov:55
Metapodatki:XML DC-XML DC-RDF
:
Kopiraj citat
  
Objavi na:Bookmark and Share


Postavite miškin kazalec na naslov za izpis povzetka. Klik na naslov izpiše podrobnosti ali sproži prenos.

Gradivo je del revije

Naslov:Jezikoslovni zapiski : zbornik Inštituta za slovenski jezik Frana Ramovša
Skrajšan naslov:Jezikosl. zap.
Založnik:Inštitut za slovenski jezik Frana Ramovša ZRC SAZU
ISSN:0354-0448
COBISS.SI-ID:27991296 Novo okno

Gradivo je financirano iz projekta

Financer:ARIS - Javna agencija za znanstvenoraziskovalno in inovacijsko dejavnost Republike Slovenije
Številka projekta:P6-0038-2015
Naslov:Slovenski jezik v sinhronem in diahronem razvoju

Financer:Drugi - Drug financer ali več financerjev
Program financ.:Ministrstvo za kulturo Republike Slovenije
Številka projekta:U9
Naslov:eSSKJ in korpus – na poti k najsodobnejšim jezikovnim podatkom

Licence

Licenca:CC BY-SA 4.0, Creative Commons Priznanje avtorstva-Deljenje pod enakimi pogoji 4.0 Mednarodna
Povezava:http://creativecommons.org/licenses/by-sa/4.0/deed.sl
Opis:Ta licenca Creative Commons je zelo podobna običajni licenci Priznanje avtorstva, vendar zahteva, da so materialne avtorske pravice na izpeljanih delih upravljane z enako licenco.

Sekundarni jezik

Jezik:Angleški jezik
Naslov:Design and Construction of the Corpus of Scientific Texts of Contemporary Slovenian
Povzetek:This paper presents the Corpus of Scientific Texts of Contemporary Slovenian, a specialized written corpus of Slovenian comprising 33,604,256 tokens from 884 scientific and expert texts, primarily in the fields of social sciences and the humanities, published mainly between 2000 and 2023. We focus on describing the text-type composition of the corpus, the technical procedures used in the preprocessing of corpus texts, corpus annotation, text encoding formats and corpus accessibility. We also discuss the rationale for constructing the corpus and its practical applications, aiming to outline the specific characteristics and advantages of the Corpus of Scientific Texts of Contemporary Slovenian in comparison with other Slovenian corpora that include specialized texts.
Ključne besede:corpus of scientific texts, specialized corpus, corpus annotation, CoNNI-U


Nazaj