Digitalni repozitorij raziskovalnih organizacij Slovenije

Izpis gradiva
A+ | A- | Pomoč | SLO | ENG

Naslov:Korpusnaja lingvistika, častotnaja i tolkovaja leksikografija : vektory vzaimodejstvija
Avtorji:ID Mečkovskaja, Nina Borisovna (Avtor)
Datoteke:URL URL - Izvorni URL, za dostop obiščite https://srl.si/ojs/srl/article/view/4171
 
.pdf PDF - Predstavitvena datoteka, prenos (339,32 KB)
MD5: BB5DD10444649F99247F64B1B6272640
 
Jezik:Ruski jezik
Tipologija:1.01 - Izvirni znanstveni članek
Organizacija:Logo ZSSD - Zveza slovenskih slavističnih društev
Povzetek:Pri obščem roste količestva korpusov, ih obʺemov i raznoobrazija proishodit specializacija korpusov v zavisimosti ot sostava ih targetirovannogo kontenta. Èlektronnye korpusy pervogo pokolenija (obʺemom primerno 100 mln slovoupotreblenij), nazyvaemye ili osoznavaemye kak “nacionalʹnye” ili “gosudarstvennye”, cohranjajut otnositelʹnuju sbalansirovannostʹ podkorpusov i širokuju socialʹno-gumanitarnuju adresaciju. Po mere uveličenija obʺemov bolee pozdnih korpusov proishodit ih specializacija po dvum vektoram: 1) soderžatelʹno orientirovannye monitornye (popolnjaemye) megakorpusy gazetno-žurnalʹnyh tekstov; v celevye gruppy korpusnogo kontenta dannogo klassa vhodjat sociologi i politologi, èkonomisty, demografy, žurnalisty i dr.; 2) tematičeski bezgraničnye (neizbiratelʹnye) korpusy, akkumulirujuščie ocifrovannye teksty (pečatnye i èlektronnye), ispolʹzuemye v informatike kak syrʹe dlja “obrabotki estestvnnogo jazyka” (natural language processing): mašinnogo predobučenija nejronnyh setej i sozdanija statističeskih algoritmov samosvjazyvaemosti slov v adekvatnye tekstovye reakcii iskusstvennogo intellekta. Nazvany dve naibolee značitelʹnye novatorskie razrabotki v korpusnoî leksikografii: 1) sintez tolkovogo i častotnogo slovareî v slovarjah Macmillan (2007), pozže Collins, Longman; 2) komponentnyj semantičeskij analiz 100-tysjačnogo slovnika s ispolʹzovaniem v kačestve semantičeskih komponentov 2.500 samyh častyh leksem v Macmillan 2007. Vozmožnosti korpusov v skorom vremeni privedut k krupnym dostiženijam v diahroničeskoj lingvistike.
Datum objave:01.01.2025
Leto izida:2025
Št. strani:str. 435–449
Številčenje:Letn. 73, št. 3
PID:20.500.12556/DiRROS-27341 Novo okno
UDK:81'322:81'374.2
ISSN pri članku:0350-6894
DOI:10.57589/srl.v73i3.4171 Novo okno
COBISS.SI-ID:264140803 Novo okno
Opomba:Lat. in cir.;
Datum objave v DiRROS:03.02.2026
Število ogledov:139
Število prenosov:71
Metapodatki:XML DC-XML DC-RDF
:
Kopiraj citat
  
Objavi na:Bookmark and Share


Postavite miškin kazalec na naslov za izpis povzetka. Klik na naslov izpiše podrobnosti ali sproži prenos.

Gradivo je del revije

Naslov:Slavistična revija : časopis za jezikoslovje in literarne vede
Založnik:Slavistično društvo Slovenije
ISSN:0350-6894
COBISS.SI-ID:761092 Novo okno

Sekundarni jezik

Jezik:Angleški jezik
Naslov:Corpus linguistics, frequency and explanatory dictionaries : interaction vectors
Povzetek:With the overall growth in the number of corpora, their volumes and diversity, there is a specialization of corpora depending on their targeted content. Electronic corpora of the first generation (with a volume of approximately 100-million-word tokens), called or perceived as “national” or “state”, retain a relative balance of subcorpora and a broad social science and humanities audience. As the volumes of later corpora increase, there is a specialization of their purpose along two vectors: 1) content-oriented monitor (replenished) megacorpora of newspaper and magazine texts; the target groups of corpus content of this class include sociologists and political scientists, economists, demographers, journalists, etc. 2) thematically unlimited (non-selective) corpora accumulating digitalized texts (printed and electronic) used in computer science as raw material for “natural language processing” (machine pre-training 436 Slavistična revija, letnik 73/2025, št. 3, julij–september of neural networks) and creation of statistical algorithms for self-linking words into adequate verbal responses of artificial intelligence. Two most significant innovative developments in corpus lexicography are named: 1) synthesis of explanatory and frequency dictionaries in the Macmillan dictionaries (2007) and later Collins, Longman; 2) component semantic analysis of a 100,000-word dictionary using the 2,500 most frequent lexemes in Macmillan (2007) as semantic components
Ključne besede:frekvenčni slovarji, sinteza razlagalnih in frekvenčnih slovarjev v slovarjih Macmillan (2007), komponentna pomenska analiza 100.000-besednega slovarja, visokofrekvenčne besede kot semantični multiplikatorji, frequency dictionaries, synthesis of explanatory and frequency dictionaries in the Macmillan dictionary (2007), semantic component analysis of a 100, 000-word dictionary, high-frequency words as semantic multipliers


Zbirka

To gradivo je del naslednjih zbirk del:
  1. Slavistična revija

Nazaj