Korpusnaja lingvistika, častotnaja i tolkovaja leksikografija : vektory vzaimodejstvija

Mečkovskaja, Nina Borisovna

Izpis gradiva
A+ | A- | | SLO | ENG

Naslov:	Korpusnaja lingvistika, častotnaja i tolkovaja leksikografija : vektory vzaimodejstvija
Avtorji:	ID Mečkovskaja, Nina Borisovna (Avtor)
Datoteke:	URL - Izvorni URL, za dostop obiščite https://srl.si/ojs/srl/article/view/4171 PDF - Predstavitvena datoteka, prenos (339,32 KB) MD5: BB5DD10444649F99247F64B1B6272640
Jezik:	Ruski jezik
Tipologija:	1.01 - Izvirni znanstveni članek
Organizacija:	ZSSD - Zveza slovenskih slavističnih društev
Povzetek:	Pri obščem roste količestva korpusov, ih obʺemov i raznoobrazija proishodit specializacija korpusov v zavisimosti ot sostava ih targetirovannogo kontenta. Èlektronnye korpusy pervogo pokolenija (obʺemom primerno 100 mln slovoupotreblenij), nazyvaemye ili osoznavaemye kak “nacionalʹnye” ili “gosudarstvennye”, cohranjajut otnositelʹnuju sbalansirovannostʹ podkorpusov i širokuju socialʹno-gumanitarnuju adresaciju. Po mere uveličenija obʺemov bolee pozdnih korpusov proishodit ih specializacija po dvum vektoram: 1) soderžatelʹno orientirovannye monitornye (popolnjaemye) megakorpusy gazetno-žurnalʹnyh tekstov; v celevye gruppy korpusnogo kontenta dannogo klassa vhodjat sociologi i politologi, èkonomisty, demografy, žurnalisty i dr.; 2) tematičeski bezgraničnye (neizbiratelʹnye) korpusy, akkumulirujuščie ocifrovannye teksty (pečatnye i èlektronnye), ispolʹzuemye v informatike kak syrʹe dlja “obrabotki estestvnnogo jazyka” (natural language processing): mašinnogo predobučenija nejronnyh setej i sozdanija statističeskih algoritmov samosvjazyvaemosti slov v adekvatnye tekstovye reakcii iskusstvennogo intellekta. Nazvany dve naibolee značitelʹnye novatorskie razrabotki v korpusnoî leksikografii: 1) sintez tolkovogo i častotnogo slovareî v slovarjah Macmillan (2007), pozže Collins, Longman; 2) komponentnyj semantičeskij analiz 100-tysjačnogo slovnika s ispolʹzovaniem v kačestve semantičeskih komponentov 2.500 samyh častyh leksem v Macmillan 2007. Vozmožnosti korpusov v skorom vremeni privedut k krupnym dostiženijam v diahroničeskoj lingvistike.
Datum objave:	01.01.2025
Leto izida:	2025
Št. strani:	str. 435–449
Številčenje:	Letn. 73, št. 3
PID:	20.500.12556/DiRROS-27341
UDK:	81'322:81'374.2
ISSN pri članku:	0350-6894
DOI:	10.57589/srl.v73i3.4171
COBISS.SI-ID:	264140803
Opomba:	Lat. in cir.;
Datum objave v DiRROS:	03.02.2026
Število ogledov:	376
Število prenosov:	212
Metapodatki:
:	Kopiraj citat

Objavi na:

Postavite miškin kazalec na naslov za izpis povzetka. Klik na naslov izpiše podrobnosti ali sproži prenos.

Gradivo je del revije

Naslov:	Slavistična revija : časopis za jezikoslovje in literarne vede
Založnik:	Slavistično društvo Slovenije
ISSN:	0350-6894
COBISS.SI-ID:	761092

Sekundarni jezik

Jezik:	Angleški jezik
Naslov:	Corpus linguistics, frequency and explanatory dictionaries : interaction vectors
Povzetek:	With the overall growth in the number of corpora, their volumes and diversity, there is a specialization of corpora depending on their targeted content. Electronic corpora of the first generation (with a volume of approximately 100-million-word tokens), called or perceived as “national” or “state”, retain a relative balance of subcorpora and a broad social science and humanities audience. As the volumes of later corpora increase, there is a specialization of their purpose along two vectors: 1) content-oriented monitor (replenished) megacorpora of newspaper and magazine texts; the target groups of corpus content of this class include sociologists and political scientists, economists, demographers, journalists, etc. 2) thematically unlimited (non-selective) corpora accumulating digitalized texts (printed and electronic) used in computer science as raw material for “natural language processing” (machine pre-training 436 Slavistična revija, letnik 73/2025, št. 3, julij–september of neural networks) and creation of statistical algorithms for self-linking words into adequate verbal responses of artificial intelligence. Two most significant innovative developments in corpus lexicography are named: 1) synthesis of explanatory and frequency dictionaries in the Macmillan dictionaries (2007) and later Collins, Longman; 2) component semantic analysis of a 100,000-word dictionary using the 2,500 most frequent lexemes in Macmillan (2007) as semantic components
Ključne besede:	frekvenčni slovarji, sinteza razlagalnih in frekvenčnih slovarjev v slovarjih Macmillan (2007), komponentna pomenska analiza 100.000-besednega slovarja, visokofrekvenčne besede kot semantični multiplikatorji, frequency dictionaries, synthesis of explanatory and frequency dictionaries in the Macmillan dictionary (2007), semantic component analysis of a 100, 000-word dictionary, high-frequency words as semantic multipliers

Zbirka

To gradivo je del naslednjih zbirk del:

Slavistična revija

Nazaj

Izpis gradiva A+ | A- | | SLO | ENG

Gradivo je del revije

Sekundarni jezik

Zbirka

Izpis gradiva
A+ | A- | | SLO | ENG