| Naslov: | Predobdelava podatkov za zagotavljanje varnosti in zasebnosti pri uporabi velikih jezikovnih modelov v gradbeništvu |
|---|
| Avtorji: | ID Brelih, Anja (Avtor) ID Srdič, Aleksander (Avtor) ID Dujc, Jaka (Avtor) ID Klinc, Robert (Avtor) |
| Datoteke: | PDF - Predstavitvena datoteka, prenos (1,08 MB) MD5: F589CAA19550C104819031603397FC61
URL - Izvorni URL, za dostop obiščite https://www.zveza-dgits.si/gradbeni-vestnik-dec-2025/
|
|---|
| Jezik: | Slovenski jezik |
|---|
| Tipologija: | 1.01 - Izvirni znanstveni članek |
|---|
| Organizacija: | ZDGITS - Zveza društev gradbenih inženirjev in tehnikov Slovenije
|
|---|
| Povzetek: | Prispevek predstavlja izzive zagotavljanja varstva podatkov pri uporabi velikih jezikovnih modelov (VJM) v delovnih tokovih operativnega gradbeništva. Analizira, kako uspešno obstoječa orodja za prepoznavanje imenskih entitet (angl. Named Entity Recognition, NER) zaznajo in anonimizirajo občutljive informacije v tehničnih gradbenih dokumentih, zlasti v slovenskem jeziku. Opravljena je bila kvalitativna evalvacija štirih ogrodij za obdelavo naravnega jezika (SpaCy, SpaCy SLO, Flair, NLTK), ki so bile preizkušene na vzorcu petih dejanskih gradbenih dokumentov in primerjane z ročno anotiranimi referenčnimi podatki. V evalvacijo je bila vključena tudi anonimizacija z VJM, ki je občutljive podatke zakrival z uporabo regularnih izrazov. Rezultati kažejo, da je osnovna anonimizacija sicer mogoča, vendar vsa klasična ogrodja NER slabše prepoznavajo entitete specifične za področje, kot so projektne šifre, inženirski nazivi ter strukturirani šte vilčni podatki. Ugotovitve kažejo na potrebe po prilagojenih orodjih za predobdelavo, saj netočna anonimizacija predstavlja pravna in etična tveganja pri vključevanju VJM v regulirane panoge, kot je gradbeništvo. Prihodnje raziskave se morajo osredotočiti na gradnjo hibridnih anonimizacijskih tokov in učenje modelov na anotiranih podatkih, da bi izboljšali natančnost in skladnost v tehničnih panogah. |
|---|
| Ključne besede: | veliki jezikovni modeli, zasebnost podatkov, prepoznavanje imenskih entitet, operativno gradbeništvo, predobdelava dokumentov |
|---|
| Status publikacije: | Objavljeno |
|---|
| Verzija publikacije: | Objavljena publikacija |
|---|
| Leto izida: | 2025 |
|---|
| Št. strani: | str. 210-219 |
|---|
| Številčenje: | Letn. 74 |
|---|
| PID: | 20.500.12556/DiRROS-27357  |
|---|
| UDK: | 004.434:004.8:624 |
|---|
| ISSN pri članku: | 0017-2774 |
|---|
| COBISS.SI-ID: | 262447363  |
|---|
| Datum objave v DiRROS: | 03.02.2026 |
|---|
| Število ogledov: | 97 |
|---|
| Število prenosov: | 68 |
|---|
| Metapodatki: |  |
|---|
|
:
|
Kopiraj citat |
|---|
| | | | Objavi na: |  |
|---|
Postavite miškin kazalec na naslov za izpis povzetka. Klik na naslov izpiše
podrobnosti ali sproži prenos. |