<?xml version="1.0" encoding="utf-8"?>
<Gradivo ID="28309" NadgradivoID="2019" NRID="28286570" OceID="0" DomainUrl="https://dirros.openscience.si/" IzpisPolniUrl="https://dirros.openscience.si/IzpisGradiva.php?lang=slv&amp;id=28309" StOgledov="209" StPrenosov="218" StOcen="0" VsotaOcen="0" DatumIzvoza="2026-05-01 07:54:17" OcenaSkupna="0" StPodgradiv="0" StudijskiProgramEvsID="" JeIndeksirano="0" JeVecAvtorjev="0" DovoliZahtevkeZaDostop="0">
  <PID Url="http://hdl.handle.net/20.500.12556/DiRROS-28309">20.500.12556/DiRROS-28309</PID>
  <Naslov>FuDoBa</Naslov>
  <Podnaslov>fusing document and knowledge graph based representations with Bayesian optimisation</Podnaslov>
  <TujJezik_Naslov>FuDoBa: fusing document and knowledge graph based representations with Bayesian optimisation</TujJezik_Naslov>
  <TujJezik_Podnaslov></TujJezik_Podnaslov>
  <Opis>Building on the success of large language models (LLMs), LLM-based representations have dominated the document representation landscape, achieving strong performance on document embedding benchmarks. However, high-dimensional, computationally expensive LLM embeddings can be too generic or inefficient for domain-specific and resource-scarce applications. To address these limitations, we introduce FuDoBa—a Bayesian optimisation-based representation learning method that integrates LLM embeddings with domain-specific structured knowledge, sourced both locally and from external repositories such as WikiData. This fusion produces low-dimensional, task-relevant representations while reducing training complexity and yielding interpretable early-fusion weights for improved classification performance. We demonstrate the effectiveness of our approach on six datasets across two domains, showing that when paired with robust AutoML-based classifiers, our method performs on par with, or surpasses, proprietary LLM-only embedding baselines, while offering modality-wise interpretability and a smaller dimensional footprint.</Opis>
  <TujJezik_Opis></TujJezik_Opis>
  <KljucneBesede>
    <Beseda>document classification</Beseda>
    <Beseda>Bayesian optimisation</Beseda>
    <Beseda>representation learning</Beseda>
    <Beseda>knowledge graphs</Beseda>
  </KljucneBesede>
  <TujJezik_KljucneBesede>
    <Beseda>razvrščanje dokumentov</Beseda>
    <Beseda>optimizacija</Beseda>
    <Beseda>grafi znanja</Beseda>
  </TujJezik_KljucneBesede>
  <Potrjeno>true</Potrjeno>
  <JeZaklenjeno>false</JeZaklenjeno>
  <JeRecenzirano>true</JeRecenzirano>
  <Zaloznik>Springer Nature</Zaloznik>
  <Izvor>Švica</Izvor>
  <Jezik ID="1033" ISO639-3="eng">Angleški jezik</Jezik>
  <TujJezik ID="1060" ISO639-3="slv">Slovenski jezik</TujJezik>
  <Povezave></Povezave>
  <Pokrivanje></Pokrivanje>
  <CasovnoPokritje></CasovnoPokritje>
  <AvtorskePravice>© The Author(s) 2026</AvtorskePravice>
  <VrstaGradiva ID="" DRIVER="info:eu-repo/semantics/other">Neznano</VrstaGradiva>
  <DatumVstavljanja>2026-03-13 13:11:15</DatumVstavljanja>
  <DatumObjave>2026-03-13 13:11:15</DatumObjave>
  <DatumSpremembe>2026-03-14 04:25:57</DatumSpremembe>
  <DatumTrajnegaHranjenja>0000-00-00 00:00:00</DatumTrajnegaHranjenja>
  <LetoIzida>2026</LetoIzida>
  <LetoIzidaDo>0</LetoIzidaDo>
  <KrajIzida></KrajIzida>
  <LetoIzvedbe>0</LetoIzvedbe>
  <KrajIzvedbe></KrajIzvedbe>
  <Opomba>Nasl. z nasl. zaslona;
Soavtorja iz Slovenije: Senja Pollak, Blaž Škrlj;
Opis vira z dne 13. 3. 2026;
</Opomba>
  <StStrani>str. 1-39</StStrani>
  <StevilcenjeNivo1>Vol. 115, article no. 61</StevilcenjeNivo1>
  <StevilcenjeNivo2></StevilcenjeNivo2>
  <Kronologija>6 Mar. 2026</Kronologija>
  <Patent_Stevilka></Patent_Stevilka>
  <Patent_DatumVeljavnosti>0000-00-00</Patent_DatumVeljavnosti>
  <VerzijaDokumenta>Zaloznikova</VerzijaDokumenta>
  <StatusObjaveDrugje>Objavljeno</StatusObjaveDrugje>
  <VrstaStroskaObjave>NiDoloceno</VrstaStroskaObjave>
  <DatumPoslanoVRecenzijo>2025-04-23</DatumPoslanoVRecenzijo>
  <DatumSprejetjaClanka>2026-02-02</DatumSprejetjaClanka>
  <DatumObjaveClanka>2026-03-06</DatumObjaveClanka>
  <Licence>
    <Licenca ID="6" Kratica="CC BY 4.0" Naziv="Creative Commons Priznanje avtorstva 4.0 Mednarodna" URL="http://creativecommons.org/licenses/by/4.0/deed.sl" Logo="by.png" LogoPolniUrl="https://dirros.openscience.si/teme/dirros/img/licence/by.png" DatumZacetkaLicenciranja="2026-03-06" VezanoNa="VoR" VezanoNaAng="" Besedilo="" BesediloAng=""></Licenca>
  </Licence>
  <EmbargoDo></EmbargoDo>
  <VrstaEmbarga ID="1" Naziv="Takojšnja javna objava" OpenAIREDostop="openAccess"></VrstaEmbarga>
  <Osebe>
    <Oseba ID="28576" Ime="Boshko" Priimek="Koloski" AltIme="B. Koloski" VlogaID="70" VlogaNaziv="Avtor" ConorID="390074115" Afiliacija="Institut &quot;Jožef Stefan&quot;" ArrsID="57800" ORCID=""></Oseba>
    <Oseba ID="16464" Ime="Senja" Priimek="Pollak" AltIme="S. Pollak" VlogaID="70" VlogaNaziv="Avtor" ConorID="131071843" Afiliacija="Institut &quot;Jožef Stefan&quot;" ArrsID="31844" ORCID=""></Oseba>
    <Oseba ID="28577" Ime="Roberto" Priimek="Navigli" AltIme="" VlogaID="70" VlogaNaziv="Avtor" ConorID="316256099" Afiliacija="" ArrsID="" ORCID=""></Oseba>
    <Oseba ID="28578" Ime="Blaž" Priimek="Škrlj" AltIme="Blaz Skrlj; B Škrlj" VlogaID="70" VlogaNaziv="Avtor" ConorID="267667555" Afiliacija="Institut &quot;Jožef Stefan&quot;" ArrsID="52066" ORCID=""></Oseba>
  </Osebe>
  <Identifikatorji>
    <Identifikator ID="4" Sifra="UDK" Naziv="UDK" URL="">004.8</Identifikator>
    <Identifikator ID="9" Sifra="ISSN-clanka" Naziv="ISSN pri članku" URL="">1573-0565</Identifikator>
    <Identifikator ID="15" Sifra="DOI" Naziv="DOI" URL="http://dx.doi.org/10.1007/s10994-026-07008-y">10.1007/s10994-026-07008-y</Identifikator>
    <Identifikator ID="3" Sifra="CobissID" Naziv="COBISS_ID" URL="https://plus.cobiss.net/cobiss/si/sl/bib/271609091">271609091</Identifikator>
  </Identifikatorji>
  <Datoteke>
    <Datoteka ID="41801" DatotekaNRID="0" NamenDatotekeID="5" NamenDatoteke="Izvorni URL" FormatDatotekeID="56" FormatDatoteke="URL" MIME="text/url" IkonaFormata="html.gif" IkonaFormataPolniUrl="https://dirros.openscience.si/teme/dirros/img/fileTypes/html.gif" VelikostDatoteke="0" VelikostDatotekeKratko="0,00 KB" DatumVstavljanja="2026-03-13 13:11:19" JeZbrisana="false" JeJavnoVidna="true" JeIndeksirana="false" JeVidno="true" VidnoOd="01.01.1970" Zaporedje="0">
      <Naziv></Naziv>
      <OrgNaziv></OrgNaziv>
      <URL>https://link.springer.com/article/10.1007/s10994-026-07008-y</URL>
      <Opis></Opis>
      <OpisTujJezik></OpisTujJezik>
      <UrlObdelave></UrlObdelave>
      <FrekvencaAzuriranjaID>1</FrekvencaAzuriranjaID>
      <Verzija></Verzija>
      <MD5></MD5>
      <SHA256></SHA256>
      <UUID>be06d08a-1ed5-11f1-acf8-001a4af901a5</UUID>
      <PID></PID>
      <PrenosPolniUrl>https://dirros.openscience.si/Dokument.php?lang=slv&amp;id=41801</PrenosPolniUrl>
      <Vsebine>
      </Vsebine>
    </Datoteka>
    <Datoteka ID="41802" DatotekaNRID="14621974" NamenDatotekeID="2" NamenDatoteke="Predstavitvena datoteka" FormatDatotekeID="2" FormatDatoteke=".pdf" MIME="application/pdf" IkonaFormata="pdf.gif" IkonaFormataPolniUrl="https://dirros.openscience.si/teme/dirros/img/fileTypes/pdf.gif" VelikostDatoteke="7688630" VelikostDatotekeKratko="7,33 MB" DatumVstavljanja="2026-03-13 13:16:59" JeZbrisana="false" JeJavnoVidna="true" JeIndeksirana="true" JeVidno="true" VidnoOd="01.01.1970" Zaporedje="1">
      <Naziv>RAZ_Koloski_Boshko_2026.pdf</Naziv>
      <OrgNaziv>RAZ_Koloski_Boshko_2026.pdf</OrgNaziv>
      <URL></URL>
      <Opis></Opis>
      <OpisTujJezik></OpisTujJezik>
      <UrlObdelave></UrlObdelave>
      <FrekvencaAzuriranjaID>1</FrekvencaAzuriranjaID>
      <Verzija></Verzija>
      <MD5>9BB8D0EAE48F39924BFB52DCFE589268</MD5>
      <SHA256>1efb91f6191563d1e44c976a239fb7a2f64cb75b1c273caf186bd2523decc01b</SHA256>
      <UUID>893678cc-1ed6-11f1-acf8-001a4af901a5</UUID>
      <PID></PID>
      <PrenosPolniUrl>https://dirros.openscience.si/Dokument.php?lang=slv&amp;id=41802</PrenosPolniUrl>
      <Vsebine>
        <Vsebina TipVsebine="GoloBesedilo" JezikID="1033" Oznaka="" Dolzina="88021"></Vsebina>
      </Vsebine>
    </Datoteka>
  </Datoteke>
  <Organizacije>
    <Organizacija OrganizacijaID="11" Kratica="IJS" ZavodEvsID="1100110" Logo="ijs.png" LogoPolniUrl="https://dirros.openscience.si/teme/dirros/img/logo/ijs.png">Institut Jožef Stefan</Organizacija>
  </Organizacije>
  <OrganizacijeVira>
  </OrganizacijeVira>
  <MetodeZbiranjaPodatkov>
  </MetodeZbiranjaPodatkov>
  <TipologijaDela ID="1.01" Koda="1.01" Naziv="Izvirni znanstveni članek" SchemaOrg="Article"></TipologijaDela>
  <OpenAIRE>
    <OpenAIRE ProjektID="info:eu-repo/grantAgreement/ARIS//GC-0001-2024" Stevilka="GC-0001-2024" Naslov="Umetna inteligenca za znanost" Akronim="" Delez="0"></OpenAIRE>
    <OpenAIRE ProjektID="info:eu-repo/grantAgreement/ARIS//GC-0002-2024" Stevilka="GC-0002-2024" Naslov="Veliki jezikovni modeli za digitalno humanistiko" Akronim="" Delez="0"></OpenAIRE>
    <OpenAIRE ProjektID="info:eu-repo/grantAgreement/ARIS//L2-50070-2023" Stevilka="L2-50070-2023" Naslov="Tehnike vektorskih vložitev za medijske aplikacije" Akronim="" Delez="0"></OpenAIRE>
    <OpenAIRE ProjektID="info:eu-repo/grantAgreement/ARIS//J5-3102-2021" Stevilka="J5-3102-2021" Naslov="Sovražni govor v sodobnih konceptualizacijah nacionalizma, rasizma, spola in migracij" Akronim="" Delez="0"></OpenAIRE>
    <OpenAIRE ProjektID="info:eu-repo/grantAgreement/ARIS//P2-0103-2022" Stevilka="P2-0103-2022" Naslov="Tehnologije znanja" Akronim="" Delez="0"></OpenAIRE>
    <OpenAIRE ProjektID="info:eu-repo/grantAgreement/ARIS/Young Researcher Grant/PR-12394" Stevilka="PR-12394" Naslov="" Akronim="" Delez="0"></OpenAIRE>
    <OpenAIRE ProjektID="info:eu-repo/grantAgreement/Italian%20Ministry%20of%20University%20and%20Research%20%28Ministero%20dell%27Universit%C3%A0%20e%20della%20Ricerca%29//MIUR_PRIN%202020%202020ZSL9F9" Stevilka="MIUR_PRIN 2020 2020ZSL9F9" Naslov="CRoss-modal understanding and gEnerATIon of Visual and tExtual content" Akronim="CREATIVE" Delez="0"></OpenAIRE>
  </OpenAIRE>
  <Ostalo>
    <StIrodsDatotek>0</StIrodsDatotek>
    <StDatotekPodTrajnimEmbargom>0</StDatotekPodTrajnimEmbargom>
    <StDatotekZOmejenimDostopom>0</StDatotekZOmejenimDostopom>
  </Ostalo>
</Gradivo>
