<?xml version="1.0" encoding="utf-8"?>
<Gradivo ID="22530" NadgradivoID="28" NRID="26465177" OceID="0" DomainUrl="https://dirros.openscience.si/" IzpisPolniUrl="https://dirros.openscience.si/IzpisGradiva.php?lang=slv&amp;id=22530" StOgledov="815" StPrenosov="416" StOcen="0" VsotaOcen="0" DatumIzvoza="2026-05-05 05:00:53" OcenaSkupna="0" StPodgradiv="0" StudijskiProgramEvsID="" JeIndeksirano="0" JeVecAvtorjev="0" DovoliZahtevkeZaDostop="0">
  <PID Url="http://hdl.handle.net/20.500.12556/DiRROS-22530">20.500.12556/DiRROS-22530</PID>
  <Naslov>Ground truth clustering is not the optimum clustering</Naslov>
  <Podnaslov></Podnaslov>
  <TujJezik_Naslov></TujJezik_Naslov>
  <TujJezik_Podnaslov></TujJezik_Podnaslov>
  <Opis>Data clustering is a fundamental yet challenging task in data science. The minimum sum-of-squares clustering (MSSC) problem aims to partition data points into k clusters to minimize the sum of squared distances between the points and their cluster centers (centroids). Despite being NP-hard, solvers exist that can compute optimal solutions for small to medium-sized datasets. One such solver is SOS-SDP, a branch-and-bound algorithm based on semidefinite programming. We used it to obtain optimal MSSC solutions (optimum clusterings) for various k across multiple datasets with known ground truth clusterings. We evaluated the alignment between the optimum and ground truth clusterings using six extrinsic measures and assessed their quality using three intrinsic measures. The results reveal that the optimum clusterings often differ significantly from the ground truth clusterings. Additionally, the optimum clusterings frequently outperform the ground truth clusterings, according to the intrinsic measures that we used. However, when ground truth clusters are well-separated convex shapes, such as ellipsoids, the optimum and ground truth clusterings closely align.</Opis>
  <TujJezik_Opis>Razvrščanje podatkov v skupine je temeljna, a zelo zahtevna naloga v podatkovni znanosti. Problem razvrščanja z minimalno vsoto kvadratov odklonov (MSSC) je osredotočen na razvrščanje podatkovnih točk v k skupin na način, da bila vsota kvadratov razdalj med točkami in centri skupin (centroidi) minimalna. Kljub temu, da je to NP-težek problem, obstajajo reševalniki za ta problem, ki lahko izračunajo optimalne rešitve za majhne in srednje velike nabore podatkov. Eden takšnih reševalnikov je SOS-SDP, ki temelji na razveji in omeji algoritmu in na semidefinitnem programiranju. Uporabili smo ga za pridobitev optimalnih rešitev MSSC (optimalnih razvrščanj) za različne vrednosti k preko več naborov podatkov z znanimi dejanskimi razvrstitvami. Ugotavljali smo skladnost med optimalnimi in dejanskimi razvrstitvami z uporabo šestih zunanjih mer ter ocenili njihovo kakovost z uporabo treh notranjih mer. Rezultati kažejo, da se optimalne razvrstitve pogosto znatno razlikujejo od dejanskih razvrstitev. Poleg tega optimalne razvrstitve pogosto presegajo dejanske razvrstitve glede na vrednosti notranjih mer, ki smo jih uporabili. Kadar pa so dejanske skupine dobro ločene in imajo konveksne oblike, kot so npr. elipsoidi, so optimalne in dejanske razvrstitve tesno usklajene.</TujJezik_Opis>
  <KljucneBesede>
    <Beseda>minimum sum-of-squares clustering</Beseda>
    <Beseda>ground truth clustering</Beseda>
    <Beseda>rxtrinsic measures</Beseda>
    <Beseda>intrinsic measures</Beseda>
  </KljucneBesede>
  <TujJezik_KljucneBesede>
    <Beseda>razvrščanje z minimalno vsoto kvadratov</Beseda>
    <Beseda>dejansko razvrščanje</Beseda>
    <Beseda>zunanje mere</Beseda>
    <Beseda>notranje mere</Beseda>
  </TujJezik_KljucneBesede>
  <Potrjeno>true</Potrjeno>
  <JeZaklenjeno>false</JeZaklenjeno>
  <JeRecenzirano>false</JeRecenzirano>
  <Zaloznik></Zaloznik>
  <Izvor></Izvor>
  <Jezik ID="1033" ISO639-3="eng">Angleški jezik</Jezik>
  <TujJezik ID="1060" ISO639-3="slv">Slovenski jezik</TujJezik>
  <Povezave></Povezave>
  <Pokrivanje></Pokrivanje>
  <CasovnoPokritje></CasovnoPokritje>
  <AvtorskePravice></AvtorskePravice>
  <VrstaGradiva ID="" DRIVER="info:eu-repo/semantics/other">Neznano</VrstaGradiva>
  <DatumVstavljanja>2025-05-29 12:57:38</DatumVstavljanja>
  <DatumObjave>2025-05-29 12:57:39</DatumObjave>
  <DatumSpremembe>2025-10-24 03:51:28</DatumSpremembe>
  <DatumTrajnegaHranjenja>0000-00-00 00:00:00</DatumTrajnegaHranjenja>
  <LetoIzida>2025</LetoIzida>
  <LetoIzidaDo>0</LetoIzidaDo>
  <KrajIzida></KrajIzida>
  <LetoIzvedbe>0</LetoIzvedbe>
  <KrajIzvedbe></KrajIzvedbe>
  <Opomba>Nasl. z nasl. zaslona;
Opis vira z dne 22. 3. 2025;
Soavtorji: Timotej Hrga, Janez Povh &amp; Shudian Zhao;
</Opomba>
  <StStrani>str. 1-17</StStrani>
  <StevilcenjeNivo1>article no. ǂ9223</StevilcenjeNivo1>
  <StevilcenjeNivo2>Vol. 15</StevilcenjeNivo2>
  <Kronologija>2025</Kronologija>
  <Patent_Stevilka></Patent_Stevilka>
  <Patent_DatumVeljavnosti>0000-00-00</Patent_DatumVeljavnosti>
  <VerzijaDokumenta>Zaloznikova</VerzijaDokumenta>
  <StatusObjaveDrugje>NiDoloceno</StatusObjaveDrugje>
  <VrstaStroskaObjave>NiDoloceno</VrstaStroskaObjave>
  <DatumPoslanoVRecenzijo>0000-00-00</DatumPoslanoVRecenzijo>
  <DatumSprejetjaClanka>0000-00-00</DatumSprejetjaClanka>
  <DatumObjaveClanka>2025-01-01</DatumObjaveClanka>
  <Licence>
    <Licenca ID="6" Kratica="CC BY 4.0" Naziv="Creative Commons Priznanje avtorstva 4.0 Mednarodna" URL="http://creativecommons.org/licenses/by/4.0/deed.sl" Logo="by.png" LogoPolniUrl="https://dirros.openscience.si/teme/dirros/img/licence/by.png" DatumZacetkaLicenciranja="" VezanoNa="" VezanoNaAng="" Besedilo="" BesediloAng=""></Licenca>
  </Licence>
  <EmbargoDo></EmbargoDo>
  <VrstaEmbarga ID="1" Naziv="Takojšnja javna objava" OpenAIREDostop="openAccess"></VrstaEmbarga>
  <Osebe>
    <Oseba ID="20566" Ime="Lucia" Priimek="Absalom Bautista" AltIme="" VlogaID="70" VlogaNaziv="Avtor" ConorID="455993603" Afiliacija="" ArrsID="" ORCID=""></Oseba>
    <Oseba ID="20567" Ime="Timotej" Priimek="Hrga" AltIme="" VlogaID="70" VlogaNaziv="Avtor" ConorID="261696355" Afiliacija="" ArrsID="50783" ORCID=""></Oseba>
    <Oseba ID="20530" Ime="Janez" Priimek="Povh" AltIme="J. Povh" VlogaID="70" VlogaNaziv="Avtor" ConorID="936803" Afiliacija="" ArrsID="22649" ORCID=""></Oseba>
    <Oseba ID="20568" Ime="Shudian" Priimek="Zhao" AltIme="" VlogaID="70" VlogaNaziv="Avtor" ConorID="455993859" Afiliacija="" ArrsID="" ORCID=""></Oseba>
  </Osebe>
  <Identifikatorji>
    <Identifikator ID="4" Sifra="UDK" Naziv="UDK" URL="">519.85</Identifikator>
    <Identifikator ID="9" Sifra="ISSN-clanka" Naziv="ISSN pri članku" URL="">2045-2322</Identifikator>
    <Identifikator ID="15" Sifra="DOI" Naziv="DOI" URL="http://dx.doi.org/10.1038/s41598-025-90865-9">10.1038/s41598-025-90865-9</Identifikator>
    <Identifikator ID="3" Sifra="CobissID" Naziv="COBISS_ID" URL="https://plus.cobiss.net/cobiss/si/sl/bib/229897731">229897731</Identifikator>
  </Identifikatorji>
  <Datoteke>
    <Datoteka ID="32570" DatotekaNRID="0" NamenDatotekeID="5" NamenDatoteke="Izvorni URL" FormatDatotekeID="56" FormatDatoteke="URL" MIME="text/url" IkonaFormata="html.gif" IkonaFormataPolniUrl="https://dirros.openscience.si/teme/dirros/img/fileTypes/html.gif" VelikostDatoteke="0" VelikostDatotekeKratko="0,00 KB" DatumVstavljanja="2025-05-29 12:57:41" JeZbrisana="false" JeJavnoVidna="true" JeIndeksirana="false" JeVidno="true" VidnoOd="01.01.1970" Zaporedje="0">
      <Naziv></Naziv>
      <OrgNaziv></OrgNaziv>
      <URL>https://www.nature.com/articles/s41598-025-90865-9</URL>
      <Opis></Opis>
      <OpisTujJezik></OpisTujJezik>
      <UrlObdelave></UrlObdelave>
      <FrekvencaAzuriranjaID>1</FrekvencaAzuriranjaID>
      <Verzija></Verzija>
      <MD5></MD5>
      <SHA256></SHA256>
      <UUID>be1384b6-3c7b-11f0-963a-001a4af901a5</UUID>
      <PID></PID>
      <PrenosPolniUrl>https://dirros.openscience.si/Dokument.php?lang=slv&amp;id=32570</PrenosPolniUrl>
      <Vsebine>
      </Vsebine>
    </Datoteka>
    <Datoteka ID="32571" DatotekaNRID="14300816" NamenDatotekeID="2" NamenDatoteke="Predstavitvena datoteka" FormatDatotekeID="2" FormatDatoteke=".pdf" MIME="application/pdf" IkonaFormata="pdf.gif" IkonaFormataPolniUrl="https://dirros.openscience.si/teme/dirros/img/fileTypes/pdf.gif" VelikostDatoteke="3883904" VelikostDatotekeKratko="3,70 MB" DatumVstavljanja="2025-05-29 13:04:29" JeZbrisana="false" JeJavnoVidna="true" JeIndeksirana="true" JeVidno="true" VidnoOd="01.01.1970" Zaporedje="1">
      <Naziv>RAZ_Absalom_Bautista_Lucia_2025.pdf</Naziv>
      <OrgNaziv>RAZ_Absalom_Bautista_Lucia_2025.pdf</OrgNaziv>
      <URL></URL>
      <Opis></Opis>
      <OpisTujJezik></OpisTujJezik>
      <UrlObdelave></UrlObdelave>
      <FrekvencaAzuriranjaID>1</FrekvencaAzuriranjaID>
      <Verzija></Verzija>
      <MD5>B7E811F029090C6131103F8630717E70</MD5>
      <SHA256>18d0c7ccad4ede032c6b7023936411ab8872ceddda07e7f3e406959ea70cefc5</SHA256>
      <UUID>b155b317-3c7c-11f0-963a-001a4af901a5</UUID>
      <PID></PID>
      <PrenosPolniUrl>https://dirros.openscience.si/Dokument.php?lang=slv&amp;id=32571</PrenosPolniUrl>
      <Vsebine>
        <Vsebina TipVsebine="GoloBesedilo" JezikID="1033" Oznaka="" Dolzina="64463"></Vsebina>
      </Vsebine>
    </Datoteka>
  </Datoteke>
  <Organizacije>
    <Organizacija OrganizacijaID="50" Kratica="RUDOLFOVO" ZavodEvsID="5000500" Logo="rudolfovo.png" LogoPolniUrl="https://dirros.openscience.si/teme/dirros/img/logo/rudolfovo.png">Rudolfovo – Znanstveno in tehnološko središče Novo mesto</Organizacija>
  </Organizacije>
  <OrganizacijeVira>
  </OrganizacijeVira>
  <MetodeZbiranjaPodatkov>
  </MetodeZbiranjaPodatkov>
  <TipologijaDela ID="1.01" Koda="1.01" Naziv="Izvirni znanstveni članek" SchemaOrg="Article"></TipologijaDela>
  <OpenAIRE>
    <OpenAIRE ProjektID="info:eu-repo/grantAgreement/ARIS//DIGITOP-%20RRI" Stevilka="DIGITOP- RRI" Naslov="Digitalna transformacija robotiziranih tovarn prihodnosti" Akronim="DIGITOP" Delez="100"></OpenAIRE>
  </OpenAIRE>
  <Ostalo>
    <StIrodsDatotek>0</StIrodsDatotek>
    <StDatotekPodTrajnimEmbargom>0</StDatotekPodTrajnimEmbargom>
    <StDatotekZOmejenimDostopom>0</StDatotekZOmejenimDostopom>
  </Ostalo>
</Gradivo>
