Digitalni repozitorij raziskovalnih organizacij Slovenije

Izpis gradiva
A+ | A- | Pomoč | SLO | ENG

Naslov:Large language models in food and nutrition science : opportunities, challenges, and the case of FoodyLLM
Avtorji:ID Gjorgjevikj, Ana, Institut "Jožef Stefan" (Avtor)
ID Martinc, Matej, Institut "Jožef Stefan" (Avtor)
ID Cenikj, Gjorgjina, Institut "Jožef Stefan" (Avtor)
ID Drole, Jan, Institut "Jožef Stefan" (Avtor)
ID Ogrinc, Nives, Institut "Jožef Stefan" (Avtor)
ID Džeroski, Sašo, Institut "Jožef Stefan" (Avtor)
ID Koroušić-Seljak, Barbara, Institut "Jožef Stefan" (Avtor)
ID Eftimov, Tome, Institut "Jožef Stefan" (Avtor), et al.
Datoteke:URL URL - Izvorni URL, za dostop obiščite https://www.sciencedirect.com/science/article/pii/S2665927126000511?via%3Dihub
 
.pdf PDF - Predstavitvena datoteka, prenos (6,37 MB)
MD5: B15A5C3391C3B2DF6F3C98B691CC9D4E
Opis: Raziskovalni podatki so na voljo na straneh https://github.com/matejMartinc/FoodyLLM, https://huggingface.co/Matej/FoodyLLM in https://zenodo.org/records/17798877.
 
Jezik:Angleški jezik
Tipologija:1.01 - Izvirni znanstveni članek
Organizacija:Logo IJS - Institut Jožef Stefan
Povzetek:Background Reliable nutrient profiling and semantic interoperability are essential for scalable dietary assessment, food labeling (e.g., traffic-light schemes), and FAIR integration of food composition and consumption data. However, general-purpose large language models (LLMs) are not systematically exposed to structured recipe–nutrition mappings and food ontologies, limiting their accuracy and trustworthiness in food and nutrition tasks. Scope and approach We review recent LLM advances in life sciences and healthcare and analyze the gap in food and nutrition applications. To address this gap, we introduce FoodyLLM, a domain-specialized LLM fine-tuned on 225k task-aligned QA pairs for (i) recipe nutrient estimation, (ii) traffic-light classification, and (iii) ontology-based entity linking to support FAIR food data interoperability. We benchmark FoodyLLM against strong general-purpose baselines (e.g., Llama 3 8B, Gemini 2.0) under zero-/few-shot prompting across five evaluation folds. Key findings Across all tasks, FoodyLLM substantially outperforms general-purpose LLMs for nutrient estimation across all macronutrients (fat, protein, salt, saturates, sugar), accuracy increases from 0.43 to 0.63 to 0.91–0.97; for traffic-light classification across all nutrients and color categories, macro F1 improves from 0.46 to 0.80 to 0.86–0.97; and for ontology-based food entity linking across FoodOn, SNOMED-CT, and Hansard, macro F1 increases from 0.33 to 0.44 (best general-purpose baseline) to 0.93–0.98 on artificial NEL data, and from 0.24 to 0.51 to 0.67–0.84 on real corpora (CafeteriaSA and CafeteriaFCD). Overall, our results demonstrate the practical value of domain-specialized LLMs in food and nutrition research. They enable automated dietary assessment, large-scale nutritional monitoring, and FAIR data integration, while opening new pathways toward sustainable and personalized nutrition.
Ključne besede:FoodyLLM, nutrient estimation, data interoperability
Status publikacije:Objavljeno
Verzija publikacije:Objavljena publikacija
Poslano v recenzijo:13.11.2025
Datum sprejetja članka:13.02.2026
Datum objave:16.02.2026
Založnik:Elsevier
Leto izida:2026
Št. strani:str. 1-26
Številčenje:Vol. 12, [article no.] 101351
Izvor:Nizozemska
PID:20.500.12556/DiRROS-27977 Novo okno
UDK:004.8
ISSN pri članku:2665-9271
DOI:10.1016/j.crfs.2026.101351 Novo okno
COBISS.SI-ID:270414595 Novo okno
Avtorske pravice:© 2026 The Authors.
Opomba:Nasl. z nasl. zaslona; Soavtorji: Matej Martinc, Gjorgjina Venikj, Jan Drole, Nives Ogrinc, Sašo Džeroski, Barbara Koroušić Seljak, Tome Eftimov; Opis vira z dne 4. 3. 2026;
Datum objave v DiRROS:04.03.2026
Število ogledov:38
Število prenosov:17
Metapodatki:XML DC-XML DC-RDF
:
Kopiraj citat
  
Objavi na:Bookmark and Share


Postavite miškin kazalec na naslov za izpis povzetka. Klik na naslov izpiše podrobnosti ali sproži prenos.

Gradivo je del revije

Naslov:Current research in food science
Založnik:Elsevier B.V.
ISSN:2665-9271
COBISS.SI-ID:18959875 Novo okno

Gradivo je financirano iz projekta

Financer:ARIS - Javna agencija za znanstvenoraziskovalno in inovacijsko dejavnost Republike Slovenije
Številka projekta:P2-0098-2019
Naslov:Računalniške strukture in sistemi

Financer:ARIS - Javna agencija za znanstvenoraziskovalno in inovacijsko dejavnost Republike Slovenije
Številka projekta:P2-0103-2022
Naslov:Tehnologije znanja

Financer:ARIS - Javna agencija za znanstvenoraziskovalno in inovacijsko dejavnost Republike Slovenije
Številka projekta:P1-0143-2020
Naslov:Kroženje snovi v okolju, snovna bilanca in modeliranje okoljskih procesov ter ocena tveganja

Financer:ARIS - Javna agencija za znanstvenoraziskovalno in inovacijsko dejavnost Republike Slovenije
Številka projekta:GC-0001-2024
Naslov:Umetna inteligenca za znanost

Financer:ARIS - Javna agencija za znanstvenoraziskovalno in inovacijsko dejavnost Republike Slovenije
Številka projekta:BI-US/24-26-081-2024
Naslov:Preiskovanje znanstvene literature za napovedovanje interakcij med hrano, boleznimi in zdravili z uporabo grafov znanja

Financer:EC - European Commission
Številka projekta:101211695
Naslov:Framework for Robust and Explainable Automated Large Language Model Selection
Akronim:AutoLLMSelect

Financer:EC - European Commission
Številka projekta:101187010
Naslov:Leveraging Benchmarking Data for Automated Machine Learning and Optimization
Akronim:AutoLearn-SI

Financer:EC - European Commission
Številka projekta:101060712
Naslov:European integration of new technologies and social-economic solutions for increasing consumer trust and engagement in seafood products
Akronim:FishEUTrust

Financer:EC - European Commission
Številka projekta:101254461
Naslov:Slovenian AI Factory
Akronim:SLAIF

Financer:EC - European Commission
Številka projekta:101198470
Naslov:Large Language Models for the European Union
Akronim:LLMs4EU

Financer:ARIS - Javna agencija za znanstvenoraziskovalno in inovacijsko dejavnost Republike Slovenije
Številka projekta:J7-70265
Naslov:Developing and Validating a Comprehensive Food Composition Database and a Knowledge Base Aligned with FAIR Principles, Artificial Intelligence Methods, and Large Language Models
Akronim:AI4Food

Financer:ARIS - Javna agencija za znanstvenoraziskovalno in inovacijsko dejavnost Republike Slovenije
Številka projekta:PR-12393
Naslov:Young Researchers Grant

Licence

Licenca:CC BY 4.0, Creative Commons Priznanje avtorstva 4.0 Mednarodna
Povezava:http://creativecommons.org/licenses/by/4.0/deed.sl
Opis:To je standardna licenca Creative Commons, ki daje uporabnikom največ možnosti za nadaljnjo uporabo dela, pri čemer morajo navesti avtorja.
Začetek licenciranja:16.02.2026
Vezano na:VoR

Sekundarni jezik

Jezik:Slovenski jezik
Naslov:Large language models in food and nutrition science: opportunities, challenges, and the case of FoodyLLM
Ključne besede:FoodyLLM, interoperabilnost podatkov


Nazaj