Digitalni repozitorij raziskovalnih organizacij Slovenije

Izpis gradiva
A+ | A- | Pomoč | SLO | ENG

Naslov:RAGCare-QA : a benchmark dataset for evaluating retrieval-augmented generation pipelines in theoretical medical knowledge
Avtorji:ID Dobreva, Jovana (Avtor)
ID Karasmanakis, Ivana, Institut "Jožef Stefan" (Avtor)
ID Ivanisevic, Filip, Institut "Jožef Stefan" (Avtor)
ID Horvat, Tadej, Institut "Jožef Stefan" (Avtor)
ID Gams, Matjaž, Institut "Jožef Stefan" (Avtor)
ID Simjanoska Misheva, Monika (Avtor)
Datoteke:URL URL - Izvorni URL, za dostop obiščite https://www.sciencedirect.com/science/article/pii/S2352340925008674
 
.pdf PDF - Predstavitvena datoteka, prenos (919,71 KB)
MD5: 095F423B47FF0E0B8227C1229E909D6F
Opis: The dataset is available on Hugging Face Hub: https://huggingface.co/datasets/ChatMED-Project/RAGCare-QA.
 
Jezik:Angleški jezik
Tipologija:1.03 - Drugi znanstveni članki
Organizacija:Logo IJS - Institut Jožef Stefan
Povzetek:The paper introduces RAGCare-QA, an extensive dataset of 420 theoretical medical knowledge questions for assessing Retrieval-Augmented Generation (RAG) pipelines in medical education and evaluation settings. The dataset includes one-choice-only questions from six medical specialties (Cardiology, Endocrinology, Gastroenterology, Family Medicine, Oncology, and Neurology) with three levels of complexity (Basic, Intermediate, and Advanced). Each question is accompanied by the best fit of RAG implementation complexity level, such as Basic RAG (315 questions, 75.0 %), Multi-vector RAG (82 questions, 19.5 %), and Graph-enhanced RAG (23 questions, 5.5 %). The questions emphasize theoretical medical knowledge on fundamental concepts, pathophysiology, diagnostic criteria, and treatment principles important in medical education. The dataset is a useful tool for the assessment of RAG- based medical education systems, allowing researchers to fine-tune retrieval methods for various categories of theoretical medical knowledge questions.
Ključne besede:medical education, retrieval-augmented generation, theoretical knowledge, multiple-choice questions
Status publikacije:Objavljeno
Verzija publikacije:Objavljena publikacija
Poslano v recenzijo:29.06.2025
Datum sprejetja članka:01.10.2025
Datum objave:09.10.2025
Založnik:Elsevier
Leto izida:2025
Št. strani:str. 1-11
Številčenje:Vol. 63, [article no.] 112146
Izvor:Nizozemska
PID:20.500.12556/DiRROS-25043 Novo okno
UDK:004.8
ISSN pri članku:2352-3409
DOI:10.1016/j.dib.2025.112146 Novo okno
COBISS.SI-ID:263916803 Novo okno
Avtorske pravice:© 2025 The Author(s).
Opomba:Nasl. z nasl. zaslona; Soavtorji iz Slovenije: Ivana Karasmanakis, Filip Ivanisevic, Tadej Horvat, Matjaž Gams; Opis vira z dne 8. 1. 2026;
Datum objave v DiRROS:08.01.2026
Število ogledov:234
Število prenosov:60
Metapodatki:XML DC-XML DC-RDF
:
Kopiraj citat
  
Objavi na:Bookmark and Share


Postavite miškin kazalec na naslov za izpis povzetka. Klik na naslov izpiše podrobnosti ali sproži prenos.

Gradivo je del revije

Naslov:Data in brief
Založnik:Elsevier
ISSN:2352-3409
COBISS.SI-ID:32117977 Novo okno

Gradivo je financirano iz projekta

Financer:EC - European Commission
Številka projekta:101159214
Naslov:Bridging Research Institutions to Catalyze Generative AI Adoption by the Health Sector in the Widening Countries
Akronim:ChatMED

Licence

Licenca:CC BY 4.0, Creative Commons Priznanje avtorstva 4.0 Mednarodna
Povezava:http://creativecommons.org/licenses/by/4.0/deed.sl
Opis:To je standardna licenca Creative Commons, ki daje uporabnikom največ možnosti za nadaljnjo uporabo dela, pri čemer morajo navesti avtorja.
Začetek licenciranja:09.10.2025
Vezano na:VoR

Sekundarni jezik

Jezik:Slovenski jezik
Naslov:RAGCare-QA: a benchmark dataset for evaluating retrieval-augmented generation pipelines in theoretical medical knowledge
Ključne besede:medicinsko izobraževanje, ocena znanja, teoretično znanje, vprašanja z več možnimi odgovori


Nazaj