Wait was my font to small

This commit is contained in:
J. Renken 2025-10-29 17:38:08 +01:00
parent a3ca412735
commit 39016a1a2d
5 changed files with 48 additions and 6 deletions

View file

@ -29,3 +29,36 @@
archivePrefix={arXiv},
url={https://arxiv.org/abs/2402.16823},
}
@InProceedings{pmlr-v174-pal22a,
title = {MedMCQA: A Large-scale Multi-Subject Multi-Choice Dataset for Medical domain Question Answering},
author = {Pal, Ankit and Umapathi, Logesh Kumar and Sankarasubbu, Malaikannan},
booktitle = {Proceedings of the Conference on Health, Inference, and Learning},
pages = {248--260},
year = {2022},
editor = {Flores, Gerardo and Chen, George H and Pollard, Tom and Ho, Joyce C and Naumann, Tristan},
volume = {174},
series = {Proceedings of Machine Learning Research},
month = {07--08 Apr},
publisher = {PMLR},
pdf = {https://proceedings.mlr.press/v174/pal22a/pal22a.pdf},
url = {https://proceedings.mlr.press/v174/pal22a.html},
abstract = {This paper introduces MedMCQA, a new large-scale, Multiple-Choice Question Answering (MCQA) dataset designed to address real-world medical entrance exam questions. More than 194k high-quality AIIMS & NEET PG entrance exam MCQs covering 2.4k healthcare topics and 21 medical subjects are collected with an average token length of 12.77 and high topical diversity. Each sample contains a question, correct answer(s), and other options which requires a deeper language understanding as it tests the 10+ reasoning abilities of a model across a wide range of medical subjects & topics. A detailed explanation of the solution, along with the above information, is provided in this study.}
}
@misc{qwen2.5,
title = {Qwen2.5: A Party of Foundation Models},
url = {https://qwenlm.github.io/blog/qwen2.5/},
author = {Qwen Team},
month = {September},
year = {2024}
}
@article{yang2024qwen2technicalreport,
title={Qwen2 Technical Report},
author={An Yang and Baosong Yang and Binyuan Hui and Bo Zheng and Bowen Yu and Chang Zhou and Chengpeng Li and Chengyuan Li and Dayiheng Liu and Fei Huang and Guanting Dong and Haoran Wei and Huan Lin and Jialong Tang and Jialin Wang and Jian Yang and Jianhong Tu and Jianwei Zhang and Jianxin Ma and Jianxin Yang and Jin Xu and Jingren Zhou and Jinze Bai and Jinzheng He and Junyang Lin and Kai Dang and Keming Lu and Keqin Chen and Kexin Yang and Mei Li and Mingfeng Xue and Na Ni and Pei Zhang and Peng Wang and Ru Peng and Rui Men and Ruize Gao and Runji Lin and Shijie Wang and Shuai Bai and Sinan Tan and Tianhang Zhu and Tianhao Li and Tianyu Liu and Wenbin Ge and Xiaodong Deng and Xiaohuan Zhou and Xingzhang Ren and Xinyu Zhang and Xipin Wei and Xuancheng Ren and Xuejing Liu and Yang Fan and Yang Yao and Yichang Zhang and Yu Wan and Yunfei Chu and Yuqiong Liu and Zeyu Cui and Zhenru Zhang and Zhifang Guo and Zhihao Fan},
year={2024},
eprint={2407.10671},
archivePrefix={arXiv},
url={https://arxiv.org/abs/2407.10671},
}

Binary file not shown.

View file

@ -11,13 +11,20 @@
\input{title}
\newpage
\section{Persönliches Interesse}
Ich habe mich für den Betrieb des IAMs entschieden, da das Gebiet der Informatik mich schon seit Langem begeistert, zudem hat es als klinisches Institut die Möglichkeit theoretische Forschung zu betreiben wessen Ergebnisse leicht in den Klinischen Alltag im UKE eingebunden werden können.
Ich habe mich für den Betrieb des IAMs entschieden, da das Gebiet der Informatik mich schon seit Langem begeistert, zudem hat es als klinisches Institut die Möglichkeit theoretische Forschung zu betreiben wessen Ergebnisse leicht in den Klinischen Alltag im UKE eingebunden werden können.
\section{Beschreibung des Betriebes}
Ich habe das Praktikum beim Institut für angewandte Medizininformatik abgeschlossen, welches zum Universitätsklinikum Hamburg Eppendorf gehört. Das UKE wurde gegründet in 1889 und Vernetzt Medizin, Forschung und Lehre. Angestellt sind 16.100 Mitarbeitende sowie 3.500 Studierende der Human- und Zahnmedizin sowie Hebammenwissenschaften \cite{ukeweb}. Das IAM besteht seit Anfang 2021 und zielt darauf Krankheitsbekämpfung zu verbessern indem sie Daten zusammenführen, Werkzeuge für Ärzt:innen sowie Forscher:innen zu entwickeln und komplexe Analysen zu vereinfachen. Das Team besteht aus etwa 100 Mitarbeitenden in fünf Forschungsgruppen welche sich mit den Gebieten der Bildverarbeitung, Onkologie, maschinellem Lernen, Sprachmodelle und Datenanalyse \cite{iamweb}. So entwickelte z.B. die IAM Fachgruppe \textit{Knowledge Integration in Precision Medicine} MONOCLE, um individualisierte Tumorbehandlungen zu vereinfachen indem das System Patientendaten aggregiert und in vorhandener Literatur filtert um passende Behandlungen zu finden \cite{riemann2025streamlining}.
%\section{Informationen zum Berufsbild}
\section{Eigene Tätigkeiten}
Meine Arbeit am IAM war ein Anschlussprojekt zu der Masterarbeit welche durch die derzeitige Masterandin der Fachgruppe verteidigt wurde. Oberthema der Masterarbeit war die Entwickelung der Lernplattform KiMed als eine Alternative zu den Crashkursen vor dem Medizinstudium welche trotzt ihres hohen nutzen wenig genutzt sind da sie wie reguläre Seminare und Lesungen am UKE gehalten werden, welches für teile der Neustudirenden schwer zu erreichen ist. KiMed wurde entwickelt als eine Möglichkeit individualisiert Neustudierenden durch Multiple Choice Questions (MCQ) auf einen ähnlichen Wissensstandpunkt zu bringen. Für die Generierung der MCQ wurde ein neuer Ansatz entwickelt um diese Akkurat und Korrekt zu gestalten basierend auf dem Ansatz GPTSwarm \cite{zhuge2024languageagentsoptimizablegraphs}, in welchem Large Language Model (LLM) Agenten als Knoten in einem Graph dargestellt sind und die Kanten zwischen den Knoten als die Übertragung von Informationen von Agent zu Agent. Der resultierende Graph kann dann durch ein Optimierungsalgorithmus verbessert werden. Der Ansatz welcher in KiMed genutzt wurde, Node-Sampling (Knoten-Auswahl), war eine vereinfachte Version des GPTSwarm Ansatz, wohin GPTSwarm ein vollständigen Graphen erstellt wird im Node-Sampling von einem Vordefiniertem Satz an Knoten, also Agenten, ein Knoten gewählt somit entsteht eine Kette an Agenten welche eine MCQ generieren konnten welche dann durch weiter LLMs bewertet wurden. Anhand der Bewertung durch die LLMs entsteht ein score für eine spezifische Konfiguration mit diesen Information kann dann ein Standard Optimierungsalgorithmus die Kette in der Nächsten Generation verbessern.
% TODO Explain Agents, Own Work, Explain that I don't have the Thesis from Lilly, Cite your Model and DS (OOO well researched), Try more explantions (a German and PW teacher will grade this not one of the people on your papers) Scream AaAAaaaaaa
Meine Arbeit am IAM war ein Anschlussprojekt zu der Masterarbeit welche durch die derzeitige Masterandin der Fachgruppe verteidigt wurde. Oberthema der Masterarbeit war die Entwickelung der Lernplattform KiMed als eine Alternative zu den Crashkursen vor dem Medizinstudium welche trotzt ihres hohen nutzen wenig genutzt sind da sie wie reguläre Seminare und Lesungen am UKE gehalten werden, welche für teile der Neustudierenden schwer zu erreichen sind da sie möglicherweise noch nicht in der nähe vom UKE wohnen oder keine zeit haben. KiMed wurde entwickelt als eine Möglichkeit individualisiert Neustudierenden durch Multiple Choice Questions (MCQ) auf einen ähnlichen Wissensstandpunkt zu bringen.
Für die Generierung der MCQ wurde ein neuer Ansatz entwickelt um diese Akkurat und Korrekt zu gestalten basierend auf dem Ansatz GPTSwarm \cite{zhuge2024languageagentsoptimizablegraphs}, in welchem Large Language Model (LLM) Agenten als Knoten in einem Graph dargestellt sind und die Kanten zwischen den Knoten als die Übertragung von Informationen von Agent zu Agent. Hier bezeichnet ein Agent einen Aufruf einer LLM um eine bestimmte Aufgabe zu erledigen wie die Generierung von Fragen oder Korrektur nach Kriterien. Der resultierende Graph kann dann durch ein Optimierungsalgorithmus verbessert werden. Der Ansatz welcher in KiMed genutzt wurde, Node-Sampling (Knoten-Auswahl), war eine vereinfachte Version des GPTSwarm Ansatz, wohin GPTSwarm ein vollständigen Graphen erstellt wird im Node-Sampling von einem Vordefiniertem Satz an Knoten, also Agenten, ein Knoten gewählt (sampling) somit entsteht eine Kette an Agenten welche eine MCQ generieren konnten welche dann durch weiter LLMs bewertet wurden. Anhand der Bewertung durch die LLMs entsteht ein score für eine spezifische Konfiguration mit diesen Information kann dann ein Standard Optimierungsalgorithmus die Kette in der Nächsten Generation verbessern. \footnote{Da die Masterarbeit nicht öffentlich ist kann ich leider keine quellen für meine Aussagen geben. Die Information sind durch meine Konversationen mit der Autorin und das Lesen des Codes entstanden.}
In meiner Arbeit übernahm ich das Konzept der graphbasierten LLM Generierung, jedoch um Medizinische MCQ (MMCQ) zu beantworten. Hierfür nutzte ich den MedMCQA Datensatz, dieser enthält ein große Anzahl an realistischen MMCQ über verschiedene Themen wie Mikrobiologie, Psychiatrie, Radiologie, Anatomie u. v. m. sowie die \glqq ground truth\grqq --- nicht objektiv Korrekt aber ein Vereinbarter wert --- durch welcher ein objektiver score berechnet werden kann, im Gegensatz zu KiMed welches den score durch weitere LLMs berechnete, somit keine ground truth besaß \cite{pmlr-v174-pal22a}. Das genutzte LLM war Qwen 2.5 14B Instruct 4bit da es eine gute Balance zwischen Performance und Antwortgenauigkeit darstellt \cite{yang2024qwen2technicalreport} \cite{qwen2.5}.
% TODO Own Work, Explain that I don't have the Thesis from Lilly, Cite your Model and DS (OOO well researched), Try more explantions (a German and PW teacher will grade this not one of the people on your papers) Scream AaAAaaaaaa
\newpage
\section{Anhang}
\printbibliography[title=Referenzen]
%Bilderverzeichniss

View file

@ -1,3 +1,4 @@
% !TeX root = document.tex
\ProvidesPackage{praktikumsbericht}
\RequirePackage{fontspec}
@ -5,6 +6,6 @@
\RequirePackage[onehalfspacing]{setspace}
\RequirePackage[ngerman]{babel}
\defaultfontfeatures{Mapping=tex-text,Scale=MatchLowercase}
\defaultfontfeatures{Mapping=tex-text}
\setmainfont{Arial}
\fontsize{11}{16.5}

View file

@ -4,12 +4,13 @@
\begin{center}
\Huge{Praktikumsbericht}\\
\end{center}
\begin{tabular}{l l}
{\large \begin{tabular}{l l}
Name:& Jakob Renken\\
Klasse:& 10i\\
Unterrichtsfach:& Politik-Wirtschaft\\
Fachlehrerin:& Imke Lunau\\
Betrieb:& UKE Institut für angewandte Medizininformatik\\
Zeitraum:& 29.09.25 - 10.10.25
\end{tabular}
\end{tabular}}
\end{titlepage}