18.03.2024
©MCML & Lisa Wimmer - LMU
Get to know MCML Junior Member Lisa Wimmer
Created during the first MCMLxDJS-Workshop
In the field of machine learning, MCML Junior Member Lisa Wimmer deals with model predictions and how they can be made more useful. Her main research focus is on the quantification of uncertainty.
This article was written by Celine Schuster from the Deutsche Journalistenschule (DJS). It was created in a workshop together with DJS. Talented journalism students met some of MCML`s junior researchers and got a glimpse of their work. The result: One article about the research of each junior member that took part at the workshop written by one journalism student. We will upload one article each Tuesday. Stay tuned for some more insights.
Sicherheit im Verkehr durch Sicherheit in den Zahlen
Die Statistikerin Lisa Wimmer beschäftigt sich im Bereich Maschinelles Lernen mit Modellvorhersagen und wie man diese nützlicher machen kann. Dafür ergänzt sie diese mit einer verlässlichen Aussage über deren statistische Sicherheit oder Unsicherheit.
Ein Computer auf vier Rädern mit viel Software: Selbstfahrende Autos bedienen sich Künstlicher Intelligenz, um beispielsweise Bewegungen von außen erkennen und rechtzeitig anhalten zu können. Dafür braucht die Software ein mathematisches Modell, das Vorhersagen treffen kann. Diese stimmen nicht immer, sie sind also mit Unsicherheit behaftet. Das Ziel ist eine möglichst verlässliche Aussage des Autos darüber, was eine Gefahr darstellt und was nicht. Denn wäre die Software übervorsichtig, würde man nie vom Fleck kommen. Gleichzeitig soll das Auto bei einem Kind abbremsen. Die Unsicherheit der Vorhersage führt schließlich zu der Entscheidung, ob das Auto bremst oder nicht. Daran forsche ich.
Unsicherheitsaussagen bekomme ich von der Posteriori-Verteilung. Das ist eine mathematische Funktion, die jeder möglichen Lösung ihre Auftrittswahrscheinlichkeit zuordnet. Diese Funktion kann man auch graphisch darstellen: In 2D sieht sie wie eine Kurve und in 3D wie eine Oberfläche aus. Wenn sich die Posteriori-Verteilung breit über den gesamten Raum erstreckt und viele kleine Hügel bildet, ist die Unsicherheit groß – viele Lösungen erscheinen wahrscheinlich. Wenn sie nur in einem kleinen Bereich einen schmalen, spitzen Hügel hat, ist die Unsicherheit klein – wenige Lösungen erscheinen wahrscheinlich.
Das Problem ist, dass ich die Posteriori-Verteilung normalerweise nicht ausrechnen und deshalb nur schwer erfassen kann. Auch ihre graphische Erscheinungsform kann sehr komplex werden und Millionen von Dimensionen mit Abermillionen von Hügeln und Tälern umfassen.
Trotzdem versuche ich als Machine Learning Data Scientist, Vorhersagen zu treffen. Das mache ich, indem ich einen funktionalen mathematischen Zusammenhang zwischen Einflussvariablen und einer Zielvariable, für die ich mich interessiere, finde. Diesen kann ich quantifizieren, also beziffern. Zum Beispiel: Wie hoch ist das erwartete Sterbealter für eine Person, die an ihrem Wohnort einer bestimmten Schadstoffbelastung ausgesetzt ist? Die Vorhersage ist hier das Sterbealter. Nehmen wir mal an, das Modell würde ein Sterbealter von 65 Jahren schätzen. Dazu möchte ich mit Hilfe der Posteriori-Verteilung auch eine Unsicherheitsaussage machen. Diese Unsicherheitsaussage wäre das Intervall, in dem sich die berechnete Sterbewahrscheinlichkeit bewegt. Dabei stellt man sich das Intervall als Bereich um den geschätzten Wert vor, beispielsweise plus/minus drei Jahre. Wenn das Intervall plus/minus zwei Jahre umfasst, dann liegt das tatsächliche Sterbealter laut dem Modell in einem engeren Wertebereich um die 65. Das bedeutet weniger Unsicherheit. Ich kann also relativ sicher sagen, dass die Person in einem Alter zwischen 63 und 67 Jahren stirbt, wenn sie an ihrem Wohnort einer bestimmten Schadstoffbelastung ausgesetzt ist.
Der Hersteller der selbstfahrenden Autos bekommt das ganze Modell, das Forschende wie ich dafür auf Basis großer Datenmengen entworfen haben. Es sieht ähnlich aus wie das menschliche Gehirn. Da kann er eine Information reinstecken. Diese wandert durch das Netz aus Neuronen und wird mit Zahlen verarbeitet, die sagen, wie diese Neuronen miteinander verbunden sind. Am Ende kommt dann eine Vorhersage mit Unsicherheitsangabe heraus.
Damit kann der Hersteller eine Software entwickeln. Diese bestimmt, wie das autonome Auto handelt. Mit der Software kann das autonome Auto besser einschätzen, ob es sich bei der Bewegung von außen um einen Menschen oder ein Blatt im Wind handelt. Daraufhin kann es entscheiden, ob es bremst oder nicht.
Lisa Wimmer promoviert am Lehrstuhl für Statistical Learning and Data Science der Ludwig-Maximilians-Universität München. Dort forscht sie im Bereich Quantifizierung von Unsicherheit bei maschinellem Lernen.
18.03.2024
Related
04.12.2024
AI and Weather Predictions
Kevin Höhlein, PhD student at TUM, applies data science and machine learning to analyze meteorological data.
28.11.2024
Enhancing the integrity of social media with AI
MCML Member Dominik Bär works within the research group of Stefan Feuerriegel at the Institute of Artificial Intelligence in Management at LMU.
©Emmy_Ljs - stock.adobe.com
26.11.2024
Artificial Intelligence as a radio host: MCML PI Sven Nyholm's comment
Our PI Sven Nyholm discusses ethical concerns surrounding an AI project, highlighting issues of consent and transparency.
©Joachim-Wendler- stock.adobe.com
25.11.2024
Fabian Theis and Xiaoxiang Zhu among the world’s most cited researchers
In a new article published by TUM, two of our PIs are recognized as being among the most cited worldwide.
25.11.2024
Meet three MCML Junior Members
In the new article by Research in Bavaria, the MCML is highlighted as a crucial part of Bavaria’s AI and machine learning research.