18.03.2024

Teaser image to Get to know MCML Junior Member Lisa Wimmer

Get to know MCML Junior Member Lisa Wimmer

Created during the first MCMLxDJS-Workshop

In the field of machine learning, MCML Junior Member Lisa Wimmer deals with model predictions and how they can be made more useful. Her main research focus is on the quantification of uncertainty.

This article was written by Celine Schuster from the Deutsche Journalistenschule (DJS). It was created in a workshop together with DJS. Talented journalism students met some of MCML`s junior researchers and got a glimpse of their work. The result: One article about the research of each junior member that took part at the workshop written by one journalism student. We will upload one article each Tuesday. Stay tuned for some more insights.


Sicherheit im Verkehr durch Sicherheit in den Zahlen

Die Statistikerin Lisa Wimmer beschäftigt sich im Bereich Maschinelles Lernen mit Modellvorhersagen und wie man diese nützlicher machen kann. Dafür ergänzt sie diese mit einer verlässlichen Aussage über deren statistische Sicherheit oder Unsicherheit.

Ein Computer auf vier Rädern mit viel Software: Selbstfahrende Autos bedienen sich Künstlicher Intelligenz, um beispielsweise Bewegungen von außen erkennen und rechtzeitig anhalten zu können. Dafür braucht die Software ein mathematisches Modell, das Vorhersagen treffen kann. Diese stimmen nicht immer, sie sind also mit Unsicherheit behaftet. Das Ziel ist eine möglichst verlässliche Aussage des Autos darüber, was eine Gefahr darstellt und was nicht. Denn wäre die Software übervorsichtig, würde man nie vom Fleck kommen. Gleichzeitig soll das Auto bei einem Kind abbremsen. Die Unsicherheit der Vorhersage führt schließlich zu der Entscheidung, ob das Auto bremst oder nicht. Daran forsche ich.

Unsicherheitsaussagen bekomme ich von der Posteriori-Verteilung. Das ist eine mathematische Funktion, die jeder möglichen Lösung ihre Auftrittswahrscheinlichkeit zuordnet. Diese Funktion kann man auch graphisch darstellen: In 2D sieht sie wie eine Kurve und in 3D wie eine Oberfläche aus. Wenn sich die Posteriori-Verteilung breit über den gesamten Raum erstreckt und viele kleine Hügel bildet, ist die Unsicherheit groß – viele Lösungen erscheinen wahrscheinlich. Wenn sie nur in einem kleinen Bereich einen schmalen, spitzen Hügel hat, ist die Unsicherheit klein – wenige Lösungen erscheinen wahrscheinlich.

Das Problem ist, dass ich die Posteriori-Verteilung normalerweise nicht ausrechnen und deshalb nur schwer erfassen kann. Auch ihre graphische Erscheinungsform kann sehr komplex werden und Millionen von Dimensionen mit Abermillionen von Hügeln und Tälern umfassen.

Trotzdem versuche ich als Machine Learning Data Scientist, Vorhersagen zu treffen. Das mache ich, indem ich einen funktionalen mathematischen Zusammenhang zwischen Einflussvariablen und einer Zielvariable, für die ich mich interessiere, finde. Diesen kann ich quantifizieren, also beziffern. Zum Beispiel: Wie hoch ist das erwartete Sterbealter für eine Person, die an ihrem Wohnort einer bestimmten Schadstoffbelastung ausgesetzt ist? Die Vorhersage ist hier das Sterbealter. Nehmen wir mal an, das Modell würde ein Sterbealter von 65 Jahren schätzen. Dazu möchte ich mit Hilfe der Posteriori-Verteilung auch eine Unsicherheitsaussage machen. Diese Unsicherheitsaussage wäre das Intervall, in dem sich die berechnete Sterbewahrscheinlichkeit bewegt. Dabei stellt man sich das Intervall als Bereich um den geschätzten Wert vor, beispielsweise plus/minus drei Jahre. Wenn das Intervall plus/minus zwei Jahre umfasst, dann liegt das tatsächliche Sterbealter laut dem Modell in einem engeren Wertebereich um die 65. Das bedeutet weniger Unsicherheit. Ich kann also relativ sicher sagen, dass die Person in einem Alter zwischen 63 und 67 Jahren stirbt, wenn sie an ihrem Wohnort einer bestimmten Schadstoffbelastung ausgesetzt ist.

Der Hersteller der selbstfahrenden Autos bekommt das ganze Modell, das Forschende wie ich dafür auf Basis großer Datenmengen entworfen haben. Es sieht ähnlich aus wie das menschliche Gehirn. Da kann er eine Information reinstecken. Diese wandert durch das Netz aus Neuronen und wird mit Zahlen verarbeitet, die sagen, wie diese Neuronen miteinander verbunden sind. Am Ende kommt dann eine Vorhersage mit Unsicherheitsangabe heraus.

Damit kann der Hersteller eine Software entwickeln. Diese bestimmt, wie das autonome Auto handelt. Mit der Software kann das autonome Auto besser einschätzen, ob es sich bei der Bewegung von außen um einen Menschen oder ein Blatt im Wind handelt. Daraufhin kann es entscheiden, ob es bremst oder nicht.

Lisa Wimmer promoviert am Lehrstuhl für Statistical Learning and Data Science der Ludwig-Maximilians-Universität München. Dort forscht sie im Bereich Quantifizierung von Unsicherheit bei maschinellem Lernen.

18.03.2024


Related

Link to AI and Weather Predictions

04.12.2024

AI and Weather Predictions

Kevin Höhlein, PhD student at TUM, applies data science and machine learning to analyze meteorological data.


Link to Enhancing the integrity of social media with AI

28.11.2024

Enhancing the integrity of social media with AI

MCML Member Dominik Bär works within the research group of Stefan Feuerriegel at the Institute of Artificial Intelligence in Management at LMU.


Link to Artificial Intelligence as a radio host: MCML PI Sven Nyholm's comment

26.11.2024

Artificial Intelligence as a radio host: MCML PI Sven Nyholm's comment

Our PI Sven Nyholm discusses ethical concerns surrounding an AI project, highlighting issues of consent and transparency.


Link to Fabian Theis and Xiaoxiang Zhu among the world’s most cited researchers

25.11.2024

Fabian Theis and Xiaoxiang Zhu among the world’s most cited researchers

In a new article published by TUM, two of our PIs are recognized as being among the most cited worldwide.


Link to Meet three MCML Junior Members

25.11.2024

Meet three MCML Junior Members

In the new article by Research in Bavaria, the MCML is highlighted as a crucial part of Bavaria’s AI and machine learning research.