18.03.2024

Teaser image to Get to know MCML Junior Member Lisa Wimmer

Get to know MCML Junior Member Lisa Wimmer

Created during the first MCMLxDJS-Workshop

In the field of machine learning, MCML Junior Member Lisa Wimmer deals with model predictions and how they can be made more useful. Her main research focus is on the quantification of uncertainty.

This article was written by Celine Schuster from the Deutsche Journalistenschule (DJS). It was created in a workshop together with DJS. Talented journalism students met some of MCML`s junior researchers and got a glimpse of their work. The result: One article about the research of each junior member that took part at the workshop written by one journalism student. We will upload one article each Tuesday. Stay tuned for some more insights.


Sicherheit im Verkehr durch Sicherheit in den Zahlen

Die Statistikerin Lisa Wimmer beschäftigt sich im Bereich Maschinelles Lernen mit Modellvorhersagen und wie man diese nützlicher machen kann. Dafür ergänzt sie diese mit einer verlässlichen Aussage über deren statistische Sicherheit oder Unsicherheit.

Ein Computer auf vier Rädern mit viel Software: Selbstfahrende Autos bedienen sich Künstlicher Intelligenz, um beispielsweise Bewegungen von außen erkennen und rechtzeitig anhalten zu können. Dafür braucht die Software ein mathematisches Modell, das Vorhersagen treffen kann. Diese stimmen nicht immer, sie sind also mit Unsicherheit behaftet. Das Ziel ist eine möglichst verlässliche Aussage des Autos darüber, was eine Gefahr darstellt und was nicht. Denn wäre die Software übervorsichtig, würde man nie vom Fleck kommen. Gleichzeitig soll das Auto bei einem Kind abbremsen. Die Unsicherheit der Vorhersage führt schließlich zu der Entscheidung, ob das Auto bremst oder nicht. Daran forsche ich.

Unsicherheitsaussagen bekomme ich von der Posteriori-Verteilung. Das ist eine mathematische Funktion, die jeder möglichen Lösung ihre Auftrittswahrscheinlichkeit zuordnet. Diese Funktion kann man auch graphisch darstellen: In 2D sieht sie wie eine Kurve und in 3D wie eine Oberfläche aus. Wenn sich die Posteriori-Verteilung breit über den gesamten Raum erstreckt und viele kleine Hügel bildet, ist die Unsicherheit groß – viele Lösungen erscheinen wahrscheinlich. Wenn sie nur in einem kleinen Bereich einen schmalen, spitzen Hügel hat, ist die Unsicherheit klein – wenige Lösungen erscheinen wahrscheinlich.

Das Problem ist, dass ich die Posteriori-Verteilung normalerweise nicht ausrechnen und deshalb nur schwer erfassen kann. Auch ihre graphische Erscheinungsform kann sehr komplex werden und Millionen von Dimensionen mit Abermillionen von Hügeln und Tälern umfassen.

Trotzdem versuche ich als Machine Learning Data Scientist, Vorhersagen zu treffen. Das mache ich, indem ich einen funktionalen mathematischen Zusammenhang zwischen Einflussvariablen und einer Zielvariable, für die ich mich interessiere, finde. Diesen kann ich quantifizieren, also beziffern. Zum Beispiel: Wie hoch ist das erwartete Sterbealter für eine Person, die an ihrem Wohnort einer bestimmten Schadstoffbelastung ausgesetzt ist? Die Vorhersage ist hier das Sterbealter. Nehmen wir mal an, das Modell würde ein Sterbealter von 65 Jahren schätzen. Dazu möchte ich mit Hilfe der Posteriori-Verteilung auch eine Unsicherheitsaussage machen. Diese Unsicherheitsaussage wäre das Intervall, in dem sich die berechnete Sterbewahrscheinlichkeit bewegt. Dabei stellt man sich das Intervall als Bereich um den geschätzten Wert vor, beispielsweise plus/minus drei Jahre. Wenn das Intervall plus/minus zwei Jahre umfasst, dann liegt das tatsächliche Sterbealter laut dem Modell in einem engeren Wertebereich um die 65. Das bedeutet weniger Unsicherheit. Ich kann also relativ sicher sagen, dass die Person in einem Alter zwischen 63 und 67 Jahren stirbt, wenn sie an ihrem Wohnort einer bestimmten Schadstoffbelastung ausgesetzt ist.

Der Hersteller der selbstfahrenden Autos bekommt das ganze Modell, das Forschende wie ich dafür auf Basis großer Datenmengen entworfen haben. Es sieht ähnlich aus wie das menschliche Gehirn. Da kann er eine Information reinstecken. Diese wandert durch das Netz aus Neuronen und wird mit Zahlen verarbeitet, die sagen, wie diese Neuronen miteinander verbunden sind. Am Ende kommt dann eine Vorhersage mit Unsicherheitsangabe heraus.

Damit kann der Hersteller eine Software entwickeln. Diese bestimmt, wie das autonome Auto handelt. Mit der Software kann das autonome Auto besser einschätzen, ob es sich bei der Bewegung von außen um einen Menschen oder ein Blatt im Wind handelt. Daraufhin kann es entscheiden, ob es bremst oder nicht.

Lisa Wimmer promoviert am Lehrstuhl für Statistical Learning and Data Science der Ludwig-Maximilians-Universität München. Dort forscht sie im Bereich Quantifizierung von Unsicherheit bei maschinellem Lernen.

18.03.2024


Related

Link to Causal AI in the field of diagnosis and therapy

22.04.2024

Causal AI in the field of diagnosis and therapy

LMU Newsroom article about the research of our PI Stefan Feuerriegel in the field of AI in diagnosis and therapy


Link to Get to know MCML Junior Member Lukas Gosch

08.04.2024

Get to know MCML Junior Member Lukas Gosch

Article by Jonas Grimm (DJS) about MCML Junior Member Lukas Gosch who conducts research on how quickly - or slowly - AI algorithms react to changes.


Link to Get to know MCML Junior Member Maximiliane Windl

02.04.2024

Get to know MCML Junior Member Maximiliane Windl

Article by Lennart Glaser (DJS) about MCML Junior Member Maximiliane Windl, who Maximiliane Windl researches data privacy in ubiquitous computing systems.


Link to Get to know MCML Junior Member Leon Hetzel

26.03.2024

Get to know MCML Junior Member Leon Hetzel

Article by Leonie Fischer (DJS) about MCML Junior Member Leon Hetzel, who developed an algorithm to significantly increase the efficiency of drug production


Link to Get to know MCML Junior Member Martin Binder

11.03.2024

Get to know MCML Junior Member Martin Binder

Article by Caroline Drees (DJS) about MCML Junior Member Martin Binder, who improves algorithms and makes them easily accessible to everyone.