{"id":249897,"date":"2021-02-22T10:09:19","date_gmt":"2021-02-22T09:09:19","guid":{"rendered":"https:\/\/www.borncity.com\/blog\/?p=249897"},"modified":"2021-02-24T13:27:26","modified_gmt":"2021-02-24T12:27:26","slug":"covid-19-modelle-wenn-ein-27-jhriger-mit-ml-die-institute-schlgt","status":"publish","type":"post","link":"https:\/\/borncity.com\/blog\/2021\/02\/22\/covid-19-modelle-wenn-ein-27-jhriger-mit-ml-die-institute-schlgt\/","title":{"rendered":"Covid-19-Modelle: Wenn ein 27 J&auml;hriger mit ML die Institute schl&auml;gt"},"content":{"rendered":"<p><img loading=\"lazy\" decoding=\"async\" style=\"float: left; margin: 0px 10px 0px 0px; display: inline;\" title=\"Gesundheit\" src=\"https:\/\/borncity.com\/blog\/wp-content\/uploads\/2016\/06\/Gesundheit-2.jpg\" alt=\"Gesundheit\" width=\"60\" height=\"56\" align=\"left\" border=\"0\" \/>Ein 27 J\u00e4hriger hat sich 2020 hingesetzt und binnen einer Woche ein Vorhersagemodell f\u00fcr\u00a0 Coronavirus-Erkrankungen geschrieben. Weil sein Modell (im Gegensatz zu den Modellen von Instituten) die sp\u00e4teren Zahlen sehr genau wiedergab, ist er quasi zum \u00b4Superstar`unter den Modellierern geworden &#8211; obwohl er mit medizinischen oder Pandemie-Themen nichts am Hut hat.<\/p>\n<p><!--more--><\/p>\n<p><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/vg07.met.vgwort.de\/na\/022dd0be9f4249deafe87a82cdde59d7\" alt=\"\" width=\"1\" height=\"1\" \/>In Zeiten der Coronavirus-Pandemie kommt den Modellen zur Berechnung der Fallzahlen samt t\u00f6dlichem Ausgang eine hohe Bedeutung zu. In Deutschland findet man gelegentlich Modelle, die von Mathematikern und Forschern im Bereich Epidemologie entwickelt wurden, auf Webseiten (auch von Medien). Die Modelle sollen eine Vorhersage liefern, wie sich die Fallzahlen entwickeln &#8211; w\u00e4re dann auch eine Basis f\u00fcr politische Entscheidungen.<\/p>\n<h2>Modelle liefern falsche Zahlen<\/h2>\n<p>Das Problem: Die Modelle liefern oft irre falsche Ergebnisse und widersprechen sich &#8211; man ist also genau so schlau wie vorher. Als man im Fr\u00fchjahr 2020 versuchte, abzusch\u00e4tzen, wie gro\u00df das die Infektionszahlen mit dem Coronavirus im M\u00e4rz und April sein k\u00f6nnten, kamen h\u00e4ufig zwei Prognosesysteme, die auf Statistikmodellen basierten zum Einsatz. Eines war vom Imperial College in London entwickelt worden, das andere Modell kam vom Institute for Health Metrics and Evaluation, kurz IHME, mit Sitz in Seattle, USA.<\/p>\n<p>Das Problem: Die Modelle lieferten stark voneinander abweichende Vorhersagen. Das Modell des Imperial College in London errechnete f\u00fcr die USA bis zum Sommer bis zu 2 Millionen Covid-19-Tote. Die IHME-Prognose kam recht konservativ auf etwa 60.000 Todesf\u00e4lle bis August 2020. Aber beide Modelle lieferten keine Zahlen, die der Realit\u00e4t mit letztendlich etwa 160.000 Todesf\u00e4llen bis August 2020 f\u00fcr die USA auch nur ann\u00e4hernd nahekamen.<\/p>\n<h2>Jemand f\u00fchlt sich herausgefordert<\/h2>\n<p>Die gro\u00dfen Abweichungen in den Ergebnissen bei den Vorhersagezahlen der beiden erw\u00e4hnten Statistikmodelle fielen einem damals 26-j\u00e4hrigen Datenwissenschaftler namens Youyang Gu auf. Dieser hatte einen Master-Abschluss in Elektrotechnik und Informatik vom Massachusetts Institute of Technology (MIT) und einen weiteren Abschluss in Mathematik, aber keine formale Ausbildung in einem pandemiebezogenen Bereich wie Medizin oder Epidemiologie, wie Bloomberg <a href=\"https:\/\/www.bloomberg.com\/news\/articles\/2021-02-19\/covid-pandemic-how-youyang-gu-used-ai-and-data-to-make-most-accurate-prediction\" target=\"_blank\" rel=\"noopener\">hier schreibt<\/a>.<\/p>\n<p>Da er Modelle f\u00fcr die Finanzindustrie im Bereich Hochfrequenzhandel geschrieben hatte, griff er Mitte April 2020 das Thema Covid-19-Vorhersagen auf und schrieb quasi binnen einer Woche im Appartment seiner Eltern, in Santa Clara, Kalifornien, bei denen er noch wohnte, ein eigenes Modell.\u00a0 Das Prognosemodell war recht einfach, indem er auf die Anzahl vergangener Todesf\u00e4lle schaute, versuchte er im Modell den Verlauf zuk\u00fcnftiger Todesf\u00e4lle vorherzusagen. Denn bei seiner Analyse stellte er fest, dass viele Kenndaten\u00a0 zu Covid-19-Erkrankungen wie Covid-Tests, Krankenhausaufenthalte und anderen Faktoren durch unterschiedliche Meldesysteme in den USA zu ungenau waren (etwas, was wir in Deutschland auch kennen).<\/p>\n<p>Der gravierende Unterschied zu Statistikmodellen war aber sein Ansatz, Algorithmen des maschinellen Lernens zu verwenden, um seine Vorhersagezahlen zu verfeinern. Hier kam ihm zugute, dass er nach seinem Studium am MIT einige Jahre in der Finanzindustrie gearbeitet hatte. Dort entwickelte er Algorithmen f\u00fcr Hochfrequenz-Handelssysteme. Dort mussten die Prognosen der Modelle genau sein.<\/p>\n<p>Beim Covid-19-Modell verglich Gu seine Modellvorhersagen st\u00e4ndig mit den jeweils gemeldeten Todesf\u00e4llen ab und stimmte so seine maschinelle Lernsoftware auf die Realit\u00e4t ab. Laut Bloomberg war dies wohl vom Aufwand ein Vollzeit-Job, so dass Gu von seinen Ersparnissen lebte. Er wollte, dass seine Daten frei von jeglichen Interessenkonflikten oder politischer Voreingenommenheit sind.<\/p>\n<h2>Pr\u00e4zise Vorhersagen<\/h2>\n<p>Was f\u00fcr mich erstaunlich ist (und der Grund war, das Thema hier im Blog aufzugreifen): Die Genauigkeit der Vorhersagen, die das ML-Modell schlie\u00dflich erreichte. Auch wenn das Model nicht perfekt war, traf es bereits mit dem Start den Verlauf der realen Covid-19-Todesf\u00e4lle f\u00fcr die USA sehr genau.<\/p>\n<ul>\n<li>Ende April lag die Prognose bei 80.000 Todesf\u00e4lle bis zum 9. Mai 2020, die tats\u00e4chliche Zahl der Toten lag bei 79.926.<\/li>\n<li>Auch 90.000 vorausgesagte Todesf\u00e4lle am 18. Mai und 100.000 Todesf\u00e4lle am 27. Mai trafen die realen Todeszahlen sehr genau.<\/li>\n<\/ul>\n<p>Das konkurrierende Statistikmodell der IHME erwartete dagegen einen R\u00fcckgang der Todesf\u00e4lle, auf Grund der sozialen Distanzierung. Das Modell von Gu sagte eine zweite, gro\u00dfe Welle von Infektionen und Todesf\u00e4llen voraus, da viele Staaten nach einem Lockdown wieder ge\u00f6ffnet w\u00fcrden.<\/p>\n<p>Gu wies dann Reporter auf Twitter auf sein Modell hin und schickte E-Mails an Epidemiologen mit der Bitte, seine Zahlen zu \u00fcberpr\u00fcfen. Gegen Ende April twitterte der prominente Biologe Carl Bergstrom von der University of Washington \u00fcber Gus Modell, und nicht lange danach \u00fcbernahmen die U.S. Centers for Disease Control and Prevention Gus Zahlen auf ihre Covid-Prognose-Website. Als die Pandemie fortschritt, wurde Gu, ein chinesischer Einwanderer, der in Illinois und Kalifornien aufgewachsen ist, regelm\u00e4\u00dfig bei Treffen mit der CDC und Teams von professionellen Modellierern und Epidemiologen einbezogen. Gu wurde quasi so etwas wie der Star unter den Modellierern, was zeigt, was maschinenbasierendes Lernen eventuell zu solchen Modellen beitragen kann.<\/p>\n<p>Im November 2020 stellte Gu die Ver\u00f6ffentlichung der Todeszahlen auf Basis der Vorhersagen seines Modells auf <a href=\"https:\/\/covid19-projections.com\/\" target=\"_blank\" rel=\"noopener\">seiner Webseite<\/a> ein. Begr\u00fcndung war, dass die anderen Modelle inzwischen gen\u00fcgend genaue Vorhersagen liefern w\u00fcrden. Auf der <a href=\"https:\/\/covid19-projections.com\/germany\" target=\"_blank\" rel=\"noopener\">Seite f\u00fcr Deutschland<\/a> findet sich der Hinweis, dass die letzte Aktualisierung Anfang Oktober 2020 erfolgte. Aber man sieht eine Prognose f\u00fcr einen Anstieg (zweite Welle) f\u00fcr Ende 2020, Anfang 2021.<\/p>\n<p>Ein Modellierer mit Namen Murray vom IHME wird von Bloomberg so zitiert, dass der Grund f\u00fcr den R\u00fcckzug schlicht \"das Modell funktioniert f\u00fcr den Winter nicht sehr gut\" gewesen sei. Die maschinellen Lernmethoden, die von Gu verwendet werden, funktionieren gut bei kurzfristigen Vorhersagen, wird Murray von Bloomberg zitiert. Die Methode sei aber \"nicht sehr gut darin, zu verstehen, was im gr\u00f6\u00dferen Rahmen vor sich geht\". Die Algorithmen, die auf der Vergangenheit basieren, k\u00f6nnen keine Virusvarianten ber\u00fccksichtigen und auch nicht, wie gut Impfstoffe gegen sie wirken k\u00f6nnen oder nicht, so Murray.<\/p>\n<p>Inzwischen hat das IHME sein Modell an die Realit\u00e4t angepasst und kann den Verlauf der Covid-19-Todeszahlen auch unter Ber\u00fccksichtigung der Virus-Mutationen und Impfungen recht gut vorhersagen. Ist aber eine spannende Geschichte zu sehen, wie neue Modellierungsans\u00e4tze f\u00fcr maschinelles Lernen zur Verbesserung von Vorhersagen beitragen k\u00f6nnen. Es bleibt ein aber, denn es muss immer wieder \u00fcberpr\u00fcft werden, kann ein Modell neue Entwicklungen abdecken. Weitere Details lassen sich <a href=\"https:\/\/www.bloomberg.com\/news\/articles\/2021-02-19\/covid-pandemic-how-youyang-gu-used-ai-and-data-to-make-most-accurate-prediction\" target=\"_blank\" rel=\"noopener\">bei Bloomberg nachlesen<\/a>.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Ein 27 J\u00e4hriger hat sich 2020 hingesetzt und binnen einer Woche ein Vorhersagemodell f\u00fcr\u00a0 Coronavirus-Erkrankungen geschrieben. Weil sein Modell (im Gegensatz zu den Modellen von Instituten) die sp\u00e4teren Zahlen sehr genau wiedergab, ist er quasi zum \u00b4Superstar`unter den Modellierern geworden &hellip; <a href=\"https:\/\/borncity.com\/blog\/2021\/02\/22\/covid-19-modelle-wenn-ein-27-jhriger-mit-ml-die-institute-schlgt\/\">Weiterlesen <span class=\"meta-nav\">&rarr;<\/span><\/a><\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[7459],"tags":[3836],"class_list":["post-249897","post","type-post","status-publish","format-standard","hentry","category-software","tag-software"],"_links":{"self":[{"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/posts\/249897","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/comments?post=249897"}],"version-history":[{"count":0,"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/posts\/249897\/revisions"}],"wp:attachment":[{"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/media?parent=249897"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/categories?post=249897"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/tags?post=249897"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}