Das Corona Ziegenproblem

in #deutsch2 months ago (edited)

Wir schreiben das Jahr 1991. Damals war die Welt in heller Aufruhr wegen dem sogenannten Ziegenproblems. Heute ist die Welt in Aufruhr wegen Corona.

In diesem Artikel möchte ich euch zeigen, dass beides eng miteinander zu tun hat. Hierfür brauchen wir aber Mathematik und als wäre dies nicht schon schlimm genug benötigen wir sogar noch Stochastik.

Ich werde mich nicht zu tief in die Welt der Mathematik begeben, damit es auch noch für andere Menschen verständlich bleibt. Auch verzichte ich auf übermäßig viele Fachbegriffe. Seien es medizinische oder mathematische. Dennoch kann ich mir die nötige Mathematik nicht verkneifen.

Ziel der nachfolgenden Ausführung ist die Betrachtung des sogenannten Falsch-Positiv-Phänomens bei medizinischen Tests. Schlägt zum Beispiel ein PCR Test für Corona positive aus, heißt dies noch lange nicht, dass der getestete auch wirklich mit Corona infiziert ist. Wir werden später noch sehen, dass diese Wahrscheinlichkeit überraschend hoch sein kann. Dies ist ein mathematisches Phänomen, welches empirisch messbar ist.

Um dem Mysterium auf die Schliche zu kommen, brauchen wir bedingte Wahrscheinlichkeiten. Leider haben es bedingte Wahrscheinlichkeiten so an sich, dass der schein oft trügerisch ist. Die meisten Menschen würde aus ihrem Bauchgefühl heraus vermutlich oft falsch liegen. Daher sollten wir einen genauren Blick auf die Sache werfen.

Bedingte Wahrscheinlichkeiten

In der Stochastik gibt es verschiedene Modelle Wahrscheinlichkeiten zu berechnen. Über Wahrscheinlichkeitsräume möchte ich hier aber nicht weiter ins Detail gehen. Wir wollen schließlich noch auf den Punkt kommen.

Bedingte Wahrscheinlichkeiten lassen sich wie folgt definieren:



P(A|B) meint die Wahrscheinlichkeit, dass das Ereignis A eintritt und der Bedingung B. Die Wahrscheinlichkeit im Zähler beschreibt die Wahrscheinlichkeit, dass A und B eingetreten sind und der Nenner steht für die Wahrscheinlichkeit für B. Natürlich dürfen wir never ever durch 0 teilen und daher ist P(B)>0.

Es genügt uns also nicht, dass wir die Wahrscheinlichkeit für das eintreten von A und B kennen. Offenbar kann die Wahrscheinlichkeit durch die Zusatzinformation B beeinflusst werden.

Häufig wird in diesem Zusammenhang noch der Satz von Bayes mit ins Spiel gebracht. Zwar lässt sich die Falsch-Positiv-Wahrscheinlichkeit mit diesen berechnen, aber es reicht auch die Definition für bedingte Wahrscheinlichkeiten für die Modellierung des Problems aus. 1

Das Ziegenproblem

Um schon mal einen Vorgeschmack auf das Falschliegen der Intuition der meisten Menschen zu bekommen, beginnen wir mit dem Ziegenproblem.

Vielleicht kennt ihr noch die Sendung "Geh aufs Ganze". Die Sendung hat ihr Vorbildung in der amerikanischen Sendung "Make a Deal".

In der Sendung hatte der Kandidat die Auswahl zwischen 3 Türen.



Quelle: Wikipedia

Hinter 2 Türen befindet sich eine Ziege und hinter einer 3. Tür ein Auto.

Der Kandidat entscheidet sich zu Beginn für eine der 3 Türen. Anschließend öffnet der Moderator eine Tür, welche der Kandidat nicht gewählt hat und hinter der sich kein Auto befindet. Nun muss sich der Kandidat entscheiden, ob er bei der ursprünglichen Wahl bleibt oder zu der einzig verbleibenden Tür wechselt.

1991 wurde die von Marylon vos Savant in ihrer Kolumne "Ask Marylin" (Dr. Sommer für Intellektuelle ;) im Wochenmagazin "Parade" gefragt, ob es besser sei bei der ursprünglichen Wahl zu bleiben oder lieber zu wechseln.

Der Aufmerksamer Leser mag jetzt vielleicht meinen, dass es doch egal sei, ob man wechsle. Schließlich wird doch wohl die Wahrscheinlichkeit 0,5 sein.

Marylon vos Savant war da anderer Meinung. Sie behauptete die Wahrscheinlichkeit beim Wechsel zu gewinnen sei 2/3.

Diese Antwort entfachte einen gigantischen Shitstorm, wie wir heute sagen würden. 90% der Zuschriften an die Kolumne waren anderer Meinung. Darunter befanden sich viele Akademiker und Mathematiker. Das ganze löste sogar ein Medienecho aus, welches bis heute nachhalt.

Sicher können es auch einige von euch nicht fassen. Man könnte "Leugner" jetzt mit Simulationen langweilen etc.. Ich würde euch gerne die meiner Meinung nach einfachste Erklärung liefern.

Unter Schülern hat man eine Untersuchung bzgl. des Ziegenproblems gemacht. Dabei hat die überwältigende Mehrheit erwartungsgemäß die falsche Antwort gegeben. Es gab aber auch einige Wenige, welche die richtige Antwort wussten. Lustigerweise waren dies eher Sekundarstufe 1 Schüler.

Diese hat man gefragt, wie sie auf die richtige Antwort gekommen sind. Die meisten haben eine feste Konfiguration angenommen und die Perspektive des Moderators eingenommen.

Nehmen wir o.B.d.A. an dass wir folgende Konfiguration haben: A, Z, Z

Würde der Kandidat Tür 1 wählen, kann der Moderator Tür 2 oder 3 öffnen. Wechselt nun der Kandidat, verliert er.

Wählt Kandidat Tür 2, muss der Moderator Tür 3 öffnen und beim Wechseln gewinnt der Kandidat. Analog verhält es sich, falls der Kandidat Tür 3 wählen würde.

Folglich ist die Wahrscheinlichkeit beim Wechseln zu gewinnen 2/3, da man in 2 von 3 Fällen gewinnen würde. 1,2,3,4,5

Das Falsch-Positiv-Phänomen

Wie schon erwähnt können bedingte Wahrscheinlichkeiten überraschende Ergebnisse liefern, die vielleicht einige nicht glauben, da sie ihrer Intuition widersprechen. So wie beim Ziegenproblem werden wir auch hier ein Überraschung erleben.

Damit unser Ergebnis besonder überraschend ist, gehen wir von einem sehr guten PCR Test aus und einer relativen hohen Durchseuchungsrate. Werden wir stochastisch.

Medizinische Tests haben 2 bedingte Wahrscheinlichkeiten, die wir brauchen werden - die Spezifität und die Sensitivität.

Sei K das Ereignis krank zu sein und N die Wahrscheinlichkeit ein negatives Testergebnis zu erhalten. Die Negation wird nachfolgend mit einem Oberstrich dargestellt.

P(K) sei die sogenannte Durchseuchungsrate, d.h. die Wahrscheinlichkeit in der deutschen Bevölkerung mit Corona infiziert zu sein.

Die Spezifität ist die Wahrscheinlichkeit, dass eine gesunde Person als gesund erkannt wird. Folglich ist dies bedingte Wahrscheinlichkeit ein negatives Testergebnis zu erhalten unter der Bedingung gesund zu sein. Analog ist die Sensitivität die bedingte Wahrscheinlichkeit ein positives Testergebnis zu erhalten unter der Bedingung krank zu sein.

Wir gehen nun von einer Durchseuchungsrate von 0,022 (2,2%), einer Spezifität von 0,95 und von einer Sensitivität von 0,98 aus.



Mit GeoGebra erstellt

Jetzt müssen wir unsere Definition für bedingte Wahrscheinlichkeiten anwenden. Wir wollen nämlich jetzt die Wahrscheinlichkeit berechnen, dass ein Getesteter nicht krank ist unter der Bedingung, dass der Test positiv ausfällt.



Mit GeoGebra erstellt

0,694 bedeutet also, dass die Wahrscheinlichkeit für einen Falsch-Positv-Test bei ca. 69,4% liegt. Wie versprochen ist dieses Ergebnis sehr überraschend. Wie lässt sich dies erklären?

Aufgrund der geringen Durchseuchungsrate sind auch sehr wenige positive Tests zu erwarten. Dies führt dazu, dass die Fehlerquoten des PCR Tests starke Auswirkungen haben, selbst bei einer minimalen Fehlerquote eines Tests.

Um das zu visualisieren, habe ich das Ganze mal mit einer variablen Durchseuchungsrate geplottet.



Mit GeoGebra erstellt

Wir sehen also, dass mit abnehmender Durchseuchungsrate der Falsch-Positiv-Fehler massiv zunimmt.

Ein häufiges Argument ist, dass sich diese Problematik mit Mehrfachtest beheben ließe. Ob in Praxis mehrfach getestet wird und wenn ja wie viel kann ich nicht beantworten, insbesondere in der internationalen Betrachtet. Aber Mathematiker interessieren weniger für die Realität, auch wenn wir stets nach Modell suchen. 1,6

Die Lösung der Mehrfachtests?

Ich werde nun die Mehrfachtests modellieren. Natürlich gelten unsere Überlegungen nur im Modell und entsprechen nicht der Realität. Beispielweise könnte der PCR Test schlechter sein als angenommen, es wird nicht zwischen symptomatisch und asymptomatisch differenziert, der Test könnte falsch durchgeführt worden sein oder es könnten 1-2 Wochen Abstand zwischen 2 Tests liegen.

Für unsere Modellierung stellen wir uns einmal vor, wir würden alle Menschen, die wir getestet haben, nochmal testen. Seien dies im Folgenden T Menschen. Unsere Wahrscheinlichkeit, welche in der Beispielrechnung 0,694 war, sei F1.

Offenbar wären unter den T positiv getesteten T.F1 gesunde zu erwarten und T.(1-F1) kranke. Für T=1000 und F1=0,694 hätte man beispielsweise 306 kranke und 694 gesunde und eine Durchseuchungsrate von 1-F1=0,306.

Wenn wir nun die neue Falsch-Positiv-Wahrscheinlichkeit F2 berechnen analog zu F1, ergibt sich F2=0,104.

Das Interessante ist, dass nun die neue Durchseuchungsrate 1-F2 ist. Mit jedem zusätzlichen Test den wir machen, würde also die Durchseuchungsrate sukzessiv abnehmen und damit die Falsch-Positiv-Wahrscheinlichkeit signifikant reduziert werden.

Leider ist es nicht transparent im welchen Umfang Mehrfachtests durchgeführt werden und ob jeder "Infizierte" und Verstorbene auch mehrfach getestet wird.

Quellen

  1. Nobert Henze, Stochastik für Einsteiger: Eine Einführung in die faszinierende Welt des Zufalls, 8. Auflage
  2. https://de.wikipedia.org/wiki/Ziegenproblem
  3. https://de.wikipedia.org/wiki/Geh_aufs_Ganze!
  4. Image: https://images.hive.blog/0x0/https://de.wikipedia.org/wiki/Ziegenproblem#/media/Datei:Monty_open_door.svg
  5. https://www.zeit.de/2004/48/N-Ziegenproblem
  6. https://www.uni-bonn.de/neues/111-2020
Sort:  

Sollte jeder, der über die Thematik urteilt oder sogar entscheidet (Politiker) lesen! BGvB.

Werfe mal einen Blick in dein Wallet.

Danke-alles angekommen-infos folgen nach meinem Urlaub!

Für die Wiedereinführung der !BEER okratie!

Ich habe heute eine hoch-philosophischen Text zu dieser Thematik im weitesten Sinne verfasst. BGvB.


Hey @balte, here is a little bit of BEER from @kaeptn-iglo for you. Enjoy it!

Learn how to earn FREE BEER each day by staking your BEER.

Super Artikel, ich kannte zwar das Ziegenproblem noch aus der Schule, aber ich hatte mir über die falsch positiven nicht wirklich Gedanken gemacht bislang. Hast du eine Ahnung ob deine Annahmen für Sensitivität und Spezifität realistisch sind?
Ich würde deswegen jetzt aber trotzdem nicht ableiten, dass man Dinge ganz anders machen soll. Auch wenn die Werte etwas niedriger sind, die Dynamik bleibt ja die gleiche in etwa.

Soweit ich weiß schwanken die Angaben zwischen 80%-99,4% für Sensitivität und Spezifität.

Im Lehrbuch Beispiel nimmt man oft 99.8% für beides an und hat das Problem trotzdem. Z. B. liegt der Fehler beim HIV Test ca. bei 60%. Sobald die Durchsuchungsrate klein ist, hat man das Problem immer egal wie gut der Test ist, außer wir würden über einen 100% reden.

Die Durchsuchungsrate würde sich aber vermutlich stark erhöhen, wenn man z. B. eher symptomatisch Menschen oder starke Verdachtsfälle testen würde. Ich gehe von zufällig getestet aus. Und wie im Post angesprochen haben auch Mehrfachtests einen signifikanten Einfluss.

Posted using Dapplr

Sensationeller Beitrag und de facto nicht widerlegbar. Zur Untermauerung deines Beitrags verweise ich auf die Studie eines Professors aus Bremen, welcher sich intensiv mit diesem Phänomen auseinandersetzte und auf MINDESTENS 75% Falsch-Positiv Getestete kommt.

LG

Gute Artikel - hast Dir viel Mühe gegeben.

Mach doch einfach mal einen Crosspost in die Corona Community

https://hive.blog/trending/hive-129768

Resteem und upvote!

Danke!

Good work. Our leaders disregard falsch positivs and false negatove comepletely. Nor do they say positiv can also mean (infected in the past; not infected at all; very small amount of virus ); US reaearchers and German professors warn for wrong conclusions but state virologists deny everything

From my perspective false positiv is a well known phenomenon, but governments and medias don't talk a lot about it. I miss a clear transparency. Is a infected one really infected or is he just positiv? Is it common sense to make more than one test? And how is the handling in different countries?

Posted using Dapplr

Klarer Rehive :-)

Dieser Artikel ist klasse....@der-prophet muss das unbedingt lesen

Danke

Posted using Dapplr

Ich glaube keiner Statistik, die ich nicht selbst gemessen und damit falsch gemacht habe. ^^

Danke für die Aufklärung aus wissenschaftlicher Sicht!

Mit oder ohne Fälschung es gibt halt immer überraschend viele falsch-positve Corona Ziegen bei geringer Durchseuchung und bei nur einmaligen Testen 🤓

Posted using Dapplr

Ich bin übrigens direkt nach deinem Artikel böse wie ich bin einfach mal ohne Maulkorb einkaufen gegangen.

Im Rewe

Rappelvoll

Keiner!

hat was gesagt oder auch nur böse geguggt, zumindest nicht erkennbar, vielleicht auch wegen den Masken.

An der Kasse wurde ich mit meinem durch Bitcoin bezahlten Gutschein sogar gefragt, ob ich das öfter machen und warum. Ich habe erklärt, (ohne Maske mit ner Riesenschlange an der Kasse) das ich meinen Lohn in BTC beziehe und damit eben einfach Gutscheine kaufen kann. Neugierig, sind die Leute gewesen, und es scheint nichts ausgemacht zu haben, das ich mich nicht im Gesicht bekleide.

Ich finde das gut und werde es weiter machen.

LG
Sascha

Das mit dem Gutschein finde ich höchst interessant ;).

Bekommt man da einen Code. Weil ich hatte auch mal überlegt mir so einen Gutschein zu holen. Bin dann auf einen Amazon Gutschein ausgewichen.

https://www.bitrefill.com/buy

Scheiß auf Amazon. :-)

DAS meintest du wohl. Sehr interessant. Danke für die Arbeit... Obwohl ich da aussteige. Das Glauben basiert dann auf Vertrauen. Aber ich bin mir des Umstands bewusst und glaube dir.

Toller Artikel! Das Lesen war eine Freude 👍

Danke. Scheint mir als hättest du einen nervigen Bot von SC auf den Fersen. Hatte auch mal das "Vergnügen" mit dem Keck Bot

Posted using Dapplr

Ja, total nervig. Wie bist Du den los geworden. In den Discord lassen sie mich gar nicht erst rein um meinen Fall darzulegen...

Jemand mit mehr SP als ich hat bei SC etwas auf den Tisch gehauen. Ansonsten wäre wohl Mack Bot auf Lebenszeit am Flaggen gewesen.

Posted using Dapplr

Congratulations @quekery! You have completed the following achievement on the Hive blockchain and have been rewarded with new badge(s) :

You published more than 60 posts. Your next target is to reach 70 posts.

You can view your badges on your board And compare to others on the Ranking
If you no longer want to receive notifications, reply to this comment with the word STOP

Do not miss the last post from @hivebuzz:

Project Activity Update
The Customization Guide for the HiveBuzz store

Ich hatte vor ein paar Jahren mal einen wohlgemerkt Grundschul-Mathelehrer am Telefon
welcher sowohl den Lernstand meines Sohnes bemängelte und auch mir eine mangelnde unterstützung bezüglich Mathe anhängen wollte ;-)
Hatte dem Lehrer dann mal eine einfache Aufgabe am mündlich am Telefon gestellt ;-)

Wieviel ist die Wurzel aus 84256000 zum Quadrat?

Antwort des Mathelehrer!

Da muss ich erstmal meinen Taschenrechner holen :-)

Auflösung: die Wurzel zum Quadrat hebt sich auf!

Ich hatte dann das Gespräch auch schnell mit dem Mathelerer beendet ;-)

Das ist ja schlimmer als die Additionskünste der ehemaligen Bildungsministerin, die schon an kleinen Additionen scheiterte und das wohl auch als unproblematisch empfand.

Manchmal sieht man den Wald aber auch vor lauter Bäumen nicht. Dennoch eine schmerzhafte Geschichte 😂

Posted using Dapplr

Jeder so gut wie er kann!
Der Lehrer hat von mir 6 und setzen bekommen !
und Sohnemann in SEK1 von 3 auf 2 verbessert trotz Corona!
Lags am Homscholing oder wie heist das ? ;-)

Jetzt melden sich gleich Deutsch und Englichlehrer bei mir :-)))

HI @querkery,

Die Spezifität ist die Wahrscheinlichkeit, dass eine gesunde Person als gesund erkannt wird. Folglich ist dies bedingte Wahrscheinlichkeit ein negatives Testergebnis zu erhalten unter der Bedingung gesund zu sein. Analog ist die Sensitivität die bedingte Wahrscheinlichkeit ein positives Testergebnis zu erhalten unter der Bedingung krank zu sein.

Beachte bitte, dass die Testsspezifität und Sensitivität bei solchen Untersuchungen in vitro, d.h. im Labor bestimmt wird.

Gruß

Ja, ich überlege das Problem noch mal etwas genauer aufzuschlüsseln. Dann man ja mit P(...|...) nur so um sich wirft. Komme mit deinen Zahlen btw. auch auf knapp 80% falsch positiv. Dr. Schwarz spricht sogar von 90%.

Der Youtube Kanal mailab behauptet übrigens, dass man mittlerweile Tests mit 100%iger Spezifität hätte und daher das Falsch-Positiv-Problem nicht mehr relevant sei.

Hi @quekery,

Der Youtube Kanal mailab behauptet übrigens, dass man mittlerweile Tests mit 100%iger Spezifität hätte und daher das Falsch-Positiv-Problem nicht mehr relevant sei.

Um ehrlich zu sein glaube ich ihr das sogar. Ich habe in meinem Leben tausende von PCRs gefahren und hunderte eigene Strategien entwickelt. Du kannst in der Tat auch sehr zuverlässige PCR-Tests bauen.

Allerdings sagen die 100% so gut wie nix aus, denn erstens gehen auch hier mal Analysen schief. Dies weiß jeder, der wissenschaftlich arbeitet, das ist eine Arte Naturkonstante: Jede Messung hat ihre Fehler und wer einmal mißt mißt Mist.

Zweitens blenden die Leute in ihrer Argumentation immer einen entscheidenden Punkt aus: Wenn ich einen Bluttest auf einen x-beliebigen Krebs entwickle, dann kann ich nach erfolgter Diagnose im Patienten nachschauen, diesen Krebs als Bestätigung auch finden und damit den Test in vivo verifizieren. Bei Corona klappt dies aber nicht. Du kannst diese Bestätigung nicht vornehmen. Vor allem nicht, wenn viele Leute symptomlos sind.

Zusätzlich muss klar definiert sein wie die Entwickler eine 100% Spezifität gewährleisten. Was habe ich als Kontrolle verwendet? Patienten können es ja kaum sein, denn hier ist ein eindeutiger COVID19-Nachweis sehr schwammig. Also eiche ich den Test anhand von Negativkontrollen. Und was nehme ich da??? HIV-Viren? Andere Corona-Viren? Habe ich alle Möglichkeiten voll ausgeschöpft??? Es ist unmöglich diesen Test als 100% spezifisch auszuweisen, denn dann müsstest du alle möglichen Aspekte des menschlichen Lebens gegenchecken. D.h. diese Frau von der du da redest wird keinesfalls lügen und auch die Leute, die ihr das erzählt haben lügen nicht, denn im Rahmen ihrer Testentwicklung, mit ihren Kontrollen ist alles richtig gelaufen. Nur eben, dass die Aussage keine Allgemeingültigkeit besitzt.

Letztlich kommt eben auch hinzu, dass mit einer PCR nur die Sequenz des Virengenoms vermehrt wird. Was sagt dies??? Erstmal nix, denn es können ja auch Trümmer von Viren sein, die das Immunsystem schon längst entfernt hat. Ich störe mich daher an solchen Bezeichnungen wie "Infizierte", sowas kann man mit einem derartigen Test gar nicht liefern. Das kann nur ein Arzt mit einer klaren Diagnostik, wie im obigen Beispiel bei Krebs tun. Und hier beißt sich die Katze wieder in den Schwanz, denn dies ist bei COVID eben nicht möglich.

Zusätzlich ist teilweise der Fehler der bisher gelaufenen Tests größer als das Auftreten in der Bevölkerung. Ich denke das muss ich jetzt nicht weiter ausführen, aber jedem sollte klar sein, dass wenn der Fehler eines Nachweises größer ist die Häufigkeit des nachzuweisenden Ereignisses selbst, eine Einstufung eines Nachweises als "einwandfrei" nicht möglich ist. Es ist lediglich ein Anhaltspunkt für weitere Analysen und keine allumfassende Superwahrheit.

O.k., ich denke das reicht an der Stelle. Darf ich noch kurz fragen was du beruflich machst? Bestimmt etwas Richtgung STEM oder?

Hoffen wir, dass bald wieder alle vernünftig werden, weil ansonsten haben wir es hier mit dem größten Wissenschaftsbetrug der Geschichte zu tun.

Beste Grüße

Chapper

Loading...