bedingte Wahrscheinlichkeit < Wahrscheinlichkeitstheorie < Stochastik < Hochschule < Mathe < Vorhilfe
|
Aufgabe | DNA-Test: Am Tatort wird eine DNA-Probe sichergestellt. Von 1 Million Menschen hat statistisch gesehen nur einer ein DNA-Profil, das mit dieser Probe übereinstimmt. Nun wird ein DNA-Test an n Verdächtigen durchgeführt. Die Wahrscheinlichkeit, dass der Test irrt, ist 0.001%.
Der Test bei Mr. X ist positiv, und er ist einer von n = 20 möglichen Tätern. Wie groß ist die Wahrscheinlichkeit, dass Mr. X unschuldig ist? |
Hallo,
die offizielle Lösung lautet 0,019%.
Kann mir jemand sagen, ob mein Lösungsweg korrekt ist. Ich komme zumindest auf "so ziemlich" das gleiche Ergebnis (mit mehr Nachkommastellen):
POS .. Der DNA-Test schlägt positiv an.
S .. Die Person ist schuldig.
Dann ist [mm] gesucht:P(\overline{S}|POS)
[/mm]
Es gilt [mm] P(\overline{S}|POS) [/mm] = [mm] \bruch{P(\overline{S} \cap POS)}{P(POS)}
[/mm]
Dann P(POS) ermitteln:
P(POS) = P(POS [mm] \cap [/mm] S) + P(POS [mm] \cap \overline{S}) [/mm] = P(POS | S) P(S) + P(POS | [mm] \overline{S}) P(\overline{S}) [/mm] = 0,99999 [mm] \bruch{1}{20} [/mm] + [mm] \bruch{1}{1000000} \bruch{19}{20}
[/mm]
Und jetzt noch [mm] P(\overline{S} \cap [/mm] POS) ermitteln:
P(POS | [mm] \overline{S}) [/mm] = [mm] \bruch{P(\overline{S} \cap POS)}{P(\overline{S})}
[/mm]
Also [mm] P(\overline{S} \cap [/mm] POS) = P(POS | [mm] \overline{S}) P(\overline{S}) [/mm] = [mm] \bruch{1}{1000000} \bruch{19}{20}
[/mm]
Ist der Lösungsweg korrekt? Wenn ja, dann ist die Aufgabenstellung m.E. nicht konkret genug:
Statt:
"Der Test bei Mr. X ist positiv, und er ist einer von n = 20 möglichen Tätern. Wie groß ist die Wahrscheinlichkeit, dass Mr. X unschuldig ist?"
sollte es m.E. heißen:
"Es gibt n = 20 mögliche Täter, von denen einer mit Sicherheit der Schuldige ist. Der Test ist bei genau einem der 20 möglichen Täter positiv, nämlich bei Mr. X."
Seht ihr das auch so?
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 22:07 Do 28.11.2019 | Autor: | hase-hh |
Moin,
ich gehe mal davon aus, dass mit dem Ereignis POS gemeint ist, das die DNA mit dem des Täters übereinstimmt. Dann würde gelten P(POS) = [mm] \bruch{1}{1 000 000}. [/mm]
Die Angabe, "Der Test irrt zu 0,001%", scheint mir unklar.
Ich kategorisiere.
Merkmal S (Person ist schuldig)
Merkmal POS (DNA stimmt mit gefundener überein)
M.E. irrt der Test, wenn
1. die Person schuldig ist (S), und der Test negativ [mm] (\overline{POS}) [/mm] ausfällt.
2. die Person unschuldig ist [mm] (\overline{S}), [/mm] und der Test positiv (POS) ausfällt.
Bezieht sich die die genannte Wahrscheinlichkeit 0,001 % also auf einen Pfad oder auf beide Pfade???
M.E. wird hier davon ausgegangen, dass unter den 20 Verdächtigen genau ein Schuldiger ist. Allerdings können mehrere Testergebnisse positiv sein, genauso wie alle Testeregbnsise negativ sein können.
Ich gehe also davon aus, dass P(S) = [mm] \bruch{1}{20} [/mm] und [mm] P(\overline{S}) [/mm] = [mm] \bruch{19}{20} [/mm]
Diese würden für mich die 1. Stufe des Baumdiagramms ergeben.
Das umgekehrte Baumdiagramm mit POS bzw. [mm] \overline{POS} [/mm] mit den Wahrscheinlichkeiten
P(POS) = [mm] \bruch{1}{1000000} [/mm] bzw. [mm] P(\overline{POS}) [/mm] = [mm] \bruch{999999}{1000000} [/mm] in der 1. Stufe beginnen.
Die Wahrscheinlichkeit, dass Mr. X unschuldig ist, wird berechnet durch:
P(POS | [mm] \overline{S}) [/mm] = [mm] \bruch{P(POS \cap \overline{S})}{P(\overline{S})}
[/mm]
Für die ggf. hilfreiche Vierfeldertafel fehlt mir eine Angabe, bzw. müsste ich wissen, wie man die 0,001% da einbauen könnte.
Mehr fällt mir gerade nicht ein...
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 22:38 Do 28.11.2019 | Autor: | sancho1980 |
> Moin,
>
> ich gehe mal davon aus, dass mit dem Ereignis POS gemeint
> ist, das die DNA mit dem des Täters übereinstimmt. Dann
> würde gelten P(POS) = [mm]\bruch{1}{1 000 000}.[/mm]
>
>
> Die Angabe, "Der Test irrt zu 0,001%", scheint mir unklar.
>
>
> Ich kategorisiere.
>
> Merkmal S (Person ist schuldig)
> Merkmal POS (DNA stimmt mit gefundener überein)
>
>
> M.E. irrt der Test, wenn
>
> 1. die Person schuldig ist (S), und der Test negativ
> [mm](\overline{POS})[/mm] ausfällt.
> 2. die Person unschuldig ist [mm](\overline{S}),[/mm] und der Test
> positiv (POS) ausfällt.
Nein. Der Test irrt dann, wenn er:
1) für eine Person positiv ausfällt, obwohl die Person nicht das gesuchte DNA-Profil hat.
2) für eine Person negativ ausfällt, obwohl die Person das gesuchte DNA-Profil hat.
Der Täter hat mit Sicherheit das gesuchte DNA-Profil. Er ist aber nicht der Einzige (auf der ganzen weiten Welt) mit diesem DNA-Profil, denn statistisch gibt es unter 1 Million Menschen immer einen mit diesem Profil. Gut möglich also, dass es unter den 20 Verdächtigen noch einen weiteren (Unschuldigen) mit genau diesem Profil gibt. Auch hier muss der Test (sofern er nicht irrt), natürlich positiv ausfallen.
> Die Wahrscheinlichkeit, dass Mr. X unschuldig ist, wird
> berechnet durch:
>
> P(POS | [mm]\overline{S})[/mm] = [mm]\bruch{P(POS \cap \overline{S})}{P(\overline{S})}[/mm]
Ich denke das kann nicht stimmen.P(POS | [mm] \overline{S}) [/mm] ist die Wahrscheinlichkeit, dass der Test für eine Person positiv ausfällt, obwohl sie unschuldig ist, also
P(POS | [mm] \overline{S}) [/mm] = [mm] \bruch{1}{1000000}
[/mm]
Gesucht ist aber [mm] P(\overline{S} [/mm] | POS), also die Wahrscheinlichkeit, dass die Person unschuldig ist, obwohl der Test positiv ausfällt (genau andersrum halt).
|
|
|
|
|
> DNA-Test: Am Tatort wird eine DNA-Probe sichergestellt. Von
> 1 Million Menschen hat statistisch gesehen nur einer ein
> DNA-Profil, das mit dieser Probe übereinstimmt. Nun wird
> ein DNA-Test an n Verdächtigen durchgeführt. Die
> Wahrscheinlichkeit, dass der Test irrt, ist 0.001%.
>
> Der Test bei Mr. X ist positiv, und er ist einer von n = 20
> möglichen Tätern. Wie groß ist die Wahrscheinlichkeit,
> dass Mr. X unschuldig ist?
> Hallo,
Präzisierung:
- Genau einer der 20 Verdächtigen ist der Täter (kämen mehr in Frage, würde die Zahl 20 gar nicht erwähnt).
- Der Täter hat mit sicherheit das DNA-Profil, die Test-unsicherheit von 0,001 % trifft hier nicht zu.
- Die anderen 19 Verdächtigen wurden (noch) nicht getestet.
Dann ist unser Freund mit folgenden Wahrscheinlichkeiten unschuldig:
a) Mit Sicherheit, wenn der Test versagt hat, also mit 0,00001
b) Wenn der Test Recht hat (W. = 0,99999), aber auch noch andere Verdächtige das DNA-Profil haben.
1. Genau ein weiterer hat auch das Profil. Dafür gibt es 19 Mgl., für jede beträgt die W. [mm] 0,000001*0,999999^{18}. [/mm] In diesem Fall beträgt die W. dafür, dass der andere und nicht unser Freund schuldig ist, 0,5. Zusammengefasst: [mm] 19*0,000001*0,999999^{18}*\bruch{1}{2}*0,99999 [/mm] (letzter Faktor für "Test war korrekt").
2. Genau 2 weitere haben auch das Profil. Dafür gibt es [mm] \vektor{19 \\ 2} [/mm] Mgl., für jede beträgt die W. [mm] 0,000001^2*0,999999^{17}. [/mm] In diesem Fall beträgt die W. dafür, dass einer der anderen und nicht unser Freund schuldig ist, [mm] \bruch{2}{3}. [/mm] Zusammengefasst: [mm] \vektor{19 \\ 2}0,000001^2*0,999999^{17}*\bruch{2}{3}*0,99999.
[/mm]
...
...
19. Genau 19weitere haben auch das Profil. Dafür gibt es [mm] \vektor{19 \\ 19} [/mm] Mgl., für jede beträgt die W. [mm] 0,000001^{19}*0,999999^{0}. [/mm] In diesem Fall beträgt die W. dafür, dass einer der anderen und nicht unser Freund schuldig ist, [mm] \bruch{19}{20}. [/mm] Zusammengefasst: [mm] \vektor{19 \\ 19}0,000001^{19}*0,999999^{0}*\bruch{19}{20}*0,99999.
[/mm]
Jetzt alles schön aufsummieren. Wegen der verschiedenen Brüche sehe ich keine Möglichkeit, auf Gegenwahrscheinlichkeiten umzusteigen.
Du erhältst ungefähr 0,00001949984799 = 0,001949984799 %.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 13:53 Fr 29.11.2019 | Autor: | sancho1980 |
Ok, ich werde heute Abend mal den Autoren anschreiben, da du ja auf ein anderes Ergebnis kommst (0,019 % vs 0,0019%)
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 15:04 Fr 29.11.2019 | Autor: | Gonozal_IX |
Hiho,
du berücksichtigst zu beginn etwas, das du später unterschlägst:
> - Der Täter hat mit sicherheit das DNA-Profil, die Test-unsicherheit von 0,001 % trifft hier nicht zu.
d.h. im Umkehrschluss aber auch, dass deine Berechnung für die Existenz desselben DNA-Profils bei den anderen 19 Menschen fehlerhaft ist.
Denn: Ist X unschuldig, tritt das DNA-Profil sicher unter den 19 anderen Beschuldigten mindestens einmal auf.
Gruß,
Gono
|
|
|
|
|
Dieser Artikel ist leider auch fehlerhaft, ich weiß nicht, wie man ihn als fehlerhaft kennzeichnet.
Hallo Gono,
du hast völlig Recht, ich habe nicht aufgepasst.
Die Fälle b) von 1 bis 19 bleiben, wie sie sind.
Der Fall a) kann nur eintreten, wenn mindestens einer der anderen 19 die passende DNA hat. Dass keiner sie hat, hat die Wahrscheinlichkeit [mm] 0,999999^{19}= [/mm] 0,999981, die W. für mindestens einen ist somit 1-0,999981000171=0,000018999829
Damit a) Eintritt, nämlich dass der Kandidat nicht die passende DNA hat, muss auch mit dieser W. zusätzlich mindestens ein weiterer Kandidat die DNA haben.
Somit muss der Wert aus a), 0,00001, zu 0,00001*0,000018999829 = 0,00000000018999829 korrigiert werden, und man erhält die gesuchte W. für die Unschuld zu 0,00095 %.
Man kann auch mit Hilfe mehrerer Bäume das Ganze darstellen. Wenn der Kandidat unschuldig sein soll, muss mindestens ein weiterer, höchstens alle 19, die passende DNA haben. Für den Fall, dass genau n andere ebenfalls die DNA haben (1 [mm] \le [/mm] n [mm] \le [/mm] 19) ergibt sich der folgende Wahrscheinlichkeitsbaum:
[Dateianhang nicht öffentlich]
Dabei steht unten schon die aus beiden Teilzweigen summierte W. für die Unschuld des Kandidaten. Die Summe über n von 1 bis 20 ergibt dann 0,0000095 oder 0,00095 %. Der Fall a) wurde also in die Fälle b) in den rechten Zweigen mit erfasst.
Dateianhänge: Anhang Nr. 1 (Typ: JPG) [nicht öffentlich]
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 22:09 So 01.12.2019 | Autor: | sancho1980 |
Also ich bin mittlerweile vollends verwirrt, ob jetzt die hier vorgeschlagene Lösung oder die offizielle Lösung richtig ist. Ich selber komme mittlerweile auf das Ergebnis
[mm] P(\overline{S} [/mm] | POS) = [mm] \bruch{P(\overline{S} \cap POS)}{P(POS)} [/mm] = [mm] \bruch{P(POS | \overline{S}) P(\overline{S})}{P(POS \cap S) + P(POS \cap \overline{S})} [/mm] = [mm] \bruch{P(POS | \overline{S}) P(\overline{S})}{P(POS \cap S) + P(POS | \overline{S}) P(\overline{S})} [/mm] = [mm] \bruch{1}{\bruch{P(POS \cap S)}{P(POS | \overline{S}) P(\overline{S})} + 1} [/mm] = [mm] \bruch{1}{\bruch{P(POS | S) P(S)}{P(POS | \overline{S}) P(\overline{S})} + 1} [/mm] = [mm] \bruch{1}{\bruch{P(POS | S) P(S)}{(P(POS | \overline{S} \cap DNA) + P(POS | \overline{S} \cap \overline{DNA})) P(\overline{S})} + 1} [/mm] = [mm] \bruch{1}{\bruch{P(POS | S) P(S)}{(P(POS | \overline{S} | DNA) P(DNA) + P(POS | \overline{S} | \overline{DNA}) P(\overline{DNA})) P(\overline{S})} + 1} [/mm] = [mm] \bruch{1}{\bruch{P(POS | DNA) P(S)}{(P(POS | DNA) P(DNA) + P(POS | \overline{DNA}) P(\overline{DNA})) P(\overline{S})} + 1} [/mm] = [mm] \bruch{1}{\bruch{0,99999 \bruch{1}{20}}{(0,99999 \bruch{1}{1000000} + 0,00001 \bruch{999999}{1000000}) \bruch{19}{20}} + 1} [/mm] = 0,00023152722485 [mm] \hat= [/mm] 0,02 %
S .. Kandidat ist schuldig
POS .. Test ist positiv für Kandidat
DNA .. Kandidat hat Täter-DNA
|
|
|
|
|
Ich kann den Fehler in deiner Berechnung nicht finden, bin allerdings mit der Bayesschen Schreibweise schon immer auf Kriegsfuß gewesen.
Eine grobe Abschätzung zeigt aber, dass dein Ergebnis nicht stimmen kann. Ich ändere die Aufgabe mal folgendermaßen ab:
"Von den anderen 19 Kandidaten ist auf jeden Fall einer der Täter, wenn er die entsprechende DNA hat."
Es dürfte klar sein, dass jetzt die W. für die Unschuld unseres Kandidaten gegenüber der ursprünglichen Aufgabenstellung gestiegen ist.
Zu erwarten sind nun nach der Binomialverteilung [mm] \bruch{19}{1 000 000}=0,000019 [/mm] Täter, und mit dieser Wahrscheinlichkeit ist unser Freund dann unschuldig. Das wären aber 0,0019% statt deiner 0,02 %, und der wahre Wert liegt noch darunter, weil unser Kandidat ja trotz der anderen möglichen Täter selber immer noch in Frage kommt.
|
|
|
|
|
Ich glaube mittlerweile, dass die einfachen Bayesschen Wahrscheinlichkeiten hier gar nicht erfassbar sind, wie man an folgender Überlegung sieht:
[mm]P(\overline{S}[/mm] | POS) = [mm]\bruch{P(\overline{S} \cap POS)}{P(POS)}[/mm]
S .. Kandidat ist schuldig
POS .. Test ist positiv für Kandidat
DNA .. Kandidat hat Täter-DNA
P(POS) sollte klar sein - oder?
P(POS)=1, da der Test schon erfolgt ist oder
[mm] P(POS)=\bruch{1}{20}0,99999+\bruch{19}{20}(0,000001*0,99999+0,999999*0,00001), [/mm] da der Kandidat mit [mm] \bruch{1}{20} [/mm] der Täter ist, somit die DNA hat und der Test das mit 0,99999 angibt oder mit [mm] \bruch{19}{20} [/mm] nicht der Täter ist, mit [mm] a)\bruch{1}{1000000}trotzdem [/mm] die DNA hat, der Test das mit 0,99999 angibt oder b) er mit 0,999999 nicht die DNA hat, der Test das aber trotzdem sagt. oder ist
P(POS)=0,000001*0,99999+0,999999*0,00001 wie für jeden anderen Menschen in der Bevölkerung?
Und was sagt uns [mm] P(\overline{S} \cap [/mm] POS)?
Unschuldig ist der Kandidat mit [mm] \bruch{19}{20}, [/mm] das müssten wir jetzt mit einem der obigen Werte multiplizieren und dann aber wieder durch den teilen - oder doch nicht. und wie macht sich dabei die Tatsache bemerkbar, dass für "unschuldig" ein anderer die DNA haben muss, was ganz unwahrscheinlich ist? Das weitere Aufdröseln in deiner Rechnung bringt auch keine Klarheit darüber, ob die von dir eingesetzten Zahlen mit den Formelausdrücken kompatibel sind. Formal habe ich an der Aufdröselei nichts auszusetzen.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 21:45 Mi 04.12.2019 | Autor: | sancho1980 |
Also ich habe mittlerweile eine Antwort vom Autoren bekommen. Zunächst die Antwort auf meine folgende Frage zur Aufgabenstellung:
"Zum Einen wäre es m.E. relevant zu wissen, ob Mr. X der einzige Verdächtige ist, für den der DNA-Test positiv ausfällt bzw. ob der Täter *mit Sicherheit* unter den 20 Verdächtigen ist."
Die Antwort:
"Ja, so ist die Aufgabe zu verstehen. Sonst waere sie nicht loesbar, da ich ja irgendeine Annahme fuer P(S) machen muss."
Zu meiner Lösung:
> [mm]P(\overline{S}[/mm] | POS) = [mm]\bruch{P(\overline{S} \cap POS)}{P(POS)}[/mm]
> = [mm]\bruch{P(POS | \overline{S}) P(\overline{S})}{P(POS \cap S) + P(POS \cap \overline{S})}[/mm]
> = [mm]\bruch{P(POS | \overline{S}) P(\overline{S})}{P(POS \cap S) + P(POS | \overline{S}) P(\overline{S})}[/mm]
> = [mm]\bruch{1}{\bruch{P(POS \cap S)}{P(POS | \overline{S}) P(\overline{S})} + 1}[/mm]
> = [mm]\bruch{1}{\bruch{P(POS | S) P(S)}{P(POS | \overline{S}) P(\overline{S})} + 1}[/mm]
> = [mm]\bruch{1}{\bruch{P(POS | S) P(S)}{(P(POS | \overline{S} \cap DNA) + P(POS | \overline{S} \cap \overline{DNA})) P(\overline{S})} + 1}[/mm]
> = [mm]\bruch{1}{\bruch{P(POS | S) P(S)}{(P(POS | \overline{S} | DNA) P(DNA) + P(POS | \overline{S} | \overline{DNA}) P(\overline{DNA})) P(\overline{S})} + 1}[/mm]
> = [mm]\bruch{1}{\bruch{P(POS | DNA) P(S)}{(P(POS | DNA) P(DNA) + P(POS | \overline{DNA}) P(\overline{DNA})) P(\overline{S})} + 1}[/mm]
> = [mm]\bruch{1}{\bruch{0,99999 \bruch{1}{20}}{(0,99999 \bruch{1}{1000000} + 0,00001 \bruch{999999}{1000000}) \bruch{19}{20}} + 1}[/mm]
> = 0,00023152722485 [mm]\hat=[/mm] 0,02 %
>
> S .. Kandidat ist schuldig
> POS .. Test ist positiv für Kandidat
> DNA .. Kandidat hat Täter-DNA
... schreibt er:
"Wenn ich den letzen symbolischen Ausdruck in der Formel auswerte bekomme ich
0.000208958
und das ist auch unsere Loesung! Die uerpruenglich im Buch gedruckete Loesung 0,019% erhaelt man wenn man vernachlaessigt, dass unter den 19 unschuldigen Personen jemand die Taeter-DNA hat."
Ich habe meins allerdings jetzt noch zwei weitere Male in den Taschenrechner eingetippt und bekomme immer wieder das Ergebnis 0,00023152722485 (statt 0.000208958). Ich sehe auch nicht, dass ich irgendein Symbol mit falschen Werten ersetze.
Zu deiner Lösung schreibt er:
"Ich denke hier wird eine etwas andere Fragestellung geloest. Bei der obigen Loesung geht man davon aus, dass die restlichen Personen noch nicht getestet wurden (man also keine Information ueber deren Testergebnis hat). Geht man davon aus, dass die andren Personen auch getestet wurden und “negativ” sind, so sind das natuerlich zusaetzliche Bedingungen die die Wahrscheinlichkeit, dass X unschuldig ist, weiter nach unten druecken."
Scheint als hätte so jeder seine eigene Lesart von der Aufgabenstellung.
Wenn meine Formel aber korrekt zu sein scheint, wurmt es mich schon, nicht auf das richtige Ergebnis zu kommen ...
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 09:39 Fr 06.12.2019 | Autor: | Gonozal_IX |
Hiho,
> "Ich denke hier wird eine etwas andere Fragestellung
> geloest. Bei der obigen Loesung geht man davon aus, dass
> die restlichen Personen noch nicht getestet wurden (man
> also keine Information ueber deren Testergebnis hat). Geht
> man davon aus, dass die andren Personen auch getestet
> wurden und “negativ” sind, so sind das natuerlich
> zusaetzliche Bedingungen die die Wahrscheinlichkeit, dass X
> unschuldig ist, weiter nach unten druecken."
Das sind aber auch zusätzliche Informationen, die für die Lösung relevant sind, und zwar essenziell! Mal ganz davon abgesehen: wenn deren DNA laut Test nicht mit dem Täter übereinstimmt, warum sind sie dann noch Verdächtige?
Gruß,
Gono
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 20:46 Sa 07.12.2019 | Autor: | sancho1980 |
> Das sind aber auch zusätzliche Informationen, die für die
> Lösung relevant sind, und zwar essenziell! Mal ganz davon
> abgesehen: wenn deren DNA laut Test nicht mit dem Täter
> übereinstimmt, warum sind sie dann noch Verdächtige?
Na weil sich der Test ja auch irren kann.
|
|
|
|
|
> Zu deiner Lösung schreibt er:
>
> "Ich denke hier wird eine etwas andere Fragestellung
> geloest. Bei der obigen Loesung geht man davon aus, dass
> die restlichen Personen noch nicht getestet wurden (man
> also keine Information ueber deren Testergebnis hat). Geht
> man davon aus, dass die andren Personen auch getestet
> wurden und “negativ” sind, so sind das natuerlich
> zusaetzliche Bedingungen die die Wahrscheinlichkeit, dass X
> unschuldig ist, weiter nach unten druecken."
Das ist eine falsche Sicht meiner Berechnung.
Ich gehe nicht davon aus, dass eine andere Person getestet wurde.
Ich soll die W. dafür berechnen, dass unser Kandidat unschuldig ist. Das kann aber nur dann der Fall sein, wenn mindestens eine andere Person schuldig ist, und diese muss doch offenbar die DNA haben (sonst gibt das ganze DNA-Gerechne keinen Sinn).
Da die anderen Personen noch nicht (!) getestet sind, berechne ich die Wahrscheinlichkeiten (!) für die Fälle, dass 1, 2, 3,... der anderen auch die DNA haben. In diesen Fällen kann(!) der Kandidat unschuldig sein: Er hat die DNA überhaupt nur mit der W. 1/11 (wenn allerdings kein anderer sie hat, muss er sie haben, da ja einer der Täter ist), und wenn er und genau ein anderer die DNA hat, ist unser Kandidat nur mit der W. 1/11 * 1/2 (er hat tatsächlich die DNA, und da beide sie haben, ist er mit W. 1/2 der Täter) = 1/22 der Täter, die Unschuldsw. also 21/22.
Also: Wenn ich davon ausgehen würde, dass die anderen negativ getestet wurden, wäre die Unschuldswahrscheinlichkeit für den Kandidaten fast 0, denn die anderen haben die DNA dann nur (jeweils) mit der W. 0,000001*0,00001 (ein anderer hat DNA und Test hat versagt), während unser Kandidat sie mit 1/11 hat. Der zweite Faktor käme hinzu und würde die Unschuldsw. total absenken, also viel kleiner als meinen Wert machen.
Wenn ich davon ausginge, dass jemand positiv getestet wurde, hätte der mit der W. 0,99999 (also fast 1) die DNA, unser Kandidat aber nur mit 1/11, die Unschuldsw. wäre dann fast 21/22 statt 0,00181 %.
Ich gehe gerade davon aus, dass niemand getestet wurde, sondern von den W.keiten dafür, dass jemand der anderen die DNA hat und daher auch als Täter in Frage kommt. Wenn unser Kandidat unschuldig ist - und nur diesen Zweig verfolge ich - , dann MUSS jemand anderes die DNA haben, unabhängig von einem Test, und damit rechne ich weiter. Dabei können aber auch theoretisch mehrere der anderen die DNA haben (aber dass ist so unwahrscheinlich, dass das Gesamtergebnis fast dem Ergebnis für nur einen weiteren DNA-Kandidaten entspricht).
Ich behaupte nach wie vor:
- Mein Beitrag "korrekte Abschätzung" stimmt, und daher ist die Lösung des Autors falsch.
- Meine "richtige Antwort" stimmt ebenfalls. Die einzige Ungenauigkeit darin besteht in der Aufrundung auf 1/11=0,090909090909... statt 0,09090834711, was einen Fehler von 0,0008 % vom Endwert bedeutet (mein Endwert müsste sogar noch ein bisschen verkleinert werden). Da ich alle 19 Fälle aufsummiert habe, kann die Unschuldswahrscheinlichkeit nicht höher als 0,0018136203 % sein.
Vielleicht schickst du dem Autor nochmals die beiden genannten und diesen Beitrag zu.
Zu deiner Berechnung: Ich habe dir noch die Mitteilung "Fehler gefunden" zugesandt, die erklären kann, warum deine Berechnung nicht stimmt. Allerdings komme ich beim Durchrechnen deiner Formel auch auf den Zahlenwert des Autors. Falls der deine Umformungsschritte für logisch richtig hält, sende ihm bitte auch die Mitteilung "Fehler gefunden" zu.
Zum Rechenvergleich aber hier noch die Zahlen:
Klammer im untersten Nenner: a = 0,99999/1000000+0,00001*0,999999 = 0,00001099998
mal 19/20: b = 0,000010449981
mit dem Zähler verrechnet: c = 0,99999/20/b = 4784,649848
mit der 1: d = c+1 = 4785,649848
Kehrwert: e = 1/d = 0,0002089580374
|
|
|
|
|
Ich habe mich nochmal auf die Fehlersuche begeben und folgenden Fehler gefunden (das schließt nicht aus, dass noch weitere Umformungen fehlerhaft sind):
... = [mm]\bruch{1}{\bruch{P(POS | S) P(S)}{P(POS | \overline{S}) P(\overline{S})} + 1}[/mm] = [mm]\bruch{1}{\bruch{P(POS | S) P(S)}{(P(POS | \overline{S} \cap DNA) + P(POS | \overline{S} \cap \overline{DNA})) P(\overline{S})} + 1}[/mm] ...
Es gilt NICHT: [mm] P(A|B)=P(A|B\cap C)+P(A|B\cap \overline{C}), [/mm] wie das folgende Beispiel zeigt. Dabei sind die Zahlen die Anzahl der Elemente in den Teilfeldern, es gelte die LAPLACE-Wahrscheinlichkeit.
[Dateianhang nicht öffentlich]
Dann ist [mm] P(A|B)=\bruch{3+30}{3+30+7+20}=\bruch{33}{60}=\bruch{11}{20}
[/mm]
[mm] P(A|B\cap C)=\bruch{3}{3+7}=\bruch{3}{10}=\bruch{6}{20}
[/mm]
[mm] P(A|B\cap \overline{C})=\bruch{30}{30+20}=\bruch{30}{50}=\bruch{3}{5}=\bruch{12}{20},
[/mm]
aber [mm] P(A|B)=\bruch{11}{20} \ne P(A|B\cap C)+P(A|B\cap \overline{C})=\bruch{6}{20}+\bruch{12}{20}=\bruch{18}{20}.
[/mm]
Daher funktioniert deine Berechnung mit den BAYESschen Symbolen nicht.
Dateianhänge: Anhang Nr. 1 (Typ: JPG) [nicht öffentlich]
|
|
|
|
|
Staatsanwalt: Und weil es so unwahrscheinlich ist, dass der Angeklagte unschuldig ist, kann er mit an Sicherheit grenzender Wahrscheinlichkeit zu lebenslänglich verurteilt werden.
Rechtsanwalt: Keiner der anderen Verdächtigen wurde untersucht. Wäre nur ein einziger mit der "passenden" DNA dabei, würde die Unschuldswahrscheinlichkeit meines Mandanten von 0,002 % sofort auf 50 % sinken. Wegen dieser Unterlassung alleine ist mein Mandant schon freizusprechen. Tatsächlich sieht die Sache noch günstiger für ihn aus. Hier der dazu passende Wahrscheinlichkeitsbaum:
[Dateianhang nicht öffentlich]
Wie sie sehen, beträgt die W. für die Schuld meines Mandanten immer noch nur ca. 1/20. Er kann ja nichts dafür, dass er zufällig die "passende" DNA hat.
Staatsanwalt: Das sehe ich ganz anders, mein W.-Baum sieht so aus:
[Dateianhang nicht öffentlich]
Somit beträgt die W. für die Unschuld des Angeklagten nur
[mm] \bruch{0,0000009499905+0,94999905}{0,0000009499905+0,94999905+0,0499999}\approx [/mm] 0,0002089563661, also ca. 0,02 %.
Dateianhänge: Anhang Nr. 1 (Typ: JPG) [nicht öffentlich] Anhang Nr. 2 (Typ: JPG) [nicht öffentlich]
|
|
|
|
|
Autsch, autsch, autsch! Ich binn auf die dümmste Falle der bedingten W. hereingefallen, indem ich die W. für "Der Kandidat hat DNA" zu 0,99999 angesetzt habe. Das ist völlig falsch, und deshalb sind alle meine bisherigen Berechnungen auch fehlerhaft, allerdings stimmt meine Abschätzung von 16.58 Uhr und auch die Argumentation.
[Dateianhang nicht öffentlich]
Nach der bedingten W. hat der Kandidat die DNA nur mit einer W. von [mm] \bruch{0,00000099999}{0,00000099999+0,00000999999}= [/mm] 0,09090834711 [mm] \approx \bruch{1}{11}. [/mm] Das ändert natürlich alles!
Die folgenden Überlegungen sind aber wieder entsprechend meiner ersten Ausführung: Der Kandidat kann nur dann unschuldig sein, wenn es mindestens einen anderen Kandidaten mit der DNA gibt. Für n weitere Kandidaten (1 [mm] \le [/mm] n [mm] \le [/mm] 19) gilt:
[Dateianhang nicht öffentlich]
Für genau einen anderen Kandidaten beträgt die W. laut Baum [mm] \vektor{19 \\ 1}*0,000001^1*0,999999^{18}(\bruch{1}{11}*\bruch{1}{2}+\bruch{10}{11})=0,000018136
[/mm]
Für genau 2 andere Kandidaten beträgt die W. laut Baum [mm] \vektor{19 \\ 2}*0,000001^2*0,999999^{17}(\bruch{1}{11}*\bruch{2}{3}+\bruch{10}{11})=...
[/mm]
usw. bis zu 19 Kandidaten.
Alles aufsummiert ergibt
0,000018136203=0,0018136203 %,
wobei die Summanden ab n=2 viel winziger als der Wert für n=1 sind und keinen wesentlichen Beitrag mehr leisten.
Dateianhänge: Anhang Nr. 1 (Typ: JPG) [nicht öffentlich] Anhang Nr. 2 (Typ: JPG) [nicht öffentlich]
|
|
|
|
|
Wo ist der Denkfehler in diesem Ansatz:
Die ursprüngliche Aufgabenstellung lautet:
"Der Test bei Mr. X ist positiv, und er ist einer von n = 20 möglichen Tätern. Wie groß ist die Wahrscheinlichkeit, dass Mr. X unschuldig ist?"
Angenommen ich formuliere das folgendermaßen um:
"Mr. X ist unschuldig. Wie groß ist die Wahrscheinlichkeit, dass der Test nur für ihn und sonst für keinen der übrigen 19 Verdächtigen positiv ist (obwohl der wahre Täter einer der übrigen 19 Verdächtigen ist)."
Diese Wahrscheinlichkeit sollte doch gleich sein mit der in der Aufgabenstellung gesuchten, oder? Wie bereits erwähnt unterstelle ich, dass die Aufgabenstellung meint, dass der Test für die übrigen 19 negativ war, wie mir der Autor ja bestätigt hat.
Nach meiner umformulierten Aufgabenstellung wäre also folgende Wahrscheinlichkeit gesucht:
[mm] P((\overline{DNA_X} \cap F_X) \cup (DNA_X \cap \overline{F_X})) \cap F_T
[/mm]
mit
[mm] DNA_X [/mm] ... Mr. X hat zufällig die Täter-DNA
[mm] F_X [/mm] ... Der Test liefert für Mr. X das falsche Ergebnis
[mm] F_T [/mm] ... Der Test liefert für den (echten) Täter ein falsches (negatives) Ergebnis
Dann
[mm] P((\overline{DNA_X} \cap F_X) \cup (DNA_X \cap \overline{F_X})) \cap F_T [/mm] = [mm] (P(\overline{DNA})P(F_X) [/mm] + [mm] P(DNA)P(\overline{F_X}))P(F_T) [/mm] = [mm] (\bruch{999999}{1000000} [/mm] (0,00001) + [mm] \bruch{1}{1000000} [/mm] (0,99999))0,00001 = 0,0000000001099998
Kurios hieran ist natürlich, dass die Anzahl der Verdächtigen (20) überhaupt keine Rolle mehr spielt...
|
|
|
|
|
Ich glaub das war nix. Aber wenn es stimmt, dass man die Aufgabenstellung wie beschrieben umformulieren könnte, ohne die Semantik zu verändern, dann müsste das doch ein legitimer Rechenweg sein:
Zunächst sei der Einfachheit halber davon ausgegangen, es ginge in der Aufgabenstellung nicht um n = 20 sondern um n = 5 Verdächtige. Dann hätte ein unschuldiger Mr. X mit folgender Wahrscheinlichkeit das Pech, dass der Test für ihn (und nur für ihn) positiv ausfällt:
[mm] P(((V_T) \cap ((\overline{DNA_X} \cap V_X) \cup (DNA_X \cap \overline{V_X}))) \cap ((N_1 \cap N_2 \cap N_3) \cup (N_1 \cap N_2 \cap J_3) \cup (N_1 \cap J_2 \cap N_3) \cup (N_1 \cap J_2 \cap J_3) \cup [/mm] ... [mm] \cup (J_1 \cap J_2 \cap J_3)))
[/mm]
wobei
[mm] V_T [/mm] ... Der Test versagt für den wirklichen Täter
[mm] DNA_X [/mm] ... Mr. X hat zufällig die Täter-DNA
[mm] V_X [/mm] ... Der Test versagt für Mr. X
[mm] N_{z \in {1,2,3} } [/mm] := [mm] (\overline{DNA_{z}} \cap \overline{V_{z}}) [/mm] ... Verdächtiger z hat nicht die Täter-DNA, und der Test schlägt für ihn nicht fehl
[mm] J_{z \in {1,2,3} } [/mm] := [mm] (DNA_{z} \cap V_{z}) [/mm] ... Verdächtiger z hat die Täter-DNA, und der Test schlägt für ihn fehl
Dann gilt doch
[mm] P(((V_T) \cap ((\overline{DNA_X} \cap V_X) \cup (DNA_X \cap \overline{V_X}))) \cap ((N_1 \cap N_2 \cap N_3) \cup (N_1 \cap N_2 \cap J_3) \cup (N_1 \cap J_2 \cap N_3) \cup (N_1 \cap J_2 \cap J_3) \cup [/mm] ... [mm] \cup (J_1 \cap J_2 \cap J_3))) [/mm] =
[mm] P(V_T) (P(\overline{DNA_X}) P(V_X) [/mm] + [mm] P(DNA_X) P(\overline{V_X})) ((P(N_1) P(N_2) P(N_3)) [/mm] + [mm] (P(N_1) P(N_2) P(J_3)) [/mm] + [mm] (P(N_1) P(J_2) P(N_3)) [/mm] + [mm] (P(N_1) P(J_2) P(J_3)) [/mm] + ... + [mm] (P(J_1) P(J_2) P(J_3)))
[/mm]
Offensichtlich gilt weiterhin:
[mm] P(N_1) [/mm] = [mm] P(N_2) [/mm] = [mm] P(N_3), [/mm] daher P(N) := [mm] P(N_1)
[/mm]
[mm] P(J_1) [/mm] = [mm] P(J_2) [/mm] = [mm] P(J_3), [/mm] daher P(J) := [mm] P(J_1)
[/mm]
Nun können wir schreiben:
[mm] P(V_T) (P(\overline{DNA_X}) P(V_X) [/mm] + [mm] P(DNA_X) P(\overline{V_X})) ((P(N_1) P(N_2) P(N_3)) [/mm] + [mm] (P(N_1) P(N_2) P(J_3)) [/mm] + [mm] (P(N_1) P(J_2) P(N_3)) [/mm] + [mm] (P(N_1) P(J_2) P(J_3)) [/mm] + ... + [mm] (P(J_1) P(J_2) P(J_3))) [/mm] =
[mm] P(V_T) (P(\overline{DNA_X}) P(V_X) [/mm] + [mm] P(DNA_X) P(\overline{V_X})) (((P(N))^3 (P(J))^0) \pmat{ 3 \\ 0 } [/mm] + [mm] ((P(N))^2 (P(J))^1) \pmat{ 3 \\ 1 } [/mm] + [mm] ((P(N))^1 (P(J))^2) \pmat{ 3 \\ 2 } [/mm] + [mm] ((P(N))^0 (P(J))^3) \pmat{ 3 \\ 3 })
[/mm]
Auf 20 Verdächtige übertragen wäre die gesuchte Wahrscheinlichkeit:
[mm] P(V_T) (P(\overline{DNA_X}) P(V_X) [/mm] + [mm] P(DNA_X) P(\overline{V_X})) (((P(N))^{18} (P(J))^0) \pmat{ 18 \\ 0 } [/mm] + [mm] ((P(N))^{17} (P(J))^1) \pmat{ 18 \\ 1 } [/mm] + ... + [mm] ((P(N))^0 (P(J))^{18}) \pmat{ 18 \\ 18 })
[/mm]
Jetzt kann man wieder rücksubstituieren:
N = [mm] (\overline{DNA} \cap \overline{V}) [/mm] ... Das Ereignis, dass ein getesteter Verdächtiger nicht die Täter-DNA hat und der Test für ihn nicht fehlschlägt
J = (DNA [mm] \cap [/mm] V) ... Das Ereignis, dass ein getesteter Verdächtiger die Täter-DNA hat und der Test für ihn fehlschlägt
[mm] P(V_T) (P(\overline{DNA_X}) P(V_X) [/mm] + [mm] P(DNA_X) P(\overline{V_X})) (((P(\overline{DNA} \cap \overline{V}))^{18} [/mm] (P(DNA [mm] \cap V))^0) \pmat{ 18 \\ 0 } [/mm] + [mm] ((P(\overline{DNA} \cap \overline{V}))^{17} [/mm] (P(DNA [mm] \cap V))^1) \pmat{ 18 \\ 1 } [/mm] + ... + [mm] ((P(\overline{DNA} \cap \overline{V}))^0 [/mm] (P(DNA [mm] \cap V))^{18}) \pmat{ 18 \\ 18 }) [/mm] =
[mm] P(V_T) (P(\overline{DNA_X}) P(V_X) [/mm] + [mm] P(DNA_X) P(\overline{V_X})) (((P(\overline{DNA}) P(\overline{V}))^{18} [/mm] (P(DNA) [mm] P(V))^0) \pmat{ 18 \\ 0 } [/mm] + [mm] ((P(\overline{DNA}) P(\overline{V}))^{17} [/mm] (P(DNA) [mm] P(V))^1) \pmat{ 18 \\ 1 } [/mm] + ... + [mm] ((P(\overline{DNA}) P(\overline{V}))^0 [/mm] (P(DNA) [mm] P(V))^{18}) \pmat{ 18 \\ 18 }) [/mm] =
0,00001 (0,999999 * 0,00001 + 0,000001 * 0,99999) (((0,999999 * [mm] 0,99999)^{18} [/mm] (0,000001 * [mm] 0,00001)^0) \pmat{ 18 \\ 0 } [/mm] + ((0,999999 * [mm] 0,99999)^{17} [/mm] (0,000001 * [mm] 0,00001)^1) \pmat{ 18 \\ 1 } [/mm] + ... + ((0,999999 * [mm] 0,99999)^0 [/mm] (0,000001 * [mm] 0,00001)^{18}) \pmat{ 18 \\ 18 }) [/mm] =
0,00001 (0,999999 * 0,00001 + 0,000001 * 0,99999) (((0,999999 * [mm] 0,99999)^{18} [/mm] (0,000001 * [mm] 0,00001)^0) [/mm] 1 + ((0,999999 * [mm] 0,99999)^{17} [/mm] (0,000001 * [mm] 0,00001)^1) [/mm] 18 + ((0,999999 * [mm] 0,99999)^{16} [/mm] (0,000001 * [mm] 0,00001)^2) [/mm] 153 + ((0,999999 * [mm] 0,99999)^{15} [/mm] (0,000001 * [mm] 0,00001)^3) [/mm] 816 + ((0,999999 * [mm] 0,99999)^{14} [/mm] (0,000001 * [mm] 0,00001)^4) [/mm] 3060 + ((0,999999 * [mm] 0,99999)^{13} [/mm] (0,000001 * [mm] 0,00001)^5) [/mm] 8568 + ((0,999999 * [mm] 0,99999)^{12} [/mm] (0,000001 * [mm] 0,00001)^6) [/mm] 18564 + ((0,999999 * [mm] 0,99999)^{11} [/mm] (0,000001 * [mm] 0,00001)^7) [/mm] 31824 + ((0,999999 * [mm] 0,99999)^{10} [/mm] (0,000001 * [mm] 0,00001)^8) [/mm] 43758 + ((0,999999 * [mm] 0,99999)^{9} [/mm] (0,000001 * [mm] 0,00001)^9) [/mm] 48620 + ((0,999999 * [mm] 0,99999)^{8} [/mm] (0,000001 * 0,00001)^10) 43758 + ((0,999999 * [mm] 0,99999)^{7} [/mm] (0,000001 * [mm] 0,00001)^{11}) [/mm] 31824 + ((0,999999 * [mm] 0,99999)^{6} [/mm] (0,000001 * [mm] 0,00001)^{12}) [/mm] 18564 + ((0,999999 * [mm] 0,99999)^{5} [/mm] (0,000001 * [mm] 0,00001)^{13}) [/mm] 8568 + ((0,999999 * [mm] 0,99999)^{4} [/mm] (0,000001 * [mm] 0,00001)^{14}) [/mm] 3060 + ((0,999999 * [mm] 0,99999)^{3} [/mm] (0,000001 * [mm] 0,00001)^{15}) [/mm] 816 + ((0,999999 * [mm] 0,99999)^{2} [/mm] (0,000001 * [mm] 0,00001)^{16}) [/mm] 153 + ((0,999999 * [mm] 0,99999)^{1} [/mm] (0,000001 * [mm] 0,00001)^{17}) [/mm] 18 + ((0,999999 * [mm] 0,99999)^{0} [/mm] (0,000001 * [mm] 0,00001)^{18}) [/mm] 1) =
0,00001 (0,00000999999 + 0,00000099999) [mm] (((0,99998900001)^{18} (0,00000000001)^0) [/mm] 1 + [mm] ((0,99998900001)^{17} (0,00000000001)^1) [/mm] 18 + [mm] ((0,99998900001)^{16} (0,00000000001)^2) [/mm] 153 + [mm] ((0,99998900001)^{15} (0,00000000001)^3) [/mm] 816 + [mm] ((0,99998900001)^{14} (0,00000000001)^4) [/mm] 3060 + [mm] ((0,99998900001)^{13} (0,00000000001)^5) [/mm] 8568 + [mm] ((0,99998900001)^{12} (0,00000000001)^6) [/mm] 18564 + [mm] ((0,99998900001)^{11} (0,00000000001)^7) [/mm] 31824 + [mm] ((0,99998900001)^{10} (0,00000000001)^8) [/mm] 43758 + [mm] ((0,99998900001)^{9} (0,00000000001)^9) [/mm] 48620 + [mm] ((0,99998900001)^{8} [/mm] (0,00000000001)^10) 43758 + [mm] ((0,99998900001)^{7} (0,00000000001)^{11}) [/mm] 31824 + [mm] ((0,99998900001)^{6} (0,00000000001)^{12}) [/mm] 18564 + [mm] ((0,99998900001)^{5} (0,00000000001)^{13}) [/mm] 8568 + [mm] ((0,99998900001)^{4} (0,00000000001)^{14}) [/mm] 3060 + [mm] ((0,99998900001)^{3} (0,00000000001)^{15}) [/mm] 816 + [mm] ((0,99998900001)^{2} (0,00000000001)^{16}) [/mm] 153 + [mm] ((0,99998900001)^{1} (0,00000000001)^{17}) [/mm] 18 + [mm] ((0,99998900001)^{0} (0,00000000001)^{18}) [/mm] 1) =
0,000000000109978022115499355457 [mm] \hat= [/mm] 0,0000000109978022115499355457 %
Was meint ihr?
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 22:24 Di 10.12.2019 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 22:23 Mo 09.12.2019 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|
|
> Wo ist der Denkfehler in diesem Ansatz:
>
> Die ursprüngliche Aufgabenstellung lautet:
>
> "Der Test bei Mr. X ist positiv, und er ist einer von n =
> 20 möglichen Tätern. Wie groß ist die
> Wahrscheinlichkeit, dass Mr. X unschuldig ist?"
>
> Angenommen ich formuliere das folgendermaßen um:
>
> "Mr. X ist unschuldig. Wie groß ist die
> Wahrscheinlichkeit, dass der Test nur für ihn und sonst
> für keinen der übrigen 19 Verdächtigen positiv ist
> (obwohl der wahre Täter einer der übrigen 19
> Verdächtigen ist)."
>
> Diese Wahrscheinlichkeit sollte doch gleich sein mit der in
> der Aufgabenstellung gesuchten, oder? Wie bereits erwähnt
> unterstelle ich, dass die Aufgabenstellung meint, dass der
> Test für die übrigen 19 negativ war, wie mir der Autor ja
> bestätigt hat.
In der ursprünglichen Aufgabenstellung steht nicht einmal, dass die anderen 19 Verdächtigen überhaupt getestet wurden. Daher war davon auszugehen, dass für diese alles möglich wäre.
Deine Formulierung entspricht voll dem offenbar Gemeinten. Dann stimmt die Lösung des Autors (und erst recht meine bisherige) überhaupt nicht.
> Nach meiner umformulierten Aufgabenstellung wäre also
> folgende Wahrscheinlichkeit gesucht:
>
> [mm]P((\overline{DNA_X} \cap F_X) \cup (DNA_X \cap \overline{F_X})) \cap F_T[/mm]
>
> mit
>
> [mm]DNA_X[/mm] ... Mr. X hat zufällig die Täter-DNA
> [mm]F_X[/mm] ... Der Test liefert für Mr. X das falsche Ergebnis
> [mm]F_T[/mm] ... Der Test liefert für den (echten) Täter ein
> falsches (negatives) Ergebnis
>
> Dann
>
> [mm]P((\overline{DNA_X} \cap F_X) \cup (DNA_X \cap \overline{F_X})) \cap F_T[/mm]
> = [mm](P(\overline{DNA})P(F_X)[/mm] + [mm]P(DNA)P(\overline{F_X}))P(F_T)[/mm]
> = [mm](\bruch{999999}{1000000}[/mm] (0,00001) + [mm]\bruch{1}{1000000}[/mm]
> (0,99999))0,00001 = 0,0000000001099998
>
> Kurios hieran ist natürlich, dass die Anzahl der
> Verdächtigen (20) überhaupt keine Rolle mehr spielt...
Ich sehe das etwas komplizierter und will es mal an einem anderen Beispiel erklären. Wir haben 19 normale Würfel und einen Würfel, der nur Sechsen enthält. Jemand anderes greift sich ohne hinzugucken einen der Würfel, wirft dreimal und sagt, dass er dreimal die 6 gewürfelt hat. Wie hoch ist die W., dass es sich nicht um den Sechser-Würfel handelt?
Mit der W. 1/20 war es der Sechserwürfel, der dann mit der W. 1 drei Sechsen erzeugte. Mit der W. 19/20 war es ein anderer, der dann mit der W. 1/216 die drei Sechsen erzeugte. Für den Sechserwürfel beträgt somit die W. 1/20, für den anderen 19/(20*216) für das Ergebnis, und damit ist die W., dass es sich nicht um den Sechserwürfel handelt, [mm] \bruch{19}{20*216}/(\bruch{19}{20*216}+\bruch{1}{20})=\bruch{19}{235}.
[/mm]
Obwohl alles für den Sechserwürfel spricht, müssen wir zunächst annehmen, dass dieser nur mit der W. von 1/20 herausgegriffen wurde. Mit dem Kandidaten verhält es sich aber anders: Wir greifen nicht irgendeinen heraus und stellen dann fest, dass der Test für ihn positiv ist, sondern wir haben einen positiven und 19 negative Ergebnisse, und jetzt greifen wir gezielt den mit dem positiven Ergebnis heraus.
Zunächst mal brauchen wir dazu den Baum für die Testergebnisse:
[Dateianhang nicht öffentlich]
Daraus ergibt sich, dass bei unbekannter DNA-Eigenschaft die W. für ein negatives Testergebnis 0,99998900002 und für ein positives 0,00001099998 ist.
Der nächste Baum zeigt nun die Wahrscheinlichkeiten für die Schuld bzw. Unschuld des Kandidaten.
[Dateianhang nicht öffentlich]
Links finden wir nun für den Fall, dass der Kandidat schuldig ist, den Baum für die Gesamtsituation. Diese entsteht dann mit der folgenden W.: Der Kandidat hat die DNA (W.=1), der Test hat das mit W. 0,99999 bestätigt, für alle anderen ist der Test negativ. Da wir nicht wissen, ob die anderen DNA haben oder nicht, ist für jeden die W. für einen negativen Testausgang nach dem ersten Baum 0,99998900002, damit das 19 mal passiert also [mm] 0,99998900002^{19}= [/mm] 0,999791021. Damit ergibt sich eine Gesamtw. für die entstandene Situation von 0,999781, falls der Kandidat schuldig ist.
Wenn ein anderer schuldig ist (rechter Baum), wissen wir aber nicht, ob unser Kandidat die DNA hat, und wir erwarten das positive Testergebnnis nur mit der W. 0,00001099998. Der Täter hat dann mit Sicherheit die DNA und der Test hat versagt mit der W. 0,00001. Von den anderen 18 erwarten wir nun alle ein negatives Ergebnis mit der W. [mm] 0,99998900002^{18}= [/mm] 0,99980201. Insgesamt ergibt sich damit für den rechten Baum eine W. von 0,000000000109978.
Somit beträgt die Unschuldswahrscheinlichkeit für unseren Kandidaten
[mm] \bruch{0,000000000109978}{0,000000000109978+0,999781}= [/mm] 0,00000000011.
Das stimmt nun fast mit deinem Ergebnis überein, wobei das zu erwarten war.
Dateianhänge: Anhang Nr. 1 (Typ: JPG) [nicht öffentlich] Anhang Nr. 2 (Typ: JPG) [nicht öffentlich]
|
|
|
|
|
Ja, es nimmt leider kein Ende, das Problem ist trotz der nun klaren Aufgabenstellung verwirrend!
> Kurios hieran ist natürlich, dass die Anzahl der
> Verdächtigen (20) überhaupt keine Rolle mehr spielt...
Genau das Problem taucht auch bei meiner vorhergehenden Berechnung auf: Wenn wir die Zahl der Verdächtigen auf sagen wir mal 3 Millionen erhöhen,sollte es nun mindestens 3 genau so stark Verdächtige geben, und der Kandidat dürfte höchstens noch die W. 1/3 für schuldig haben. Im Bild würde sich links aber nur der Kasten "19 andre Tests sind negativ" in "2999999 andre Tests sind negativ" und rechts "18 andre Tests sind negativ" in "2999998 andre Tests sind negativ" verwandelt, die Faktoren darüber von [mm] 0,99998900002^{19} [/mm] bzw. [mm] 0,99998900002^{18} [/mm] in [mm] 0,99998900002^{2999999} [/mm] bzw. [mm] 0,99998900002^{2999998}. [/mm] Dadurch würden die W. in beiden zweigen aber um den selben Faktor sinken, ihr Verhältnis untereinander aber gleich bleiben und somit auch die Unschuldswahrscheinlichkeit, was nicht sein kann.
Gestört hat mich auch, dass die beiden Bäume oben nicht verbunden sind. Hier nun die Korrektur:
Wenn wir dem Kandidaten zubilligen, dass er evtl. gar nicht der Täter ist, müssen wir zunächst vom Testergebnis absehen. Es kommen 20 Personen in Frage, der Kandidat mit der W. 1/20, mit der W. 19/20 ein anderer. Deshalb muss der Baum oben zusammengebunden werden, wie ich es zuvor mit den Würfeln beschrieben habe. Alles bleibt sonst, wie es ist, nur oben links kommt noch der Faktor 0,05, rechts 0,95 hinzu. Dadurch ändern sich nun die Endwerte und auch ihr Verhältnis zueinander:
[Dateianhang nicht öffentlich]
Somit beträgt die Unschuldswahrscheinlichkeit für unseren Kandidaten
[mm] \bruch{0,0000000001044701}{0,0000000001044701+0,0498905}= [/mm] 0,000000002094168.
Bei steigender Anzahl der Kandidaten steigt nun auch die Unschuldsw.
Dateianhänge: Anhang Nr. 1 (Typ: JPG) [nicht öffentlich]
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 09:58 Sa 14.12.2019 | Autor: | sancho1980 |
> In der ursprünglichen Aufgabenstellung steht nicht einmal,
> dass die anderen 19 Verdächtigen überhaupt getestet
> wurden. Daher war davon auszugehen, dass für diese alles
> möglich wäre.
Also ich denke, wenn das Testergebnis der übrigen 19 Verdächtigen nicht bekannt bzw. für die Aufgabe nicht relevant wäre, dann müsste das Ergebnis lauten:
1 - [mm] \bruch{P(T)}{P((\overline{V} \cap (T \cup DNA)) \cup (V \cap \overline{DNA}))} [/mm] = 0,00020995550943 [mm] \hat= [/mm] 0,020995550943 %
T ... er ist der Täter mit P(T) = [mm] \bruch{1}{20}
[/mm]
V ... der Test hat versagt
DNA ... er hat zufällig Täter-DNA
|
|
|
|
|
gelöscht, s. nächste Mitteilung
Dateianhänge: Anhang Nr. 1 (Typ: JPG) [nicht öffentlich] Anhang Nr. 2 (Typ: JPG) [nicht öffentlich] Anhang Nr. 3 (Typ: JPG) [nicht öffentlich]
|
|
|
|
|
> Dann so:
>
> [Dateianhang nicht öffentlich]
>
> [Dateianhang nicht öffentlich]
Mein Fehler bei den vorhergehenden Abschätzungen und Berechnungen war: Für den Fall, dass der Kandidat schuldig ist, habe ich anfangs seine DNA-Wahrscheinlichkeit auf Grund des Tests auf 1/11 geschätzt. Wenn er aber schuldig ist, ist diese 1. Für den Fall, dass er unschuldig ist, habe ich die DNA-Wahrscheinlichkeit des wahren Täters ebenfalls nicht 1, sondern fälschlich auf 0,000001 geschätzt.
Für den Fall, dass der Kandidat nicht der Täter ist, wissen wir nicht, ob er die DNA hat, und so ist die W. für seinen positiven Testausgang dem obigen W.-Baum zu entnehmen.
Damit sind wir jetzt bei dem Zahlenwert der Musterlösung.
Dateianhänge: Anhang Nr. 1 (Typ: JPG) [nicht öffentlich]
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 21:12 So 15.12.2019 | Autor: | sancho1980 |
> Damit sind wir jetzt bei dem Zahlenwert der Musterlösung.
Von der Größenordnung her, ja, aber das waren wir schon ein paar Mal.
Der exakte Wert der Musterlösung ist 0,019% bzw. 0.0208958% (siehe die Anwort des Autors). Lustigerweise kommt man ja angeblich auf exakt letzteren Wert mit meiner offensichtlich falschen Lösung vom 2.12.
Ich habe mittlerweile etwas zusammengeschrieben und werde das jetzt an den Autor schicken mit der Bitte, den offiziellen Lösungsweg preiszugeben. Das ist momentan jedenfalls die Lösung, die ich für korrekt halte. Mit n = 20 komme ich hier auf eine Unschuldswahrscheinlichkeit von 0,000000002089582420194487753684 (0,0000002089582420194487753684 %):
Am Tatort wurden DNA-Proben des Täters sichergestellt. Später wurden n Verdächtige dingfest gemacht, von denen genau einer mit Sicherheit der Täter ist. Dieser soll überführt werden, indem ein DNA-Abgleich aller Verdächtigen mit den am Tatort entnommenen Proben durchgeführt wird.
Im Ergebnis wurde bei n - 1 Verdächtigen keine Übereinstimmung mit der Täter-DNA festgestellt; nur beim Verdächtigen "Mr. X" fiel der Test positiv aus. Die Sache hat nur zwei Haken:
1. Die Trefferquote des Tests beträgt [mm] 99,999\%. [/mm] Es besteht also die 0,001-prozentige Wahrscheinlichkeit, dass "Mr. X" gar nicht die Täter-DNA besitzt.
2. Es besteht die Möglichkeit, dass "Mr. X" nur zufällig die Täter-DNA besitzt. Die Wahrscheinlichkeit hierfür beträgt [mm] 0,0001\%.
[/mm]
Das Gleiche gilt natürlich auch für die übrigen Verdächtigen; wenn der Test für einen von ihnen fehlschlägt, kann das also heißen:
1. Der Verdächtige hat nicht die Täter-DNA (Wahrscheinlichkeit [mm] 99,9999\%), [/mm] und der Test ist bei ihm nicht fehlgeschlagen (Wahrscheinlichkeit [mm] 99,999\%). [/mm] Der Verdächtige ist also unschuldig.
2. Der Verdächtige hat die Täter-DNA (Wahrscheinlichkeit [mm] 0,0001\%), [/mm] und der Test ist bei ihm fehlgeschlagen (Wahrscheinlichkeit [mm] 0,001\%). [/mm] Der Verdächtige könnte in diesem Fall der Täter sein.
Es gilt nun, diejenige Wahrscheinlichkeit auszurechnen, mit der "Mr. X" unschuldig ist. Folgendes muss hierbei beachtet werden: Da "Mr. X" der einzige Verdächtige ist, für den der Test positiv ergab, kann das nur bedeuten, dass der Test in dem Fall, dass "Mr. X" unschuldig ist, beim wahren Täter versagt hat, denn dieser hat die Täter-DNA mit Sicherheit.
Um die Wahrscheinlichkeit einer Unschuld von "Mr. X" formal ausdrücken zu können, wollen wir uns nun überlegen, wie ein Richter nach dieser fragen könnte. Wenn wir seine Unschuld für einen Moment voraussetzen würden, dann wäre doch folgendes Ereignis eingetreten: Der Test hat beim wahren Täter versagt, für irgendeinen unschuldigen Verdächtigen (zufällig eben "Mr. X") positiv ergeben (entweder, weil er die Täter-DNA hat, oder weil der Test für ihn versagt hat) und für jeden der übrigen unschuldigen Verdächtigen negativ ergeben (entweder, weil keine Täter-DNA vorliegt, oder weil der Test versagt hat). Wie wahrscheinlich ist das? Mit eben dieser Wahrscheinlichkeit ist "Mr. X" doch offensichtlich unschuldig!
Wir suchen also
P(E) = [mm] P(V_T \cap (A_1 \cup \ldots \cup A_m)) [/mm] (1)
mit m := n - 1, wobei:
[mm] V_T: [/mm] Der Test hat beim wahren Täter versagt.
[mm] A_{i \in \{1, \ldots, m\}}: [/mm] Der unschuldige Verdächtige an Position i hat das Pech, dass der Test für ihn positiv und für die übrigen unschuldigen Verdächtigen negativ ausgefallen ist, also
[mm] A_i [/mm] = [mm] ((V_i \cap \overline{DNA_i}) \cup (\overline{V_i} \cap DNA_i)) \cap ((N_1 \cap \ldots \cap N_{m})\setminus N_{i}) [/mm] (2)
mit
[mm] N_{i \in \{1, \ldots, m\}} [/mm] = [mm] ((\overline{V_i} \cap \overline{DNA_i}) \cup (V_i \cap DNA_i)) [/mm] (3)
Hierbei bedeutet:
[mm] V_{i \in \{1, \ldots, m\}}: [/mm] Der Test hat beim unschuldigen Verdächtigen an Position i versagt.
[mm] DNA_{i \in \{1, \ldots, m\}}: [/mm] Der unschuldige Verdächtige an Position i hat die Täter-DNA.
Da zum Einen [mm] V_T [/mm] und [mm] (A_1 \cup \ldots \cup A_m) [/mm] unabhängig und zum Anderen [mm] A_1 \ldots A_m [/mm] paarweise unvereinbar sind, lässt sich (1) folgendermaßen schreiben:
P(E) = [mm] P(V_T)(P(A_1) [/mm] + [mm] \ldots [/mm] + [mm] P(A_m))) [/mm] (4)
Und wegen [mm] P(A_i) [/mm] = [mm] P(A_j) [/mm] für beliebige i, j [mm] \in \{1, \ldots, m\}:
[/mm]
P(E) = [mm] P(V_T)(m P(A_1)) [/mm] (5)
Analog gilt für (2), dass die vereinigten Ereignisse unvereinbar und die geschnittenen Ereignisse unabhängig sind, woraus folgt:
[mm] P(A_i) [/mm] = [mm] ((P(V_i) P(\overline{DNA_i})) [/mm] + [mm] (P(\overline{V_i}) P(DNA_i))) \frac{P(N_1) \cdots P(N_m)}{P(N_i)} [/mm] (6)
Auch hier gilt für beliebige i, j [mm] \in \{1, \ldots, m\}, [/mm] dass [mm] P(N_i) [/mm] = [mm] P(N_j), [/mm] womit dann gilt:
[mm] P(A_i) [/mm] = [mm] ((P(V_i) P(\overline{DNA_i})) [/mm] + [mm] (P(\overline{V_i}) P(DNA_i))) P(N_1)^{m - 1} [/mm] (7)
Schließlich gilt für (3) (wieder wegen der Unvereinbarkeit bzw. Unabhängigkeit der Ereignisse):
[mm] P(N_{i \in \{1, \ldots, m\}}) [/mm] = [mm] P(\overline{V_i}) P(\overline{DNA_i}) [/mm] + [mm] P(V_i) P(DNA_i) [/mm] (8)
Setzen wir nun (8) in (7) und dann (7) in (5) ein, so ergibt sich:
P(E) = [mm] P(V_T)(m (P(V_1) P(\overline{DNA_1}) [/mm] + [mm] P(\overline{V_1}) P(DNA_1)) (P(\overline{V_1}) P(\overline{DNA_1}) [/mm] + [mm] P(V_1) P(DNA_1))^{m - 1}) [/mm] (9)
Somit gilt also:
P(E) = 0,00001(m ((0,00001) (0,999999) + (0,99999) (0,000001)) ((0,99999) (0,999999) + (0,00001) [mm] (0,000001))^{m - 1}) [/mm] (10)
|
|
|
|
|
Ich habe leider im Moment keine Zeit, mir deine Rechnungen anzuschauen, will aber nochmal den Ablauf auf ganz einfache Weise aus meiner Sicht erklären.
In 2 000 000 000 000 Paralleluniversen ist der Mord geschehen. Von je 20 Verdächtigen muss einer der Täter sein, er hat die DNA mit Sicherheit. Jeweils ein Verdächtiger wird herausgegriffen und getestet, der Test ist positiv. Die anderen werden (zunächst) NICHT getestet!!!
Der liebe Gott sorgt dafür, dass nun alles exakt nach den Regeln der Wahrscheinlichkeit abläuft.
In 100 000 000 000 Universen wird zufällig genau der Täter herausgegriffen. Er hat die DNA. Das zeigt der Test zu 0,99999 an, so dass 99 999 000 000 Täter als positiv getestete Kandidaten erscheinen. Sie werden mit K markiert.
in 1 900 000 000 000 Universen wird ein Unschuldiger herausgegriffen und getestet. In 0,000001*1 900 000 000 000=1 900 000 Universen hat der Herausgegriffene die DNA, was zu 0,99999 zu einem positiven Test führt. So erhalten wir dort 1 899 981 unschuldige Kandidaten, die ebenfalls mit K markiert werden.
In 0,999999*1 900 000 000 000 = 1 899 998 100 000 Universen hat der Kandidat nicht die DNA, wird aber mit 0,00001 positiv getestet, das gibt 18 999 981 zusätzliche unschuldige, mit K gekennzeichnete Kandidaten.
Wir befinden uns in einem Universum mit einem gekennzeichneten Kandidaten.
In 1 899 981 + 18 999 981 = 20 899 962 Universen ist der gekennzeichnete Kandidat unschuldig.
Insgesamt gibt es 99 999 000 000+20 899 962 = 100 019 899 962 Universen mit gekennzeichneten Kandidaten.
Somit beträgt die W. für einen unschuldigen Kandidaten 20 899 962/100 019 899 962 [mm] \approx [/mm] 0,00020895803743.
Gehen wir jetzt mal davon aus, dass auch die anderen 19 Verdächtigen getestet wurden, alle mit negativem Ausgang.
Dabei müssen wir 2 grundsätzlich verschiedene Auslegungen unterscheiden:
a) Wie oben greifen wir zuerst einen Kandidaten heraus, der ist positiv, dann testen wir die anderen, die sind alle negativ.
b) Es werden 20 Leute, einer positiv und 19 negativ getestet, wir fassen jetzt erst den positiven Kandidaten als möglichen Täter auf und untersuchen nun die W. dafür, dass er nicht der Täter ist.
Im Folgenden müsste ich nun die Anzahl der Universen dramatisch erhöhen, um bei ganzen Zahlen zu bleiben, so dass das Ganze ziemlich unleserlich würde. Deshalb gehe ich jetzt zusätzlich zu Obigem teilweise auf Wahrscheinlichkeiten über und bekomme nicht mehr ganze Zahlen.
------------------------
Zu a)
Oben wurde festgestellt, dass von 1 900 000 000 000 Unschuldigen doch 20 899 962 als positiv getestet werden, also eine Quote von 20 899 962/1 900 000 000 000 = 0,00001099998. Die Quote für einen negativen Test bei einem Unschuldigen beträgt somit 1-0,00001099998 = 0,999989.
Falls der Kandidat nun schuldig ist, sind die anderen als unschuldig anzusehen. Dafür, dass nun alle 19 einen negativen Testausgang haben, ist die W. [mm] 0,999989^{19}= [/mm] 0,99979102...
Aus rechentechnischen Gründen setze ich x = [mm] 0,999989^{18} [/mm] und erhalte 0,999989x.
Damit beträgt nun die Anzahl der Universen mit dem Täter als positiv getesteten Kandidaten 99 999 000 000*0,999989x.
In den 20 899 962 Universen, in denen wir den unschuldigen Kandidaten positiv getestet haben, wurden die anderen 19 ebenfalls negativ getestet. Von denen sind 18 unschuldig, für sie fällt die W. für "alle negativ getestet" mit x aus. Der wahre Täter hat aber die DNA, dass sein Test aber negativ ist, hat nur die W. von 0,00001. Somit ist die Gesamtw. für die anderen 19 negativen Tests hier 0,00001x, also findet so etwas nur in 20 899 962*0,00001x Universen statt.
Damit sinkt die W. für die Unschuld des Kandidaten auf
[mm] \bruch{20 899 962*0,00001x}{99 999 000 000*0,999989x + 20 899 962*0,00001x}=\bruch{20 899 962*0,00001}{99 999 000 000*0,999989 + 20 899 962*0,00001}=0,0000000020900400...
[/mm]
--------------------
zu b)
Hier rechne ich jetzt nur noch mit Wahrscheinlichkeiten, weil ich mir nicht wieder ganze Zahlen überlegen will.
Falls der Kandidat schuldig ist, hat er die DNA. Dies wird mit einer W. von 0,99999 angezeigt. Die anderen Kandidaten sind dann unschuldig, dafür, dass alle einen negativen Test erzielen, beträgt die W. wie bei a) 0,999989x. Damit ist die W. für den erfolgten Ablauf 0,99999*0,999989x.
Falls der Kandidat unschuldig ist, ist die W. dafür, dass sein Test positiv ausgeht, wie bei a) 0,00001099998. Dafür, dass der Test dann aber auch noch bei dem wahren Täter, der ja die DNA hat, negativ ausgeht, ist die W. 0,00001. Und damit die anderen 18 auch einen negativen Testausgang haben, kommt noch x hinzu. Macht zusammen 0,00001099998*0,00001*x.
Damit beträgt die W. für die Unschuld des Kandidaten [mm] \bruch{0,00001099998*0,00001x}{0,00001099998*0,00001x+0,99999*0,999989x}=\bruch{0,00001099998*0,00001}{0,00001099998*0,00001+0,99999*0,999989}\approx [/mm] 0,00000000011000...
|
|
|
|
|
> > Damit sind wir jetzt bei dem Zahlenwert der Musterlösung.
>
> Von der Größenordnung her, ja, aber das waren wir schon
> ein paar Mal.
> Der exakte Wert der Musterlösung ist 0,019% bzw.
> 0.0208958% (siehe die Anwort des Autors). Lustigerweise
> kommt man ja angeblich auf exakt letzteren Wert mit meiner
> offensichtlich falschen Lösung vom 2.12.
> Ich habe mittlerweile etwas zusammengeschrieben und werde
> das jetzt an den Autor schicken mit der Bitte, den
> offiziellen Lösungsweg preiszugeben. Das ist momentan
> jedenfalls die Lösung, die ich für korrekt halte. Mit n =
> 20 komme ich hier auf eine Unschuldswahrscheinlichkeit von
> 0,000000002089582420194487753684 Das entspricht bis auf Rundungsfehler meinem Wert in der Beispielrechnung im 2. Teil, Fall a).
> (0,0000002089582420194487753684 %):
>
> Am Tatort wurden DNA-Proben des Täters sichergestellt.
> Später wurden n Verdächtige dingfest gemacht, von denen
> genau einer mit Sicherheit der Täter ist. Dieser soll
> überführt werden, indem ein DNA-Abgleich aller
> Verdächtigen mit den am Tatort entnommenen Proben
> durchgeführt wird.
> Im Ergebnis wurde bei n - 1 Verdächtigen keine
> Übereinstimmung mit der Täter-DNA festgestellt; nur beim
> Verdächtigen "Mr. X" fiel der Test positiv aus. Die Sache
> hat nur zwei Haken:
>
> 1. Die Trefferquote des Tests beträgt [mm]99,999\%.[/mm]
> Es besteht also die 0,001-prozentige Wahrscheinlichkeit, dass "Mr. X"
> gar nicht die Täter-DNA besitzt.
falsch! Bis auf winzige Abweichungen gilt: Von 1 000 001 Menschen hat einer die DNA und wird praktisch positiv getestet. Von den anderen 1 000 000 Menschen hat keiner die DNA, wegen des Testfehlers werden aber 10 davon positiv getestet. Von 11 positiv getesteten hat nur einer wirklich die DNA! Mr. X hat sie also nur mit einer W. von 9,0909..%. Damit besitzt er sie mit 90,909... % nicht!
Wenn er die DNA hat, ist der Test zu 99,999% positiv. Das kannst du aber nicht umkehren zu : Wenn der Test positiv ist, hat er zu 99,999 % die DNA. Du kannst z.B. sagen: Wenn er der Täter ist, hat er zu 100 % die DNA, aber daraus nicht folgern: Wenn er die DNA hat, ist er zu 100 % der Täter.
Die Sachlage verkompliziert sich aber auch noch dadurch, dass auf jeden Fall mindestens einer die DNA haben muss, obwohl sie so selten vorkommt.
> 2. Es besteht die Möglichkeit, dass "Mr. X" nur zufällig
> die Täter-DNA besitzt. Die Wahrscheinlichkeit hierfür
> beträgt [mm]0,0001\%.[/mm]
>
> Das Gleiche gilt natürlich auch für die übrigen
> Verdächtigen; wenn der Test für einen von ihnen
> fehlschlägt, kann das also heißen:
>
> 1. Der Verdächtige hat nicht die Täter-DNA
> (Wahrscheinlichkeit [mm]99,9999\%),[/mm] und der Test ist bei ihm
> nicht fehlgeschlagen (Wahrscheinlichkeit [mm]99,999\%).[/mm] Der
> Verdächtige ist also unschuldig.
> 2. Der Verdächtige hat die Täter-DNA (Wahrscheinlichkeit
> [mm]0,0001\%),[/mm] und der Test ist bei ihm fehlgeschlagen
> (Wahrscheinlichkeit [mm]0,001\%).[/mm] Der Verdächtige könnte in
> diesem Fall der Täter sein.
>
> Es gilt nun, diejenige Wahrscheinlichkeit auszurechnen, mit
> der "Mr. X" unschuldig ist. Folgendes muss hierbei beachtet
> werden: Da "Mr. X" der einzige Verdächtige ist, für den
> der Test positiv ergab, kann das nur bedeuten, dass der
> Test in dem Fall, dass "Mr. X" unschuldig ist, beim wahren
> Täter versagt hat, denn dieser hat die Täter-DNA mit
> Sicherheit.
>
> Um die Wahrscheinlichkeit einer Unschuld von "Mr. X" formal
> ausdrücken zu können, wollen wir uns nun überlegen, wie
> ein Richter nach dieser fragen könnte. Wenn wir seine
> Unschuld für einen Moment voraussetzen würden, dann wäre
> doch folgendes Ereignis eingetreten: Der Test hat beim
> wahren Täter versagt, für irgendeinen unschuldigen
> Verdächtigen (zufällig eben "Mr. X") positiv ergeben
> (entweder, weil er die Täter-DNA hat, oder weil der Test
> für ihn versagt hat) und für jeden der übrigen
> unschuldigen Verdächtigen negativ ergeben (entweder, weil
> keine Täter-DNA vorliegt, oder weil der Test versagt hat).
> Wie wahrscheinlich ist das? Mit eben dieser
> Wahrscheinlichkeit ist "Mr. X" doch offensichtlich
> unschuldig!
>
> Wir suchen also
>
> P(E) = [mm]P(V_T \cap (A_1 \cup \ldots \cup A_m))[/mm] (1)
>
> mit m := n - 1, wobei:
>
>
> [mm]V_T:[/mm] Der Test hat beim wahren Täter versagt.
>
> [mm]A_{i \in \{1, \ldots, m\}}:[/mm] Der unschuldige Verdächtige an
> Position i hat das Pech, dass der Test für ihn positiv und
> für die übrigen unschuldigen Verdächtigen negativ
> ausgefallen ist, also
>
> [mm]A_i[/mm] = [mm]((V_i \cap \overline{DNA_i}) \cup (\overline{V_i} \cap DNA_i)) \cap ((N_1 \cap \ldots \cap N_{m})\setminus N_{i})[/mm]
> (2)
>
> mit
>
> [mm]N_{i \in \{1, \ldots, m\}}[/mm] = [mm]((\overline{V_i} \cap \overline{DNA_i}) \cup (V_i \cap DNA_i))[/mm]
> (3)
>
> Hierbei bedeutet:
>
>
> [mm]V_{i \in \{1, \ldots, m\}}:[/mm] Der Test hat beim unschuldigen
> Verdächtigen an Position i versagt.
>
> [mm]DNA_{i \in \{1, \ldots, m\}}:[/mm] Der unschuldige Verdächtige
> an Position i hat die Täter-DNA.
>
> Da zum Einen [mm]V_T[/mm] und [mm](A_1 \cup \ldots \cup A_m)[/mm] unabhängig
> und zum Anderen [mm]A_1 \ldots A_m[/mm] paarweise unvereinbar sind,
> lässt sich (1) folgendermaßen schreiben:
>
> P(E) = [mm]P(V_T)(P(A_1)[/mm] + [mm]\ldots[/mm] + [mm]P(A_m)))[/mm] (4)
>
> Und wegen [mm]P(A_i)[/mm] = [mm]P(A_j)[/mm] für beliebige i, j [mm]\in \{1, \ldots, m\}:[/mm]
>
> P(E) = [mm]P(V_T)(m P(A_1))[/mm] (5)
>
> Analog gilt für (2), dass die vereinigten Ereignisse
> unvereinbar und die geschnittenen Ereignisse unabhängig
> sind, woraus folgt:
>
> [mm]P(A_i)[/mm] = [mm]((P(V_i) P(\overline{DNA_i}))[/mm] + [mm](P(\overline{V_i}) P(DNA_i))) \frac{P(N_1) \cdots P(N_m)}{P(N_i)}[/mm]
> (6)
>
> Auch hier gilt für beliebige i, j [mm]\in \{1, \ldots, m\},[/mm]
> dass [mm]P(N_i)[/mm] = [mm]P(N_j),[/mm] womit dann gilt:
>
> [mm]P(A_i)[/mm] = [mm]((P(V_i) P(\overline{DNA_i}))[/mm] + [mm](P(\overline{V_i}) P(DNA_i))) P(N_1)^{m - 1}[/mm]
> (7)
>
> Schließlich gilt für (3) (wieder wegen der
> Unvereinbarkeit bzw. Unabhängigkeit der Ereignisse):
>
> [mm]P(N_{i \in \{1, \ldots, m\}})[/mm] = [mm]P(\overline{V_i}) P(\overline{DNA_i})[/mm]
> + [mm]P(V_i) P(DNA_i)[/mm] (8)
>
> Setzen wir nun (8) in (7) und dann (7) in (5) ein, so
> ergibt sich:
>
> P(E) = [mm]P(V_T)(m (P(V_1) P(\overline{DNA_1})[/mm] +
> [mm]P(\overline{V_1}) P(DNA_1)) (P(\overline{V_1}) P(\overline{DNA_1})[/mm]
> + [mm]P(V_1) P(DNA_1))^{m - 1})[/mm] (9)
>
> Somit gilt also:
>
> P(E) = 0,00001(m ((0,00001) (0,999999) + (0,99999)
> (0,000001)) ((0,99999) (0,999999) + (0,00001)
> [mm](0,000001))^{m - 1})[/mm] (10)
|
|
|
|
|
Da du immer wieder versuchst, das Ganze mit den Formeln von Bayes darzustellen, habe ich mich mal drangesetzt und das Ganze aufgedröselt. Das ist mir aber erst gelungen, nachdem ich den Vorgang jetzt endlich verstanden habe. Die von dir in den vorhergehenden Beiträgen benutzen Wahrscheinlichkeiten mit Durchschnitten und Bedingungen waren für mich ziemlich unerklärlich. Ich selber wusste auch nicht, was ich z.B. unter P(POS) zu verstehen hatte.
Vorbereitung:
[mm] P(POS)=P(POS\cap DNA)+P(POS\cap\overline{DNA)}=P(POS|DNA)*P(DNA)+P(POS|\overline{DNA)}*P(\overline{DNA)}=0,99999*0,000001+0,00001*0,999999 [/mm] = 0,00001099998 = voraussetzungslose Wahrscheinlichkeit für einen positiven Test
S = Kandidat ist schuldig
P(S)=1/20 voraussetzungslose W. für die Schuld des herausgegriffenen Kandidaten.
[mm] P(POS|\overline{S})= [/mm] P(POS), da der Unschuldige keine weiteren Voraussetzungen für einen positiven Testausgang mitbringt (im Gegensatz zum Schuldigen, da der die DNA hat).
P(POS|S) = P(POS|DNA) = 0,99999, da der Schuldige die DNA hat.
Rechnung:
[mm] P(\overline{S}|POS)= [/mm] (BAYES) [mm] \bruch{P(POS|\overline{S})*P(\overline{S})}{P(POS|\overline{S})*P(\overline{S})+P(POS|S)*P(S)}= \bruch{P(POS)*P(\overline{S})}{P(POS)*P(\overline{S})+P(POS|DNA)*P(S)}= \bruch{0,00001099998*19/20}{0,00001099998*19/20+0,99999*1/20} [/mm] = 0,0002089580374
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 09:44 Sa 21.12.2019 | Autor: | sancho1980 |
Hallo!
Ja, wollte gerade die Musterlösung posten, welche ich mittlerweile vom Autoren bekommen habe (bin die letzten Tage nicht dazu gekommen).
Es ist exakt die gleiche Formel wie deine, als spare ich mir das.
Aber noch eine Anmerkung:
meine Frage, ob die Aufgabe so zu verstehen ist, dass der Test nur bei Mr.X positiv (und sonst bei keinem anderen Verdächtigen) ausfiel, hatte der Autor bejaht. Das sehe ich in dieser Lösung eigtl. nicht berücksichtigt.
|
|
|
|