Stochastik 4.2 - Spam-Mails
Stochastik: Spam-Mail
Ein Nutzer von E-Mail-Kommunikation stellt fest, dass der Anteil von unerwünschten Werbe-E-Mails (Spam-Mails) an seinen Posteingang über einen längeren Zeitraum konstantAngenommen wird dabei, dass die Spam-Mails zufällig und unabhängig voneinander eingehen.
a)
Berechne die Wahrscheinlichkeit für folgende Ereignisse.
A: „Von fünf eingegangenen E-Mails ist keine eine Spam-Mail.“
B: „Von fünf eingegangenen E-Mails ist nur genau die letzte eine Spam-Mail.“
B: „Von fünf eingegangenen E-Mails ist nur genau die letzte eine Spam-Mail.“
(3 BE)
b)
In einer Woche befinden sich
Mails im Posteingang.
Ermittle die Wahrscheinlichkeit dafür, dass die Anzahl der Spam-Mails in dieser Woche um mehr als
über dem Erwartungswert liegt.
Die Spam-Mails enthalten Schlüsselwörter, an denen man sie sehr gut erkennt und durch die der Spam-Filter sie aussortiert. In Ermittle die Wahrscheinlichkeit dafür, dass die Anzahl der Spam-Mails in dieser Woche um mehr als
(3 BE)
c)
Stelle diesen Sachverhalt in einer Vierfeldertafel dar.
(4 BE)
d)
Ermittle die Wahrscheinlichkeit dafür, dass eine vom Spam-Filter durch das Wort „sale“ aussortierte E-Mail keine Spam-Mail ist.
In
(2 BE)
e)
Paul behauptet, dass der Anteil der E-Mails, die durch die Worte „sale“ oder „season“ als Spam erkannt werden, an allen E-Mails
beträgt.
Begründe ohne Rechnung, dass diese Behauptung im Allgemeinen falsch ist.
Begründe ohne Rechnung, dass diese Behauptung im Allgemeinen falsch ist.
(2 BE)
f)
Der Anteil der Spam-Mails, die durch die Worte „sale“ oder „season“ als Spam erkannt werden, beträgt
Berechne den Anteil der Spam-Mails, in denen beide Worte vorkommen.
Nach einem Jahr wird in einer Fachzeitschrift behauptet, dass sich der Anteil der Spam-Mails an den eingehenden E-Mails verändert hat. Jemand will das für den Anteil von ursprünglich Berechne den Anteil der Spam-Mails, in denen beide Worte vorkommen.
(3 BE)
g)
Entscheide, welche Art von Entscheidungsregel geeignet ist und begründe deine Entscheidung:
Entscheidungsregel 1: Wenn
gilt, dann wird
abgelehnt.
Entscheidungsregel 2: Wenn
gilt, dann wird
nicht abgelehnt.
Der Nutzer behauptet nun, dass sich der Anteil der E-Mails, die Spam-Mails sind, in seinem E-Mail-Eingang vergrößert hat.
Entscheidungsregel 2: Wenn
(3 BE)
h)
Berechne unter Annahme der Binomialverteilung, in welchem Bereich die Anzahl der Spam-Mails in einer Stichprobe von
E-Mails sein muss, um die Vermutung des Nutzers auf einem Signifikanzniveau von
zu stützen.
(5 BE)
(25 BE)
Stochastik: Spam-Mail
a)
Wahrscheinlichkeit für das Ereignis
berechnen:
Die Wahrscheinlichkeit für das Ereignis
beträgt
.
Wahrscheinlichkeit für das Ereignis
berechnen:
Die Wahrscheinlichkeit für das Ereignis
beträgt
.
b)
Wahrscheinlichkeit berechnen:
Definiere eine Zufallsvariable
.
: Anzahl der Spam-Mails in dieser Woche
ist binomialverteilt mit
(
und
).
Der Erwartungswert von
wird berechnet durch
.
über
:
Die gesuchte Wahrscheinlichkeit wird mit Hilfe eines CAS-Taschenrechners bestimmt.
TI nspire CAS
Casio Classpad II
Die Wahrscheinlichkeit, dass die Anzahl der Spam-Mails in dieser Woche um mehr als
über dem Erwartungswert liegt, beträgt
.
Definiere eine Zufallsvariable
Der Erwartungswert von
Die gesuchte Wahrscheinlichkeit wird mit Hilfe eines CAS-Taschenrechners bestimmt.
menu
5
5
E: Binomial Cdf
Interaktiv
Verteilungsfunktionen
Diskret
binomial CDf
c)
Sachverhalt in Vierfeldertafel darstellen:
Spam | kein Spam | Gesamt | |
---|---|---|---|
"sale" | |||
kein "sale" | |||
Gesamt |
d)
Wahrscheinlichkeit berechnen:
Die Wahrscheinlichkeit, dass eine vom Spam-Filter durch das Wort "sale" aussortierte E-Mail keine Spam-Mail ist, beträgt
.
e)
Behauptung überprüfen:
Pauls Behauptung ist nicht wahr, da es nicht ausgeschlossen ist, dass beide Schlüsselwörter zusammen in einer E-Mail vorkommen.
Pauls Behauptung ist nicht wahr, da es nicht ausgeschlossen ist, dass beide Schlüsselwörter zusammen in einer E-Mail vorkommen.
f)
Anteil berechnen:
Der Anteil der Spam-Mails, in denen beide Worte vorkommen, beträgt
.
Der Anteil der Spam-Mails, in denen beide Worte vorkommen, beträgt
g)
Entscheidungsregel
: Wenn
gilt, dann wird
abgelehnt.
Entscheidungsregel
: Wenn
gilt, dann wird
nicht abgelehnt.
Entscheidungsregel auswählen und begründen:
Die Untersuchung benötigt einen zweiseitigen Signifikanztest, da sich der Anteil der Spam-Mail vergrößert oder verkleinert haben kann. Daraus folgt, dass die Entscheidungsregel
geeignet ist.
Entscheidungsregel
: Wenn
gilt, dann wird
nicht abgelehnt.
Entscheidungsregel
Die Untersuchung benötigt einen zweiseitigen Signifikanztest, da sich der Anteil der Spam-Mail vergrößert oder verkleinert haben kann. Daraus folgt, dass die Entscheidungsregel
Entscheidungsregel
h)
Rechtsseitigen Signifikanztest durchführen:
Gesucht ist der kleinste Wert
mit:
.
Für
gilt:
.
Für
gilt:
.
Ablehnungsbereich:
{
}
Falls das Stichprobenereignis im Ablehnungsbereich liegt, wird die Nullhypothese verworfen.
Die Anzahl der Spam-Mails muss in der Stichprobe mindestens
sein, um die Vermutung des Nutzers zu stützen.
Gesucht ist der kleinste Wert
Für
Ablehnungsbereich:
Falls das Stichprobenereignis im Ablehnungsbereich liegt, wird die Nullhypothese verworfen.
Die Anzahl der Spam-Mails muss in der Stichprobe mindestens