Sie beschreibt die Anzahl der Erfolge in einer Serie von gleichartigen und unabhängigen Versuchen, die jeweils genau zwei mögliche Ergebnisse haben („Erfolg“ oder „Misserfolg“). Solche Versuchsserien werden auch Bernoulli-Prozesse genannt. Im Urnenmodell wird ein solcher Versuch als Ziehen mit Zurücklegen bezeichnet.
Ist die Erfolgswahrscheinlichkeit bei einem Versuch und die Anzahl der Versuche, dann bezeichnet man mit (auch [1], , [2] oder [3]) die Wahrscheinlichkeit, genau Erfolge zu erzielen (siehe Abschnitt Definition).
Die Binomialverteilung und der Bernoulli-Versuch können mit Hilfe des Galtonbretts veranschaulicht werden. Dabei handelt es sich um eine mechanische Apparatur, in die man Kugeln wirft. Diese fallen dann zufällig in eines von mehreren Fächern, wobei die Aufteilung der Binomialverteilung entspricht. Je nach Konstruktion sind unterschiedliche Parameter und möglich.
Obwohl die Binomialverteilung bereits lange vorher bekannt war, wurde der Begriff zum ersten Mal 1911 in einem Buch von George Udny Yule verwendet.[4]
heißt die Binomialverteilung zu den Parametern (Anzahl der Versuche) und (der Erfolgs- oder Trefferwahrscheinlichkeit).
Bei dieser Formel wird die Konvention angewendet (siehe dazu null hoch null).
ist der Binomialkoeffizient.
Eine Zufallsvariable, deren Wahrscheinlichkeitsverteilung eine Binomialverteilung ist, heißt binomialverteilt. Die Binomialverteilung mit den Parametern und wird mit oder bezeichnet. Wenn eine Zufallsvariable die Binomialverteilung besitzt, so wird dies notiert.
Die obige Formel kann so verstanden werden: Wir brauchen bei insgesamt Versuchen genau Erfolge der Wahrscheinlichkeit und haben demzufolge genau Fehlschläge der Wahrscheinlichkeit . Allerdings kann jeder der Erfolge bei jedem der Versuche auftreten, sodass wir noch mit der Anzahl der -elementigen Teilmengen einer -elementigen Menge multiplizieren müssen. Denn genau so viele Möglichkeiten gibt es, aus allen Versuchen die erfolgreichen auszuwählen.
Die zur Erfolgswahrscheinlichkeit komplementäre Ausfallwahrscheinlichkeit wird häufig mit abgekürzt.
Wie für eine Wahrscheinlichkeitsverteilung notwendig, müssen sich die Wahrscheinlichkeiten für alle möglichen Werte zu 1 summieren. Dies ergibt sich aus dem binomischen Lehrsatz wie folgt:
Eine mit der Wahrscheinlichkeitsfunktion verteilte Zufallsgröße heißt dementsprechend binomialverteilt mit den Parametern und sowie der Verteilungsfunktion
Weitere gebräuchliche Schreibweisen der kumulierten Binomialverteilung sind , [5] und .[6]
Herleitung als Laplace-Wahrscheinlichkeit
Versuchsschema: Eine Urne enthält Bälle, davon sind schwarz und weiß.
Die Wahrscheinlichkeit , einen schwarzen Ball zu ziehen, ist also .
Es werden nacheinander zufällig Bälle entnommen, ihre Farbe bestimmt und wieder zurückgelegt.
Wir berechnen die Anzahl der Möglichkeiten, in denen man schwarze Bälle findet, und daraus die sogenannte Laplace-Wahrscheinlichkeit („Anzahl der für das Ereignis günstigen Möglichkeiten, geteilt durch die Gesamtanzahl der (gleichwahrscheinlichen) Möglichkeiten“).
Bei jeder der Ziehungen gibt es Möglichkeiten, insgesamt also Möglichkeiten für die Auswahl der Bälle. Damit genau dieser Bälle schwarz sind, müssen genau der Ziehungen einen schwarzen Ball aufweisen. Für jeden schwarzen Ball gibt es Möglichkeiten, und für jeden weißen Ball Möglichkeiten.
Die schwarzen Bälle können noch auf mögliche Weisen über die Ziehungen verteilt sein, also gibt es
Fälle, bei denen genau schwarze Bälle ausgewählt worden sind. Die Wahrscheinlichkeit , unter Bällen genau schwarze zu finden, ist also
Beispiele
Spielwürfel
Die Wahrscheinlichkeit, mit einem fairen Spielwürfel eine 6 zu würfeln, beträgt . Die Wahrscheinlichkeit , dass dies nicht der Fall ist, beträgt . Angenommen, man würfelt 10-mal (), dann beträgt die Wahrscheinlichkeit, dass kein einziges Mal eine 6 gewürfelt wird, . Die Wahrscheinlichkeit, dass genau 2-mal eine 6 gewürfelt wird, beträgt . Allgemein wird die Wahrscheinlichkeit, dass man -mal eine solche Zahl würfelt , durch die Binomialverteilung beschrieben.
Häufig wird der durch die Binomialverteilung beschriebene Prozess auch durch ein sogenanntes Urnenmodell illustriert. In einer Urne seien z. B. 6 Kugeln, 1 davon weiß, die anderen schwarz. Man greife nun 10-mal in die Urne, hole eine Kugel heraus, notiere deren Farbe und lege die Kugel wieder zurück. In einer speziellen Deutung dieses Prozesses wird das Ziehen einer weißen Kugel als positives Ereignis mit der Wahrscheinlichkeit verstanden, das Ziehen einer nicht-weißen Kugel als negatives Ereignis. Die Wahrscheinlichkeiten sind genauso verteilt wie im Beispiel mit dem Spielwürfel.
Münzwurf
Eine Münze wird 7-mal geworfen. Wenn die diskrete Zufallsvariable die Anzahl der Würfe zählt, mit denen „Zahl“ geworfen wird, ergibt sich für eine Binomialverteilung mit der Wahrscheinlichkeitsfunktion
Die Werte und ihre Wahrscheinlichkeiten lassen sich in folgender Tabelle zusammenfassen:
Alternativ kann man verwenden, dass eine -verteilte Zufallsvariable als eine Summe von unabhängigen Bernoulli-verteilten Zufallsvariablen mit geschrieben werden kann. Mit der Linearität des Erwartungswertes folgt dann
Alternativ kann man ebenfalls mit Hilfe des binomischen Lehrsatzes folgenden Beweis geben: Differenziert man bei der Gleichung
beide Seiten nach , ergibt sich
,
also
.
Mit und folgt das gewünschte Ergebnis.
Varianz
Eine binomialverteilte Zufallsvariable besitzt die Varianz.
Beweis
Es sei eine -verteilte Zufallsvariable. Die Varianz bestimmt sich direkt aus dem Verschiebungssatz zu
oder alternativ aus der Gleichung von Bienaymé, angewendet auf die Varianz unabhängiger Zufallsvariablen, wenn man berücksichtigt, dass die identisch verteilten Zufallsvariablen der Bernoulli-Verteilung mit genügen, zu
Die zweite Gleichheit gilt, weil die Einzelexperimente unabhängig sind, sodass die Einzelvariablen unkorreliert sind.
Der Modus, also der Wert mit der maximalen Wahrscheinlichkeit, ist für gleich und für gleich . Falls eine natürliche Zahl ist, ist ebenfalls ein Modus. Falls der Erwartungswert eine natürliche Zahl ist, ist der Erwartungswert gleich dem Modus.
Beweis
Sei ohne Einschränkung . Wir betrachten den Quotienten
.
Nun gilt , falls und , falls . Also:
Und nur im Fall hat der Quotient den Wert 1, d. h. .
Median
Es ist nicht möglich, eine allgemeine Formel für den Median der Binomialverteilung anzugeben. Daher sind verschiedene Fälle zu betrachten, die einen geeigneten Median liefern:
Ist eine natürliche Zahl, dann stimmen Erwartungswert, Median und Modus überein und sind gleich .[7][8]
Für die Summe zweier unabhängiger binomialverteilter Zufallsgrößen und mit den Parametern , und , erhält man die Einzelwahrscheinlichkeiten durch Anwendung der Vandermondeschen Identität
also wieder eine binomialverteilte Zufallsgröße, jedoch mit den Parametern und . Somit gilt für die Faltung
Wenn die Summe bekannt ist, folgt jede der Zufallsvariablen und unter dieser Bedingung einer hypergeometrischen Verteilung. Dazu berechnet man die bedingte Wahrscheinlichkeit:
Allgemein gilt: Wenn die Zufallsvariablen stochastisch unabhängig sind und den Binomialverteilungen genügen, dann ist auch die Summe binomialverteilt, jedoch mit den Parametern und . Addiert man binomialverteilte Zufallsvariablen mit , dann erhält man eine verallgemeinerte Binomialverteilung.
Beziehung zu anderen Verteilungen
Beziehung zur Bernoulli-Verteilung
Ein Spezialfall der Binomialverteilung für ist die Bernoulli-Verteilung. Die Summe von unabhängigen und identischen Bernoulli-verteilten Zufallsgrößen genügt demnach der Binomialverteilung.
Beziehung zur verallgemeinerten Binomialverteilung
Die Binomialverteilung ist ein Spezialfall der verallgemeinerten Binomialverteilung mit für alle .
Genauer ist sie für festen Erwartungswert und feste Ordnung diejenige verallgemeinerte Binomialverteilung mit maximaler Entropie.[11]
Übergang zur Normalverteilung
Nach dem Satz von Moivre-Laplace konvergiert die Binomialverteilung im Grenzfall gegen eine Normalverteilung, d. h., die Normalverteilung kann als brauchbare Näherung der Binomialverteilung verwendet werden, wenn der Stichprobenumfang hinreichend groß und der Anteil der gesuchten Ausprägung nicht zu klein ist. Mit dem Galtonbrett kann man die Annäherung an die Normalverteilung experimentell nachempfinden.
Es gilt und Durch Einsetzen in die Verteilungsfunktion der Standardnormalverteilung folgt
Wie zu sehen, ist das Ergebnis damit nichts anderes als der Funktionswert der Normalverteilung für , sowie (den man sich anschaulich auch als Flächeninhalt des -ten Streifens des Histogramms der standardisierten Binomialverteilung mit als dessen Breite sowie als dessen Höhe vorstellen kann).[12] Die Annäherung der Binomialverteilung an die Normalverteilung wird bei der Normal-Approximation genutzt, um schnell die Wahrscheinlichkeit vieler Stufen der Binomialverteilung zu bestimmen, zumal dann, wenn für diese keine Tabellenwerte (mehr) vorliegen.
Übergang zur Poisson-Verteilung
Eine asymptotisch asymmetrische Binomialverteilung, deren Erwartungswert für und gegen eine Konstante konvergiert, kann man durch die Poisson-Verteilung annähern. Der Wert ist dann für alle in der Grenzwertbildung betrachteten Binomialverteilungen wie auch für die resultierende Poisson-Verteilung der Erwartungswert. Diese Annäherung wird auch als Poisson-Approximation, Poissonscher Grenzwertsatz oder als das Gesetz seltener Ereignisse bezeichnet.
Eine Faustregel besagt, dass diese Näherung brauchbar ist, wenn und .
Die Poisson-Verteilung ist also die Grenzverteilung der Binomialverteilung für große und kleine , es handelt sich hierbei um Konvergenz in Verteilung.
Beziehung zur geometrischen Verteilung
Die Zahl der Misserfolge bis zum erstmaligen Eintritt eines Erfolgs wird durch die geometrische Verteilung beschrieben.
Beziehung zur negativen Binomialverteilung
Die negative Binomialverteilung hingegen beschreibt die Wahrscheinlichkeitsverteilung der Anzahl der Versuche, die erforderlich sind, um in einem Bernoulli-Prozess eine vorgegebene Anzahl von Erfolgen zu erzielen. In der Tabelle werden beide Verteilungen veranschaulicht:
Deterministisch
Zufällig
Fragestellung
Binomialverteilung
Versuche
Erfolge
Wie viele Erfolge haben wir in Versuchen?
Negative Binomialverteilung
Erfolge
Versuche
Wie viele Versuche sind erforderlich, um Erfolge zu haben?
Beziehung zur hypergeometrischen Verteilung
Bei der Binomialverteilung werden die ausgewählten Stichproben wieder in die Auswahlmenge zurückgeführt, können also zu einem späteren Zeitpunkt erneut ausgewählt werden. Werden im Gegensatz dazu die Stichproben nicht in die Grundgesamtheit zurückgegeben, kommt die hypergeometrische Verteilung zur Anwendung. Die beiden Verteilungen gehen bei großem Umfang der Grundgesamtheit und geringem Umfang der Stichproben ineinander über. Als Faustregel gilt, dass für auch bei Nichtzurücklegen der Stichproben die Binomialverteilung statt der mathematisch anspruchsvolleren hypergeometrischen Verteilung verwendet werden kann, da beide in diesem Fall nur unwesentlich voneinander abweichende Ergebnisse liefern.
Die Binomialverteilung ist ein Spezialfall der Pólya-Verteilung (wähle ).
Beispiele
Symmetrische Binomialverteilung (p = 1/2)
p = 0,5 und n = 4, 16, 64
Mittelwert abgezogen
Skalierung mit Standardabweichung
Dieser Fall tritt auf beim -fachen Münzwurf mit einer fairen Münze (Wahrscheinlichkeit für Kopf gleich der für Zahl, also gleich 1/2). Die erste Abbildung zeigt die Binomialverteilung für und für verschiedene Werte von als Funktion von . Diese Binomialverteilungen sind spiegelsymmetrisch um den Wert :
Dies ist in der zweiten Abbildung veranschaulicht.
Die Breite der Verteilung wächst proportional zur Standardabweichung. Der Funktionswert bei , also das Maximum der Kurve, sinkt proportional zu .
Dementsprechend kann man Binomialverteilungen mit unterschiedlichem aufeinander skalieren, indem man die Abszisse durch teilt und die Ordinate mit multipliziert (dritte Abbildung oben).
Die nebenstehende Graphik zeigt noch einmal reskalierte Binomialverteilungen, nun für andere Werte von und in einer Auftragung, die besser verdeutlicht, dass sämtliche Funktionswerte mit steigendem gegen eine gemeinsame Kurve konvergieren. Indem man die Stirling-Formel auf die Binomialkoeffizienten anwendet, erkennt man, dass diese Kurve (im Bild schwarz durchgezogen) eine Gaußsche Glockenkurve ist:
Die zweite nebenstehende Graphik zeigt die gleichen Daten in einer halblogarithmischen Auftragung. Dies ist dann zu empfehlen, wenn man überprüfen möchte, ob auch seltene Ereignisse, die um mehrere Standardabweichungen vom Erwartungswert abweichen, einer Binomial- oder Normalverteilung folgen.
Ziehen von Kugeln
In einem Behälter befinden sich 80 Kugeln, davon sind 16 gelb. Es wird 5-mal eine Kugel entnommen und anschließend wieder zurückgelegt. Wegen des Zurücklegens ist die Wahrscheinlichkeit, eine gelbe Kugel zu ziehen, bei allen Entnahmen gleich groß, und zwar 16/80 = 1/5. Der Wert gibt die Wahrscheinlichkeit dafür an, dass genau der entnommenen Kugeln gelb sind. Als Beispiel rechnen wir :
In ungefähr 5 % der Fälle zieht man also genau 3 gelbe Kugeln.
B(k | 0,2; 5)
k
Wahrscheinlichkeit in %
0
0032,768
1
0040,96
2
0020,48
3
0005,12
4
0000,64
5
0000,032
∑
0100
Erw.Wert
0001
Varianz
0000.8
Anzahl der Personen mit Geburtstag am Wochenende
Die Wahrscheinlichkeit, dass eine Person in diesem Jahr an einem Wochenende Geburtstag hat, betrage (der Einfachheit halber) 2/7. In einem Raum halten sich 10 Personen auf. Der Wert gibt (im vereinfachten Modell) die Wahrscheinlichkeit dafür an, dass genau der Anwesenden in diesem Jahr an einem Wochenende Geburtstag haben.
B(k | 2/7; 10)
k
Wahrscheinlichkeit in % (gerundet)
0
0003,46
1
0013,83
2
0024,89
3
0026,55
4
0018,59
5
0008,92
6
0002,97
7
0000,6797
8
0000,1020
9
0000,009063
10
0000,0003625
∑
0100
Erw.Wert
0002,86
Varianz
0002,04
Gemeinsamer Geburtstag im Jahr
253 Personen sind zusammengekommen. Der Wert gibt die Wahrscheinlichkeit an, dass genau Anwesende an einem zufällig gewählten Tag Geburtstag haben (ohne Beachtung des Jahrganges).
B(k | 1/365; 253)
k
Wahrscheinlichkeit in % (gerundet)
0
049,95
1
034,72
2
012,02
3
002,76
4
000,47
Die Wahrscheinlichkeit, dass „irgendjemand“ dieser 253 Personen, d. h. eine oder mehrere Personen, an diesem Tag Geburtstag hat, beträgt somit .
Bei 252 Personen beträgt die Wahrscheinlichkeit . Das heißt, die Schwelle der Anzahl von Personen, ab der die Wahrscheinlichkeit, dass mindestens eine dieser Personen an einem zufällig gewählten Tag Geburtstag hat, größer als 50 % wird, beträgt 253 Personen (siehe dazu auch Geburtstagsparadoxon).
Die direkte Berechnung der Binomialverteilung kann aufgrund der großen Fakultäten schwierig sein. Eine Näherung über die Poisson-Verteilung ist hier zulässig (). Mit dem Parameter ergeben sich folgende Werte:[13]
P253/365(k)
k
Wahrscheinlichkeit in % (gerundet)
0
050
1
034,66
2
012,01
3
002,78
4
000,48
Konfidenzintervall für eine Wahrscheinlichkeit
In einer Meinungsumfrage unter Personen geben Personen an, die Partei A zu wählen. Bestimme ein 95-%-Konfidenzintervall für den unbekannten Anteil der Wähler, die Partei A wählen, in der Gesamtwählerschaft.
Mittels folgender Formel lässt sich die Wahrscheinlichkeit dafür errechnen, dass von Personen eine Tätigkeit, die durchschnittlich Minuten pro Stunde dauert, gleichzeitig ausführen.
Zufallszahlen
Zufallszahlen zur Binomialverteilung werden üblicherweise mit Hilfe der Inversionsmethode erzeugt.
Alternativ kann man auch ausnutzen, dass die Summe von Bernoulli-verteilten Zufallsvariablen binomialverteilt ist. Dazu erzeugt man Bernoulli-verteilte Zufallszahlen und summiert sie auf; das Ergebnis ist eine binomialverteilte Zufallszahl.
Bezeichnungen
Der Aufruf der Wahrscheinlichkeitsfunktion der Binomialverteilung bei Taschenrechnern und Mathematischer Software geschieht meistens mit binom, pdfbin oder Binomialpdf (Binomial probability density function). Die kumulierte Verteilungsfunktion wird mit cdfbin oder Binomialcdf (Binomial cumulative distribution function) abgekürzt.[14]
↑Binomialverteilung. In: P. H. Müller (Hrsg.): Lexikon der Stochastik – Wahrscheinlichkeitsrechnung und mathematische Statistik. 5. Auflage. Akademie-Verlag, Berlin 1991, ISBN 978-3-05-500608-1, S.39.
↑Bigalke, Köhler: Mathematik 13.2 Grund- und Leistungskurs. Cornelsen, Berlin 2000, S. 130.
↑George Udny Yule: An Introduction to the Theory of Statistics. Griffin, London 1911, S. 287.
↑Peter Kissel: MAC08 Stochastik. Teil 2. Studiengemeinschaft Darmstadt 2014, S. 23.
↑Bigalke,/ Köhler: Mathematik 13.2 Grund- und Leistungskurs. Cornelsen, Berlin 2000, S. 144 ff.
↑P. Neumann: Über den Median der Binomial- and Poissonverteilung. In: Wissenschaftliche Zeitschrift der Technischen Universität Dresden. 19. Jahrgang, 1966, S.29–33.
↑Lord, Nick. (July 2010). Binomial averages when the mean is an integer, The Mathematical Gazette 94, 331–332.
↑ abR. Kaas, J.M. Buhrman: Mean, Median and Mode in Binomial Distributions. In: Statistica Neerlandica. 34. Jahrgang, Nr.1, 1980, S.13–18, doi:10.1111/j.1467-9574.1980.tb00681.x (englisch).
↑ abK. Hamza: The smallest uniform upper bound on the distance between the mean and the median of the binomial and Poisson distributions. In: Statistics & Probability Letters. 23. Jahrgang, 1995, S.21–25, doi:10.1016/0167-7152(94)00090-U (englisch).
↑M. Brokate, N. Henze, F. Hettlich, A. Meister, G. Schranz-Kirlinger, Th. Sonar: Grundwissen Mathematikstudium: Höhere Analysis, Numerik und Stochastik. Springer-Verlag, 2015, S. 890.
↑Im konkreten Fall muss man für die Binomialverteilung ausrechnen und für die Poisson-Verteilung . Beides ist mit dem Taschenrechner einfach. Bei einer Rechnung mit Papier und Bleistift benötigt man mit der Exponentialreihe 8 oder 9 Glieder für den Wert der Poisson-Verteilung, während man für die Binomialverteilung durch mehrfaches Quadrieren auf die 256. Potenz kommt und dann noch durch die dritte Potenz teilt.