SPIEGEL ONLINESind die Panini-Aufkleber zur EM 2012 wirklich gleichverteilt? Oder tauchen einzelne Sticker seltener auf, wie mancher Sammler argwöhnt? Die Umfrage unter den Lesern von SPIEGEL ONLINE zeigt, dass es durchaus größere Schwankungen gibt. Das muss aber nicht an Panini liegen.
http://www.spiegel.de/wissenschaft/m...836973,00.html
... wäre diese Stichprobe allemal: Wenn ich bei Panini etwas zu sagen hätte, würde ich für die Deutsche Mannschaft wohl genau so eine Verteilung vorschlagen: Den allseits beliebten Kapitän häufiger eintüten, um dem Käufer schnelle Erfolgserlebnisse zu bescheren: "Wow, erst drei Tüten gekauft und schon Philipp Lahm ergattert!" - Und einen anderen Schlüsselspieler mit kleinerer Fangemeinde deutlich seltener auftauchen lassen: Denn wer will schon eine Sammlung, bei der die Nummer Eins fehlt?
Der Chi-Quadrat Test ergibt zunächst:"Der Chi-Quadrat-Test der Panini-Sammelbilder hat ein klares Ergebnis: Mit einer Wahrscheinlichkeit von 99 Prozent bestätigen die Zahlen, dass die Sticker gleich verteilt sind."
Dann kommt die Manipulation und der Test ergibt:"Die derart manipulierte Statistik passt dann schon deutlich besser zur Gleichverteilung: Die um 40 Prozent Schwankung korrigierten Daten liefern beim Chi-Quadrat-Test ein positives Ergebnis. Mit einer Wahrscheinlichkeit von 99 Prozent lassen sich die Zahlen durch eine Gleichverteilung erklären."
Versteh ich nicht. Ist das ein Schreibfehler oder ergibt der Test beides Mal dasselbe Ergebnis?
ein Buch zu verkaufen. Und nicht irgendetwas über Panini Bilder Häufigkeiten herrauszufinden.... Ansonsten hätte der Autor bestimmt die Leserantworten auf seinen ersten Artikel gelesen und berücksichtigt. Hat er aber nicht.
Der Artikel rührt im Nirvana anstatt, wie vorgeschlagen andere Quellen für die Häfigkeit mit zu Rate zu ziehen.
Diese Tabelle ist anhand der eingabe von über 6000 Sammlern rstellt worden:
http://www.stickermanager.com/euro12de-de-r_all/euro12de.htm
Und nicht von nur ca. 200...
Immerhin ergeben beide "Umfragen", daß Phillip Lahm am häfigsten vorkommt. Was ergo tatsächlich auf eine ungleiche Verteilung der Bilchen schließen läßt.
Und zwar geht es um die ungleiche Verteilung der Sticker und nicht um die ungleiche Produktion. Wie unwirtschaftlich wäre es, nicht auch wirklich jeses Bild der Druckplatte mit den 540 Bildern zu nutzen? Aber wie wirtschaftlich wäre es, im Versand die Bilder ungleich in die Regionen zu verteilen. Zum Beispiel habe ich mir in Polen eine ganze Menge Sticker geholt: Und siehe da! Die Doppelten reduzierten sich um Dreifache. Das heißt im Klartext: Spiegels Umfrage in allen Ehren, aber die Ungleichverteilung sieht im Raum Hamburg ganz anders aus. Zieht man alle Regionen wieder zusammen, gleicht sich das dann wieder aus ...
"Der Chi-Quadrat-Test der Panini-Sammelbilder hat ein klares Ergebnis: Mit einer Wahrscheinlichkeit von 99 Prozent bestätigen die Zahlen, dass die Sticker gleich verteilt sind. [...]
Die um 40 Prozent Schwankung korrigierten Daten liefern beim Chi-Quadrat-Test ein positives Ergebnis. Mit einer Wahrscheinlichkeit von 99 Prozent lassen sich die Zahlen durch eine Gleichverteilung erklären."
Das ist schon peinlich, wenn hier die Aussage des ganzen Artikels den Bach runter geht. Waren es nun vielleicht 9.9% ohne Glättung? Ich hoffe man wird den Artikel bald korrigieren, da das Lesen sonst wirklich Zeitverschwendung war.
Leider habe ich noch weitere Zeichen unsauberer Arbei gefunden:
1. Im Text: "Das Ganze war also eine kleine Stichprobe der insgesamt 54 Sticker. " Nein, es sind insgesamt 540.
2. Bild 11: "dann in Rot die 63 dreifachen". Nein, es sind bloß 36.
Es ist wirklich schade, dass hier nicht mit mehr Sorgfalt gearbeitet wird. So ein Text verlangt an sich schon ein großes Maß an Konzentration. Solche Fehler brachten mich dann noch zusätzlich ins Stocken.
Schade auch, dass die eigentliche Analysemethode nur sehr schwach erklärt wurde:
"Es gibt eine statistische Methode, um zu prüfen, wie gut die Stückzahlen aus der SPIEGEL-ONLINE-Umfrage zu einer Gleichverteilung passen. Sie heißt Chi-Quadrat-Anpassungstest. Dabei schaut man, vereinfacht gesagt, wie stark die Einzelwerte vom Mittelwert abweichen. Diese Abweichungen werden dann addiert und mit Werten aus einer Tabelle verglichen."
Das ist weder richtig noch bekommt der interessierte Leser eine Chance zu verstehen, wie schlussendlichen die 99% berechnet werden.
Wenn ich mich nicht ganz täusche, kommt als Ergebnis eines solchen Tests (ich nehme an, dass hier ein Null-Hypothesen-Test durchgeführt wurde) auch nicht die Wahrscheinlichkeit heraus mit der die Stichprobe aus einer bestimmten Verteilung stammt, sondern die Wahrscheinlichkeit mit der sie NICHT aus der unterstellten Verteilung folgt. Beide Fälle sind nicht komplementät. Vielleicht kann mich hierzu noch jemand bestätigen oder widerlegen.