Statistik-Zwischenruf: Twitter sagt nicht das Wahlergebnis vorher

AP/dpaDie Nennung bestimmter Hashtags auf Twitter lässt sich prima auszählen und in schönen Grafiken verarbeiten. Doch über Wahlergebnisse sagt das Tweet-Auszählen wenig aus, warnt der Politologe Andreas Jungherr.

http://www.spiegel.de/netzwelt/netzp...-a-919915.html
  1. #1

    Twitter kann man nicht so analysieren!

    Es geht nicht darum, bestimmte, selbterwählte Tags aufzuzählen. Die Russen haben eine seriöse Arbeit zu Twitter und Politik gemacht und sie konnten sehr gut nicht nur die vorigen französischen Wahlen, sondern auch die venezolanischen vorhersagen.
    Hier habe ich (ein Venezolaner) darüber geschrieben:
    http://venezuela-europa.blogspot.be/2013/04/polls-russians-were-right.html
    Selbst ich war erstaunt. Anscheinend haben sie viele Parameter berücksichtigt, die andere nicht berücksichtigt hatten, wie die Tatsache, dass Menschen auf dem Land in Venezuela oder Frankreich (minder so in diesem zweiten Land) weniger tweeten können. Sie haben viele Korelationen studiert

    Also, sehr geehrter Politologe: Wahrscheinlichkeitsmodelle sind viel viel mehr als blanke Häufigkeitszählungen.
    Wie viele Followers haben die Benutzer, die ständig die und die Wörter benutzen? Wie viele von ihnen sind wirklich Personen und nicht Roboter? All dies und viel mehr muss berücksichtigt werden.
  2. #2

    Bitte mehr wissenschaftliche Präzision

    Sehr geehrter Herr Jungherr, als wissenschaftlicher Mitarbeiter hätte ich von Ihnen in Ihrer Analyse deutlich mehr Präzision erwartet. Ihre Schlussfolgerung lässt sich mit Ihren Argumenten nämlich nicht beweisen!

    Sie haben nicht gezeigt, dass man aus Twitterdaten den Wahlausgang nicht prognostizieren kann. Was Sie gezeigt haben ist, dass die reine Häufigkeit von bestimmten Hashtags nichts über den Wahlausgang verrät. Es gibt zahlreiche Arbeiten die aus Twitterdaten präzisiere Prognosen, als es Forschungsinstitute je könnten berechnet haben. Diese sind natürlich weitaus ausgeklügelter als die nebeneinanderstellung von zwei arbiträren Diagrammen. Vielleicht hätten Sie vor dem Verfassen des Artikels sich mit dieser Technologie einmal etwas besser auseinandersetzen müssen, bevor sie die Möglichkeiten diskreditieren.
  3. #3

    Tja, Herr Jungherr...

    ...leider ist Ihr Artikel überhaupt nicht statistisch unterlegt. Natürlich reicht es nicht die Rohdaten zu analysieren. Sie müssen, um ein halbwegs brauchbares und aussagekräftiges Ergebnis zu erzielen, entsprechend bereinigt werden. Ganz einfach, weil bestimmte Parteisympathisanten bei Twitter deutlich aktiver sind als andere. Wenn man die Daten durch einen halbwegs sinnvollen und causal begründeten Filter jagt, dann sieht das Ergebnis schon wesentlich glaubwürdiger aus. Und zwar egal, ob die Twitter-Meldung nun positiv oder negativ zur jeweiligen Partei war. Wer sich den Wahlometer hernimmt, der erkennt, dass Twitter sehr wohl eine realistische Aussagekraft hat, die auch durch die Forschung bestätigt wurde. Nur so einfach mit ein paar hübschen Balkendiagrammen ist das halt dann auch nicht. Also bitte nochmal: zuerst das Modell, dann die Auswertung. Haben Sie das nicht gelernt?
  4. #4

    Captain Obvious

    Manchmal muss das Offensichtliche nochmal genannt werden - in diesem Fall aber eher nicht.
  5. #5

    Fehlinterpretiert oder absichtlich verschwiegen

    sind hier doch v. a. zwei Sachverhalte. Das gemessene Medium "Twitter" besitzt doch eine eindeutige Affinität zu der Klientel mit den höchsten Werten in der Untersuchung, den Piraten und ihren Anhängern. Es ist so, als ob sie in der CDU fragen würden, wer denn der bessere Kanzlerkandidat wäre. Insofern ist gerade das Ergebnis für die Piraten nicht repräsentativ. Das vorausgesetzt und beachtet kommt man nicht umhin, sich über die sehr guten - freilich über die Daumen gepeilten - Werte der Gewichtung zu wundern. Ohne die Piraten spiegelt die Grafik nämlich sehr wohl die Verhältnisse der Stimmenanteile wieder. Das kann jeder bestätigen, der schon mal die Stimmenverteilung einer demoskopischen Erhebung gesehen hat. Hier gilt es natürlich nur noch hinzu zu fügen, dass eine Auswertung von Hashtags auch gar nicht dafür gemacht oder gedacht ist, eine wissenschaftliche Erhebung zu begründen. Und damit ist alles ins rechte Licht gerückt und gesagt.
  6. #6

    Darum soll man Laien nie an ein Statistikprogramm lassen

    Diese Art von Analyse würde noch nicht einmal als Projektarbeit an einem Gymnasium mit mindestens "befriedigend" bewertet. Einfach Tags zu zählen ist ein dermaßen naiver Ansatz, dass sich einem die Fußnägel hochbiegen.

    Zur Analyse von Twitterdaten gibt es mittlerweile hunderte von seriösen wissenschaftlichen Publikationen, die der Autor offensichtlich nie gesehen hat (sie enthalten allerdings häufig Mathematik, das schreckt Politologen natürlich ab).

    Ohne kontextabhängige Analysemethoden wie "Sentiment Analysis" darf man ein solches Projekt einfach nicht angehen. Dass ein Uni-Mitarbeiter solchen Stuss in einem auflagenstarken Medium ungeprüft publizieren kann, lässt mein Ansehen der "Social Sciences" erneut ganz, ganz tief in den Keller sinken.
  7. #7

    niemals...

    Die twitter-follower sind eine viel zu kleine Gruppe mit viel zu speziellen Ansichten, als daß das irgendwie relevant für ein gesamtdeutsches Wahlergebnis wäre. Mindestens 50% (wenn nicht mehr) unserer wahlberechtigten Mitbürger wissen gar nicht, was twitter ist. Überhaupt wird twitter völlig überschätzt (vllt weil es das Spielzeug der Jounalisten ist).
  8. #8

    Vor was will uns der Artikel warnen ?

    Hier warnt also ein "Wissenschaftler" vor der Anwendung von Twitter-Analysen zu Wahlprognosen. Aber der Artikel benennt gar keine solche Twitter-Wahlprognose. Um welche Twitter-Wahlprognose geht es denn, die wir nicht ernst nehmen sollen ?
  9. #9

    Das Netz schlägt links

    Das Netz schlägt eh sehr links. Hier mal wie die Interaktion auf Facebookbeiträge der Parteien des letzten Monats. Auffällig wie stark gerade die linke ist: http://www.sapplause.com/show.html#!q=cGFnZT03ODUwMjI5NTQxNCxTUEQsRkRQLEI5M ERpZUdydWVuZW4sbGlua3NwYXJ0ZWkmY291bnRyaWVzPVRPUDQ 1Jm5hbWVzPUNEVSxTUEQsRkRQLEI5MERpZUdydWVuZW4sbGlua 3NwYXJ0ZWkmc3RhcnQ9MDMtMDgtMjAxMyZlbmQ9MDItMDktMjA xMyZtZXRob2Q9YXBwbGF1c2U=