Dienstag, 22. Januar 2008
Lesetipp: Markenwahl mit Herz und Verstand
Donnerstag, 17. Januar 2008
NSDstat-Kurs: Interpretation eines Box-Plot
Im dritten Teil des Blog-Tutorials zur Analysesoftware NSDstat Pro soll gezeigt werden, wie sich mit NSDstat ein Box-Plot erstellen lässt und wie diese besondere Form der grafischen Darstellung interpretiert werden kann. Als Beispiel wird der bereits aus den ersten beiden Teilen bekannte NSDstat Demo-Datensatz zum politischen Interesse von Schülern verwendet.
Wie am Screenshot zu erkennen ist, wurde auch hier wieder die Variable V8 selektiert, in der das politische Interesse der befragten Schüler auf einer Skala von 1 bis 4 erfasst wurde. Ein Klick auf das Grafik-Icon (das dritte Icon von oben) öffnet nun die grafische Übersicht, die in der Standardeinstellung aus einem Histogramm mit eingeblendeter Normalverteilungskurve sowie dem darunterliegenden Box-Plot besteht, der in NSDstat auch als Box-Whisker-Plot bezeichnet wird.
Um diesen Box-Plot korrekt interpretieren zu können, muss man sich den Aufbau der Grafik vor Augen führen: Die Box als zentrales Element verläuft vom oberen (75%) Quartil zum unteren (25%) Quartil, das mittlere (50%) Quartil, welches auch als Median bekannt ist, ist als Linie in der Box eingezeichnet. Der Median liegt keineswegs immer in der Mitte der Box - auch wenn es in diesem Beispiel-Fall so ist. Seine Lage hängt vielmehr von der Form der Verteilung ab, die somit ebenfalls direkt aus dem Box-Plot abgelesen werden kann (Stichwort: Links- und Rechtssteilheit bzw. Symmetrie). Da die Box zwischen dem oberen und dem unteren Quartil verläuft, entspricht ihre Länge auch genau dem Interquartilsabstand IQR, einem bekannten Streuungsmaß aus der explorativen Datenanalyse.
Außerhalb der Box wird ein Abstand von 1,5 IQR auf die obere und die untere Kante aufgetragen, so dass sich ein Feld mit einer Gesamtlänge von 4 IQR ergibt. Zwei Werte, die noch in diesem Bereich von 4 IQR liegen, bilden die Grenzpunkte für den oberen und den unteren "Zaun" des Box-Plots, die jeweils durch eine Linie mit der Box verbunden werden. Zu beachten ist, dass die Zäune nicht an der Grenze von +/- 1,5 IQR um die beiden Enden der Box liegen, sondern dort, wo sich der größte bzw. der kleinste Wert der Verteilung innerhalb dieser beiden Abstände befindet. Alle Werte die außerhalb der Zäune liegen, werden als Ausreißer gekennzeichnet, wobei angemerkt werden muss, dass keine allgemeingültige Definition dieses Begriffs existiert und die Identifikation der Ausreißer via Boxplot nur eine der möglichen Methoden darstellt.
Abschließend noch eine selbsterstellte Grafik aus dem MaFo-Wiki, in welcher der Aufbau des Box-Plot noch einmal übersichtshalber dargestellt wird:
In der nächsten Ausgabe dieses Tutorials werde ich mich der Interpretation der zweiten Grafik – des Histrogramms mit eingeblendeter Normalverteilungskurve – zuwenden und unter anderem erläutern, warum man sich diese Grafik vor der Durchführung eines Kolmogorov-Smirnov-Anpassungstests unbedingt ansehen sollte.
Dienstag, 15. Januar 2008
Inflationärer Gebrauch des Studienbegriffs
Anlass zur Kritik bietet der aktuelle "Studienkrieg" zwischen Microsoft und der Mozilla Foundation über die Sicherheit ihrer jeweiligen Browser. Da laut des ZDNet-Autors Lothar Lochmaier die Ergebnisse von "so genannter Marktforschung" häufig auf "wundersame Weise" zustandekämen, wird in seinem Artikel die geradezu inflationäre Verwendung des Begriffs "Studie" einmal kritisch betrachtet.
Dabei kommt Lochmaier zu dem Schluss, dass in zwei Arten von Marktforschern unterschieden werden muss: Nämlich in diejenigen, die eine Studie noch als "zitierfähige und abgeschlossene Untersuchung" betrachten, die "zumindest einigen wissenschaftlichen Standards genügen sollte" und diejenigen, "die den deutschen Sprachgebrauch sehr flexibel ausdehnen" und auch Untersuchungen mit geringem Umfang, deren Resultate ohnehin bereits feststehen, als "wissenschaftliche Studie" verkaufen.
Auch wenn Angriffe gegen "die Statistik" (auch das berühmte aber falsche Churchill-Zitat kommt wieder einmal im Artikel vor) immer leicht fallen und wohl das sind, was der Amerikaner als "cheap shot" bezeichnen würde, so muss man Lochmaier in diesem Falle doch zustimmen. Die geradezu inflationäre Verwendung von wissenschaftlich besetzten Begriffen wie "Studie", "Signifikanz" (hierzu gibt es eine weitere fundierte Kritik im Arbeitszimmer) oder "Repräsentativität" ist in der Tat ein Problem, da diese Ausdrücke beim Leser solcher Berichte bzw. beim Marktforschungs-Kunden inhaltliche Assoziationen auslösen, die durch die Methodik der Datenerhebung und -analyse leider viel zu oft nicht gedeckt werden.
"Statistik-Bashing" ist als moderner Sport für Journalisten sicher zu kritisieren - die ständige und missverständliche Verwendung von Begriffen aus der wissenschaftlichen Marktforschung für methodisch unsaubere Untersuchungen ist aber ebenfalls ein Problem - und zwar eins, welches zu mehr und mehr kritischen Artikeln und damit zu ständig weiter erodierendem Vertrauen in alle Ergebnisse statistischer Untersuchungen - auch der methodisch sauberen - führt.
Montag, 31. Dezember 2007
Jahresrückblick und Jahresvorschau
Nun da sich 2007 immer schneller dem Ende zuneigt wird es Zeit, das alte Jahr noch einmal Revue passieren zu lassen und sich Gedanken darüber zu machen, welche Ziele im kommenden Jahr verwirklicht werden sollen – dies ist im Geschäftsleben nicht anders als im privaten Bereich und gilt daher auch im Falle der Statistikberatung.
Mit 2007 endet das erste „volle“ Jahr der im November 2006 gegründeten Statistikberatung Reinboth und auch dieser Blog existiert nun schon ein halbes Jahr. Vieles von dem, was ich in diesem ersten Geschäftsjahr über das Business gelernt habe, findet sich in meinem Post zum einjährigen Bestehen des Consulting-Services und soll an dieser Stelle nicht noch einmal ausgebreitet werden. Ich kann aber mit Freuden feststellen, dass sich im ablaufenden Jahr sowohl eine kleine Gruppe regelmäßiger Auftraggeber für die Statistikberatung als auch eine Handvoll wiederkehrender Leser für den Statistik-Weblog gefunden hat – ein Ergebnis, das mich sowohl mit Freude als auch mit Zuversicht für das kommende Jahr erfüllt.
Besonders spannend finde ich auch die ab und an eintrudelnden Anfragen von Studentinnen und Studenten aus dem gesamten Bundesgebiet, die bei einer empirischen Untersuchung festhängen oder eine gezielte Frage zur multivariaten Datenanalyse loswerden wollen. Auch für 2008 wird weiterhin gelten: Alle Anfragen von Studierenden, die sich in unter zwei Studen abhandeln lassen, werden gerne kostenlos bearbeitet – und für aufwändigere Anfragen lassen sich immer auch Sondertarife finden.
Für das Jahr 2008 steht eine Verbreiterung meiner Servicebasis an: Ab sofort werde ich auch die saubere Codierung von Fragebögen sowie (in begrenztem Umfang) die Durchführung und Auswertung qualitativer Untersuchungen anbieten (wie beispielsweise das Laddering). Die bisherigen Angebote bleiben natürlich in vollem Umfang erhalten: Planung und Begleitung von Online- und Offline-Erhebungen, Fragebogen-Design, Repräsentativitätsdiagnostik, Kreuztabellierungen sowie die mathematisch saubere Durchführung und Interpretation multivariater Datenanalysen.
Soweit es die Web-Projekte betrifft habe ich mir vorgenommen, mein Engagement in 2008 noch zu steigern: Mit Sicherheit wird es viele weitere Beiträge auf diesem Blog geben, darunter mindestens ein Dutzend weiterer Folgen des im letzten Monat gestarteten NSDStat-Tutorials – und auch im Marktforschungs-Wiki werde ich nach längerer Zeit wieder einmal ein paar neue Items einpflegen. Darüber hinaus ist für das kommende Jahr eine umfangreiche SEO-Kampagne für die verschiedenen Statistik-Webseiten geplant – ich bin schon gespannt inwiefern es mir gelingen wird, die Wiki-Pages oder Blogbeiträge bei Suchbegriffen wie Fakorenanalyse oder Interquartilsabstand auf vordere google-Plazierungen zu bringen. Auch meine beiden Bücher zur multivariaten Datenanalyse sowie zur Online-Marktforschung will ich noch stärker vermarkten – ein drittes Buch über das ich an dieser Stelle noch nicht viel verraten kann, befindet sich übrigens bereits in Arbeit und wird mit etwas Glück vielleicht noch 2008 erscheinen.
Gelegentlich werde ich gefragt, ob ich im kommenden Jahr nicht vielleicht die freiberufliche Tätigkeit an den Nagel hängen und Vollzeit in die Marktforschung wechseln möchte. Dazu kann ich nur sagen, dass es mich zwar prinzipiell sehr reizen würde, mich voll und ganz der Statistik zu widmen, dass ich aber arge Probleme mit der teils unwissenschaftlichen Art und Weise habe, mit der in vielen Instituten und Agenturen Datenanalyse betrieben wird und die ja erst kürzlich wieder durch den hervorragenden Beitrag von Frau Jaksch kritisch beleuchtet wurde. Dazu kommt noch, dass die von mir Ende 2006 (mit-) gegründete und inzwischen zum An-Institut der HS Harz avancierte HarzOptics GmbH von Monat zu Monat mehr Aufträge zu verzeichnen hat, und ich inzwischen viel Gefallen an der für einen Analytiker zwar fachfremden aber dennoch unglaublich spannenden Welt der Photonik-Forschung gefunden habe (mehr Infos zur Arbeit bei HarzOptics gibt es übrigens in meinem Photonik-Blog).
Die freiberufliche Tätigkeit im Marktforschungs-Bereich ist zudem mit sehr vielen Abwechslungen und damit Herausforderungen verbunden, da sich die Aufträge teils stark voneinander unterscheiden und jede Aufgabe mich zwingt, mit anderen Methoden an die Daten heranzugehen – dies hält mich methodisch fit und sorgt dafür, dass ich – wenn ich doch einmal den Sprung in eines der Institute antreten sollte – einem potenziellen Arbeitgeber auch viel zu bieten habe. Als letzter wichtiger Grund kommt für mich dazu, dass ich nun schon das fünfte Semester in Folge diverse Kurse (mit und ohne Bezug zur Statistik) an der HS Harz unterrichte und inzwischen an der Vermittlung von Wissen an aufgeweckte junge Menschen so viel Freude gefunden habe, dass es mir sicher schwer fallen würde, diese Tätigkeit ganz einzustellen.
Meine geschäftliche Prognose für 2008 lautet daher, dass die Türen der Statistikberatung Reinboth auch noch ein weiteres Jahr allen interessierten Kunden offen stehen werden. Ich für meinen Teil freue mich in jedem Fall auf die kommenden Herausforderungen und hoffe auch im neuen Jahr wieder auf viele interessante und abwechslungsreiche Aufträge aus allen Teilbereichen der Marktforschung.





