tag:blogger.com,1999:blog-13993459679868198322024-02-07T14:19:15.600-08:00Weblog der Statistikberatung ReinbothFundstücke aus der Markt- und Meinungsforschung sowie der statistischen MethodenlehreChristian Reinbothhttp://www.blogger.com/profile/06772443468928704979noreply@blogger.comBlogger53125tag:blogger.com,1999:blog-1399345967986819832.post-68150592303294091322010-09-08T06:24:00.000-07:002010-09-08T06:28:03.503-07:00Die Leading Question des Monats......stammt diesmal ganz eindeutig <a href="http://www.fdp-fraktion-nds.de/de/44871-Umfrage">von der FDP</a>:<br /><br /><a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjL7UnJDNkPLhLFWWhuR0FPZ2R2Fm7dG22g4EVl8CNTzbVInLW-K7LTQnhWOJfaBqgnreWZRc_iOjioXoNQyis_dU69Fupo2iBM7qJpqoTgdVzQMONNuwQ5eSGlgzHGRzFpY-EMacrpS9E/s1600/fdp-umfrage.jpg"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer; width: 400px; height: 169px;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjL7UnJDNkPLhLFWWhuR0FPZ2R2Fm7dG22g4EVl8CNTzbVInLW-K7LTQnhWOJfaBqgnreWZRc_iOjioXoNQyis_dU69Fupo2iBM7qJpqoTgdVzQMONNuwQ5eSGlgzHGRzFpY-EMacrpS9E/s400/fdp-umfrage.jpg" alt="" id="BLOGGER_PHOTO_ID_5514533312562444818" border="0" /></a><br />Übrigens ein interessantes Thema, zu dem ich neulich erst etwas auf den ScienceBlogs gepostet hatte: <a href="http://www.scienceblogs.de/frischer-wind/2010/08/wie-man-passende-befragungsergebnisse-erhalt.php">Wie sichert man sich die passenden Befragungsergebnisse?</a>Christian Reinbothhttp://www.blogger.com/profile/06772443468928704979noreply@blogger.com0tag:blogger.com,1999:blog-1399345967986819832.post-37188535986576176132010-07-14T04:12:00.000-07:002010-07-14T04:35:50.052-07:00Paul die Orakelkrake - mathematisch betrachtet<div style="text-align: justify;"><span style="font-size:100%;"><span style="font-family:georgia;">Ganz Deutschland interessiert sich für ein Zufallsexperiment...</span><br /><br /><span style="font-family:georgia;">Mit der korrekten Vorhersage des Ergebnisses des siebten und letzten WM-Spiels der deutschen National-Elf hat sich Oktopus </span><a style="font-family: georgia;" href="http://www.suedkurier.de/news/panorama/panorama/art410967,4355244">Paul</a><span style="font-family:georgia;"> am Wochenende selbst übertroffen. Bereits die Wahrscheinlichkeit für eine korrekte Vorhersage der ersten sechs Spielergebnisse war – wenn man denn von einem Zufallsexperiment mit einer Eintrittswahrscheinlichkeit der Elementarereignisse von 50% ausgehen kann – mit knapp 1,6% eher gering. Nach dem Sieg im „kleinen Finale“ und dem Sieg der spanischen Mannschaft im Finalspiel am Sonntag hat sich Pauls Trefferquote nun offenbar auf acht von acht Spielen erhöht – und das mit einer Wahrscheinlichkeit von nun nur noch etwa 0,4%.</span><br /><br /><span style="font-family:georgia;">Das sind zwar noch lange nicht genügend Vorhersagen, um auch eine Signifikanz berechnen zu können, trotzdem bewegt Paul die Gemüter. Grund genug für mich, das Thema im "Frischen Wind" einmal aus Sicht des Statistikers aufzugreifen, weshalb ich an dieser Stelle ausnahmsweise mal wieder auf meinen "Primärblog" verweise: </span><a style="font-family: georgia;" href="http://www.scienceblogs.de/frischer-wind/2010/07/paul-die-orakelkrake-mathematisch-betrachtet.php">Paul die Orakelkrake - mathematisch betrachtet</a><span style="font-family:georgia;">.</span><br /><br /><span style="font-family:georgia;">Ein schönes Lob für den Artikel gab es übrigens via Twitter: </span><a style="font-family: georgia;" href="http://twitter.com/hamburgschanze/status/18497267821">"So macht Statistik Spaß"</a><span style="font-family:georgia;">. Da fühle ich mich ja direkt an meine Hochzeiten </span><a style="font-family: georgia;" href="http://statistikberatung.blogspot.com/2010/02/statistik-foliensatze-auf-slidesharenet.html">in der Lehre</a><span style="font-family:georgia;"> erinnert...</span></span><br /></div>Christian Reinbothhttp://www.blogger.com/profile/06772443468928704979noreply@blogger.com0tag:blogger.com,1999:blog-1399345967986819832.post-4541944074160642632010-06-23T06:28:00.000-07:002010-06-23T06:31:08.198-07:00Wie manipuliert man eine Befragung?Aus dem herrlichen TV-Klassiker <a href="http://www.imdb.com/title/tt0086831/">"Yes, Prime Minister"</a>:<br /><br /><object width="420" height="385"><param name="movie" value="http://www.youtube.com/v/2yhN1IDLQjo&hl=en_US&fs=1&"><param name="allowFullScreen" value="true"><param name="allowscriptaccess" value="always"><embed src="http://www.youtube.com/v/2yhN1IDLQjo&hl=en_US&fs=1&" type="application/x-shockwave-flash" allowscriptaccess="always" allowfullscreen="true" width="420" height="385"></embed></object>Christian Reinbothhttp://www.blogger.com/profile/06772443468928704979noreply@blogger.com0tag:blogger.com,1999:blog-1399345967986819832.post-32051503314170744952010-03-15T04:00:00.000-07:002010-03-15T04:19:39.345-07:00Wie funktioniert eigentlich Laddering?<div style="text-align: justify;"><span style="font-size:100%;"><span style="font-family:georgia;">Oder vielmehr: Was ist überhaupt Laddering?</span></span><br /><br /><span style="font-size:100%;"><span style="font-family:georgia;">Unter "Laddering" verstehen Marktforscher ein qualitatives Verfahren zur Aufdeckung und Analyse der gedanklichen Strukturen potenzieller Kunden durch eine spezielle Form des Tiefeninterviews. Laddering ist darüber hinaus das Thema des ersten <a href="http://marktforschung.wikia.com/wiki/Laddering">neuen Eintrags</a> im <a href="http://marktforschung.wikia.com/">MaFo-Wiki</a> nach mehr als einem Jahr der Schreibpause (dass ich das Wiki dieses Jahr wieder aktiv weiterführen will, hatte ich ja schon vor einigen Wochen <a href="http://statistikberatung.blogspot.com/2010/01/gute-vorsatze-fur-2010.html">angekündigt</a>). Gut – ein wenig ausbaufähig ist der Eintrag auf jeden Fall noch, aber immerhin ist es schon mal mehr als ein Stub...</span></span><br /><br /><span style="font-size:100%;"><span style="font-family:georgia;">Ich hatte übrigens im Rahmen meiner Beratertätigkeit bislang nur einmal die Chance, an einem Laddering mitzuarbeiten – aber ich befasse mich ja ohnehin häufiger (und auch lieber) mit quantitativen als mit qualitativen Verfahren. Die Kunst bei den Tiefeninterviews besteht darin, den Probanden im Prinzip immer wieder das Gleiche zu fragen, ohne ihn auf die Palme zu bringen. Man kann sich das etwa so vorstellen:</span></span><br /><br /><span style="font-style: italic;font-size:100%;" ><span style="font-family:georgia;">"Trinken Sie lieber Kaffee oder Tee?"</span></span><br /><span style="font-style: italic;font-size:100%;" ><span style="font-family:georgia;">"Kaffee"</span></span><br /><span style="font-style: italic;font-size:100%;" ><span style="font-family:georgia;">"Warum trinken Sie lieber Kaffee?"</span></span><br /><span style="font-style: italic;font-size:100%;" ><span style="font-family:georgia;">"Der schmeckt mir irgendwie besser"</span></span><br /><span style="font-style: italic;font-size:100%;" ><span style="font-family:georgia;">"Warum schmeckt Kaffee Ihnen besser?"</span></span><br /><span style="font-style: italic;font-size:100%;" ><span style="font-family:georgia;">"Ich weiß nicht. Der Geschmack ist irgendwie stärker"</span></span><br /><span style="font-style: italic;font-size:100%;" ><span style="font-family:georgia;">"Warum empfinden Sie den Geschmack als stärker?"</span></span><br /><br /><span style="font-size:100%;"><span style="font-family:georgia;">Und so weiter und so fort – solange bis dem Probanden der Geduldsfaden reißt oder aber – und das ist natürlich das eigentliche Ziel – bis man zu den eigentlichen Wertvorstellungen vordringt, die hinter dem Kaffeegenuss stecken. Also beispielsweise: "Ich habe das Gefühl, dass ich nur durch Leistung Anerkennung erhalte, deshalb konsumiere ich Kaffee um wacher und besser bei der Sache zu sein als meine Kollegen". Voila – ein sogenannter terminaler Wert – der Wunsch nach Erfolg – ist aufgedeckt. Wie man sich vermutlich vorstellen kann, ist das Prozedere bisweilen ein wenig entnervierend, die Eindrücke, die man durch die Aggregation der Ergebnisse vieler Probanden gewinnt (die sogenannten Hierarchical Value Maps) sind dafür aber auch viel wert, wenn es um segmentspezifisches Marketing geht.</span></span><br /><br /><span style="font-size:100%;"><span style="font-family:georgia;">Alles in allem ein spannendes, aber auch sehr teures Verfahren, da viele Einzelinterviews mit der entsprechenden Professionalität durchgeführt werden müssen. Mehr zum Laddering lässt sich im <a href="http://marktforschung.wikia.com/wiki/Laddering">Artikel</a> im MaFo-Wiki nachlesen, den ich (hoffentlich) bald noch ausbauen kann. Wer das Verfahren kennt oder bereits damit gearbeitet hat, kann sich natürlich auch gerne am Ausbau beteiligen...</span></span><br /></div>Christian Reinbothhttp://www.blogger.com/profile/06772443468928704979noreply@blogger.com0tag:blogger.com,1999:blog-1399345967986819832.post-86543128761994165832010-02-15T05:11:00.000-08:002010-07-02T07:09:52.511-07:00TNS Infratest sucht PraktikantenFür Studenten sicher ein schöner Einstieg in die Marktforschung...<br /><br /><div style="text-align: justify;"></div><blockquote><div style="text-align: justify;">Sie haben die Möglichkeit, den gesamten Prozess quantitativer Marktforschung kennen zu lernen. Sie unterstützen die Projektleiter der verschiedenen Forschungsbereiche bei der Durchführung und Auswertung von Marktforschungsprojekten, zum Beispiel bei der Angebotserstellung, Fragebogenentwicklung, Erfassung und Analyse von Marktforschungsdaten, der Erstellung von Ergebnisberichten bis hin zur Vorbereitung der Ergebnispräsentation beim Kunden.<br /></div></blockquote><br /><a href="http://www.tns-infratest.com/">TNS Infratest</a><br />Landsberger Str. 338<br />80687 München<br /><br />Ansprechpartner: Frau Bettina Dichtl<br />Telefon: 0521 / 9257-237<br />E-Mail: <a href="mailto:jobs@tns-infratest.com">jobs@tns-infratest.com </a><br /><br />Vollständiges Stellenangebot <a href="http://www.unicum.de/karrierezentrum/index.php?boerse=praktikum&detail=265914">hier</a>.Christian Reinbothhttp://www.blogger.com/profile/06772443468928704979noreply@blogger.com0tag:blogger.com,1999:blog-1399345967986819832.post-2808720335318602312010-02-08T03:04:00.000-08:002010-02-08T03:32:58.017-08:00Warum 10% kein stabiler Rücklauf sind<span style="font-weight: bold;">"58% aller Bundestagsabgeordneten haben positive Homöopathie-Erfahrungen"</span><br /><br /><div style="text-align: justify;">Das liest sich als Überschrift erst mal beeindruckend - bis man dann hinter die Kulissen blickt und feststellt, dass sich gerade mal 61 von 622 Abgeordneten an der Befragung beteiligt haben. Ein mehr als offensichtlicher Mangel, den der Deutsche Zentralverein homöopathischer Ärzte (DZVhÄ) in seiner Pressemitteilung leider unterschlägt. Einen schönen <a href="http://www.scienceblogs.de/plazeboalarm/2010/02/58-der-abgeordneten-des-deutschen-bundestags-haben-positive-erfahrungen-mit-einer-homoopathischen-behandlung.php">Kommentar</a> zu den Zahlenspielchen gibt es bei meinem ScienceBlogs-Kollegen <a href="http://www.scienceblogs.de/plazeboalarm/">Marcus Anhäuser</a>.<br /><br />Das treffende Fazit:<br /><br /><blockquote style="font-style: italic;">Die ganze Meldung ist eine Luftnummer.</blockquote><br />Ein leider mehr als alltägliches Beispiel dafür, wie mit Prozentwerten (oder dem Verwischen des Repräsentativbegriffs, der inflationären Verwendung des Signifikanzbegriffs etc. pp.) unsaubere Statistiken generiert werden. In der Praxis begegne ich solchem Tricksereien inzwischen immer häufiger und ärgere mich darüber, wie überaus sorglos hier mit dem Klischee des "zahlenverdrehenden Statisikers" gespielt und dabei die saubere Arbeit vieler Kollegen untergraben wird.<br /><br />So gesehen kann man auf solchen Unfug gar nicht oft genug hinweisen.<br /><span style="font-style: italic;"></span><em></em></div>Christian Reinbothhttp://www.blogger.com/profile/06772443468928704979noreply@blogger.com1tag:blogger.com,1999:blog-1399345967986819832.post-64908318792703786922010-02-03T21:59:00.001-08:002010-02-03T22:17:00.073-08:00Statistik-Foliensätze auf slideshare.netDie Zugriffszahlen von <a href="http://www.slideshare.net/">slideshare</a> erstaunen mich immer wieder...<br /><br /><div style="text-align: justify;">Insbesondere die Foliensätze zu meinen <a href="http://creinboth.hs-harz.de/vorlesungen.html">Statistik-Vorlesungen</a>, die ich vor knapp zwei Jahren auf dem Präsentations-Portal eingestellt habe, erfreuen sich offenbar reger Beliebtheit. So wurde z.B. mein <a href="http://www.slideshare.net/christian.reinboth/spsskurs-presentation">SPSS-Foliensatz</a> bislang fast 5.000 mal angeklickt - und allein im letzten Jahr erhielt ich ganze sieben E-Mails mit SPSS-Fragen, die sich explizit auf slideshare bezogen.<br /><br /><div style="width: 425px; text-align: left;" id="__ss_957171"><a style="margin: 12px 0pt 3px; font-family: Helvetica,Arial,Sans-serif; font-style: normal; font-variant: normal; font-weight: normal; font-size: 14px; line-height: normal; font-size-adjust: none; font-stretch: normal; display: block; text-decoration: underline;" href="http://www.slideshare.net/christian.reinboth/spsskurs-presentation" title="SPSS-Kurs">SPSS-Kurs</a><object style="margin: 0px;" width="425" height="355"><param name="movie" value="http://static.slidesharecdn.com/swf/ssplayer2.swf?doc=spsskurs-1233061399380763-2&stripped_title=spsskurs-presentation"><param name="allowFullScreen" value="true"><param name="allowScriptAccess" value="always"><embed src="http://static.slidesharecdn.com/swf/ssplayer2.swf?doc=spsskurs-1233061399380763-2&stripped_title=spsskurs-presentation" type="application/x-shockwave-flash" allowscriptaccess="always" allowfullscreen="true" width="425" height="355"></embed></object><div style="font-size: 11px; font-family: tahoma,arial; height: 26px; padding-top: 2px;">View more <a style="text-decoration: underline;" href="http://www.slideshare.net/">presentations</a> from <a style="text-decoration: underline;" href="http://www.slideshare.net/christian.reinboth">Christian Reinboth</a>.</div></div><br /><br />Auf den <a href="http://www.slideshare.net/christian.reinboth/multiple-regression">Foliensatz</a> zur <a href="http://marktforschung.wikia.com/wiki/Multiple_Regressionsanalyse">Regression</a> entfielen etwa 3.000 Klicks:<br /><br /><div style="width: 425px; text-align: left;" id="__ss_985178"><a style="margin: 12px 0pt 3px; font-family: Helvetica,Arial,Sans-serif; font-style: normal; font-variant: normal; font-weight: normal; font-size: 14px; line-height: normal; font-size-adjust: none; font-stretch: normal; display: block; text-decoration: underline;" href="http://www.slideshare.net/christian.reinboth/multiple-regression" title="Multiple Regression">Multiple Regression</a><object style="margin: 0px;" width="425" height="355"><param name="movie" value="http://static.slidesharecdn.com/swf/ssplayer2.swf?doc=multiple-regression-1233688391310733-1&stripped_title=multiple-regression"><param name="allowFullScreen" value="true"><param name="allowScriptAccess" value="always"><embed src="http://static.slidesharecdn.com/swf/ssplayer2.swf?doc=multiple-regression-1233688391310733-1&stripped_title=multiple-regression" type="application/x-shockwave-flash" allowscriptaccess="always" allowfullscreen="true" width="425" height="355"></embed></object><div style="font-size: 11px; font-family: tahoma,arial; height: 26px; padding-top: 2px;">View more <a style="text-decoration: underline;" href="http://www.slideshare.net/">presentations</a> from <a style="text-decoration: underline;" href="http://www.slideshare.net/christian.reinboth">Christian Reinboth</a>.</div></div><br /><br />2.000 mal wurden die <a href="http://www.slideshare.net/christian.reinboth/faktorenanalyse">Folien</a> zur <a href="http://marktforschung.wikia.com/wiki/Faktorenanalyse">Faktorenanalyse</a> aufgerufen:<br /><br /><div style="width: 425px; text-align: left;" id="__ss_985174"><a style="margin: 12px 0pt 3px; font-family: Helvetica,Arial,Sans-serif; font-style: normal; font-variant: normal; font-weight: normal; font-size: 14px; line-height: normal; font-size-adjust: none; font-stretch: normal; display: block; text-decoration: underline;" href="http://www.slideshare.net/christian.reinboth/faktorenanalyse" title="Faktorenanalyse">Faktorenanalyse</a><object style="margin: 0px;" width="425" height="355"><param name="movie" value="http://static.slidesharecdn.com/swf/ssplayer2.swf?doc=faktorenanalyse-1233688303697790-1&stripped_title=faktorenanalyse"><param name="allowFullScreen" value="true"><param name="allowScriptAccess" value="always"><embed src="http://static.slidesharecdn.com/swf/ssplayer2.swf?doc=faktorenanalyse-1233688303697790-1&stripped_title=faktorenanalyse" type="application/x-shockwave-flash" allowscriptaccess="always" allowfullscreen="true" width="425" height="355"></embed></object><div style="font-size: 11px; font-family: tahoma,arial; height: 26px; padding-top: 2px;">View more <a style="text-decoration: underline;" href="http://www.slideshare.net/">presentations</a> from <a style="text-decoration: underline;" href="http://www.slideshare.net/christian.reinboth">Christian Reinboth</a>.</div></div><br /><br />Weitere Statistik-Foliensätze finden sich <a href="http://www.slideshare.net/christian.reinboth/presentations">hier</a>.<br />Fagen und Kommentare sind stets Willkommen.<br /></div>Christian Reinbothhttp://www.blogger.com/profile/06772443468928704979noreply@blogger.com0tag:blogger.com,1999:blog-1399345967986819832.post-40028094035959283262010-01-08T06:30:00.000-08:002010-01-08T06:32:20.779-08:00Statistik-Fragen aller Art......beantworte ich ab sofort gerne auch auf <a href="http://www.formspring.me/creinboth">formspring.me</a>:<br /><br /><iframe src="http://www.formspring.me/widget/view/creinboth?&size=large&bgcolor=%23FFFFFF&fgcolor=%23333333" style="border: medium none ;" scrolling="no" width="400" frameborder="0" height="275">&amp;amp;amp;lt;a&amp;amp;amp;gt;http://www.formspring.me/creinboth&amp;amp;amp;lt;/a&amp;amp;amp;gt;</iframe>Christian Reinbothhttp://www.blogger.com/profile/06772443468928704979noreply@blogger.com0tag:blogger.com,1999:blog-1399345967986819832.post-66288740485804474912010-01-07T00:51:00.000-08:002010-01-07T01:31:38.791-08:00Gute Vorsätze für 2010<div style="text-align: justify;"><span style="font-size:100%;"><span style="font-family:georgia;">Das vierte Geschäftsjahr der <a href="http://www.statistikberatung.eu/">Statistikberatung</a> bricht an...</span></span><br /><br /><span style="font-size:100%;"><span style="font-family:georgia;">...der optimale Zeitpunkt, um einige gute Vorsätze für 2010 zu fassen. Nachdem das Jahr der Krise leider nicht ganz ohne Spuren an meinen Auftragszahlen vorbeigegangen ist (auch wenn es mich nicht so hart getroffen hat, wie ich zwischenzeitlich befürchtet hatte), will ich im neuen Jahr einiges mehr für die Akquise tun. Unter anderem möchte ich dieses lange vernachlässigte Blog endlich reaktivieren und mindestens jede zweite Woche einen neuen Artikel posten - unter anderem soll es wieder neue "Kapitel" zu meinem kleinen <a href="http://statistikberatung.blogspot.com/search/label/NSDstat">NSDstat-Kurs</a> geben.<br /><br />Auch zahlreiche neue Einträge für das <a href="http://marktforschung.wikia.com/wiki/Marktforschungs-Wiki">Marktforschungs-Wiki</a> (das zwischenzeitlich aufgrund meiner Inaktivität schon kurzzeitig von Wikia als „verwaist“ eingestuft und zur „Adoption“ freigegeben wurde) sind in Planung, wobei ich ja immer noch darauf hoffe, dass sich weitere Co-Autoren finden, die Lust dazu haben, das Wiki zu einer brauchbaren Anlaufstelle für alle MaFo-Informationssuchenden zu machen.</span></span><br /><br /><span style="font-size:100%;"><span style="font-family:georgia;">Sollte es irgendwelche Wünsche oder Anregungen (zum Beispiel hinsichtlich Blog oder Wiki) fürs neue Jahr geben, freue ich mich über eine E-Mail an <a href="mailto:christian@statistikberatung.eu">christian@statistikberatung.eu</a>.</span></span></div>Christian Reinbothhttp://www.blogger.com/profile/06772443468928704979noreply@blogger.com0tag:blogger.com,1999:blog-1399345967986819832.post-17463116166437351532009-05-25T09:13:00.001-07:002009-05-25T09:21:57.542-07:00Die Bundesagentur für Arbeit fälscht Statistiken - im Krimi<div style="text-align: justify;">Einen echten Statistik-Krimi liefert uns <a href="http://www.veit-bronnenmeyer.de/">Veit Bronnenmeyer</a>:<br /><blockquote><br />Ein Toter liegt auf der Stadtgrenzen zwischen Nürnberg und Fürth. Der Streit um die polizeiliche Zuständigkeit stellt anfangs beinahe die Ermittlungen in den Schafften, doch bald wird klar: der Fall ist brisant! Das Opfer ist eine Geschäftsfrau aus der IT-Branche. Ist der Mörder aus einem Konkurrenzunternehmen oder steht der Mord in Zusammenhang mit der Fälschung von Arbeitslosenzahlen?</blockquote><br />Wie die Hilpoltsteiner Zeitung <a href="http://www.hilpoltsteiner-zeitung.de/artikel.asp?art=1005155&kat=48&man=16">berichtet</a>, ist die Geschichte um die frisierten Statistiken der Nürnberger Bundesanstalt für Arbeit und die ermordete Informatikerin, die dem Schwindel auf der Spur gewesen sein soll, weniger schmückendes Beiwerk als vielmehr Teil der Haupthandlung.<br /><br />Ein echter "Statistik-Krimi" also? Wenn das kein Zeichen dafür wäre, dass die Statistik mehr und mehr im Mainstream ankommt... Wann wohl mit der Verfilmung zu rechnen ist?<br /></div>Christian Reinbothhttp://www.blogger.com/profile/06772443468928704979noreply@blogger.com0tag:blogger.com,1999:blog-1399345967986819832.post-38459610335671595282009-03-16T03:31:00.000-07:002009-03-16T04:09:26.122-07:00Online-Marktforschung steht hoch im KursOnline-Marktforschung - ein Erfolgsrezept <a href="http://www.persoenlich.com/news/show_news.cfm?newsid=81068">auch in der Schweiz</a>:<br /><br /><div style="text-align: justify; font-style: italic;"><blockquote>Die via Internet betriebene Markt- und Meinungsforschung erfreut sich auch in der Schweiz wachsender Beliebtheit. Während gleich zweier Jahre in Folge verzeichnete die Online-Marktforschung Zuwachsraten von je 60 Prozent, teilt das in diesem Segment tätige Unternehmen <a href="http://www.marketagent.com/">Marketagent.com</a> Schweiz mit.</blockquote></div><div style="text-align: justify;"><br />Weniger erfolgsversprechend sind dagegen Umfragen per Mobiltelefon . Wie schon vor einigen Jahren prophezeit wurde, wird der Wechsel privater Telefonnutzer vom Festnetz-Anschluss zur reinen Mobiltelefon-Nutzung zunehmend zum Problem für CATI:<br /></div><br /><div style="text-align: justify;"><blockquote style="font-style: italic;">Mit der Verlagerung der telefonischen Befragung auf mobile Endgeräte könne CATI aber kaum Terrain gutmachen. Die überwältigende Mehrheit der Handy-Benutzer wolle anonym bleiben - der Telefonverzeichnis-Anbieter directories.ch verzeichne gerade einmal eine halbe Millionen registrierter Mobile-Besitzer. Dieses Bevölkerungssegment sei daher nur sehr eingeschränkt für telefonische Befragungen erreichbar.</blockquote></div><div style="text-align: justify;"><br />Prinzipiell befürworte ich ja das beständig steigende Interesse an <a href="http://www.amazon.de/gp/product/3638827429?ie=UTF8&tag=statistchrist-21&linkCode=as2&camp=1638&creative=6742&creativeASIN=3638827429">Online-Erhebungen</a>, welches ich auch in meiner beruflichen Praxis bemerke - die noch vor drei bis vier Jahren sehr deutlich spürbare Zurückhaltung und Skepsis dem neuen Erhebungsmedium gegenüber hat offenbar stark nachgelassen. Ich frage mich allerdings, wie es mit der statistischen <a href="http://marktforschung.wikia.com/wiki/Repr%C3%A4sentativit%C3%A4t">Repräsentativität</a> vieler dieser Erhebungen aussieht, denn nicht selten erlebe ich, wie im Web erhobene Daten mit der Begründung als repräsentativ verkauft werden, es "hätten ja so viele mitgemacht". Das dies jedoch grober Unfug ist, weiß man ja bereits seit dem <a href="http://www.scienceblogs.de/frischer-wind/2008/05/das-literary-digest-disaster.php">Literary Digest Disaster</a> von 1936...<br /></div><br /><div style="text-align: justify;">Ist mehr Online-Marktforschung wünschenswert? Auf jeden Fall, lassen sich doch im Internet recht einfach auch mehrsprachige Fragebögen mit komplexer Filterführung und ansprechender grafischer Gestaltung realisieren. Mit Begriffen wie "repräsentativ" oder "signifikant" sollte man bei im Internet realisierten Stichproben jedoch vorsichtig umgehen - es sei denn, man kann sicher nachweisen, dass eine repräsentative Online-Stichprobenziehung für diese spezielle Grundgesamtheit tatsächlich realisierbar ist.<br /></div>Christian Reinbothhttp://www.blogger.com/profile/06772443468928704979noreply@blogger.com0tag:blogger.com,1999:blog-1399345967986819832.post-17598151331708475512009-02-20T13:41:00.000-08:002009-02-20T14:07:51.630-08:00NSDstat-Kurs: Erstellung von Kreuztabellen<div style="text-align: justify;">Nach viel zu langer Pause kommen ich heute endlich dazu, mal wieder einen Teil (den mittlerweile fünften) des Blog-Tutorials zur Analysesoftware <a href="http://www.gesis.org/dienstleistungen/methoden/software/nsdstat/">NSDstat Pro</a> einzustellen. In diesem Teil soll nun nach den Blicken auf die Erstellung von <a href="http://marktforschung.wikia.com/wiki/Box-Plot">Box-Plot</a> und <a href="http://marktforschung.wikia.com/wiki/Histogramm">Histogramm</a> auf die Erstellung einfacher Kreuztabellen eingegangen werden.<br /><br />Als Beispieldatensatz dient wie in allen Tutorials bisher auch die Jugendlichen-Befragung zum Thema Politik, die sich auf der NSDStat-Installations-CD befindet. Für das Beispiel verwende ich die Variable v8 – das politische Interesse der Jugendlichen in Kombination mit der Variablen v2 – dem Geschlecht. Im ersten Schritt werfen wir einen Blick auf die beiden Variablen in der Variablenauswahl.<br /></div><br /><a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhWsnswtFO1ohWQiRCYl1auWV73fRVLckIrKBnw-P7E76ZXVkwQ9SQa5wYo-CJMZa4eIm5L0LiJWPZbQIaNAa8uo-AQUpOhTt9yDrgJyDNWLWMxrLruZvVStq-903XhmDikI8BfTu2cHUE/s1600-h/NSD05-01.gif"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer; width: 400px; height: 244px;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhWsnswtFO1ohWQiRCYl1auWV73fRVLckIrKBnw-P7E76ZXVkwQ9SQa5wYo-CJMZa4eIm5L0LiJWPZbQIaNAa8uo-AQUpOhTt9yDrgJyDNWLWMxrLruZvVStq-903XhmDikI8BfTu2cHUE/s400/NSD05-01.gif" alt="" id="BLOGGER_PHOTO_ID_5305001069767108946" border="0" /></a><br /><div style="text-align: justify;">Von diesem Bildschirm aus gelangt man mit einem Klick auf das dritte Icon von oben in den bivariaten Analysemodus. Hier sind nun beide Variablen zu selektieren, wobei die Variable v2 als vertikale, die Variable v8 als horizontale Variable selektiert wird. Mit dieser Auswahl wird festgelegt, welche der Variablen in der Kreuztabelle die Daten für die Spalten und welche die Daten für die Zeilen liefert. Darüber hinaus hat die Reihenfolge natürlich keinen Einfluss auf die Ergebnisse von Tests und anderen bivariaten Verfahren.<br /></div><br /><a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhLCRerfaehT7w3I72VoBBNDv79x4pQtqCZQNVuNQDTAOslLkYvkepZx8ZVo5vL5EjzI77HKg_m9jSqObPOMOvsFFOlchrmxzAd0gyXHmQg5WML8CE-2TOFZAm-ixCqz1HYYKkM-PAE1sI/s1600-h/NSD05-02.gif"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer; width: 400px; height: 239px;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhLCRerfaehT7w3I72VoBBNDv79x4pQtqCZQNVuNQDTAOslLkYvkepZx8ZVo5vL5EjzI77HKg_m9jSqObPOMOvsFFOlchrmxzAd0gyXHmQg5WML8CE-2TOFZAm-ixCqz1HYYKkM-PAE1sI/s400/NSD05-02.gif" alt="" id="BLOGGER_PHOTO_ID_5305001681368266898" border="0" /></a><br /><div style="text-align: justify;">Da „Kreuztabellen“ im oberen Reiter breits selektiert wurde, genügt nun ein Klick auf den OK-Button, um die gewünschte Kreuztabelle zu erstellen.<br /></div><br /><a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEh4Q4-Gc21-53PW5TQt-4tItDZRlLrZNpuqTWLE_hqaErHrJq-DKqxYeDp0Jf48CRAac5QQz5_fGmOhCun7aNd9jXGxORUJ47AM3gLs3SitJ-gzaB44iFEVYxObPCNqP7eQH-5xHOmAblc/s1600-h/NSD05-03.gif"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer; width: 400px; height: 224px;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEh4Q4-Gc21-53PW5TQt-4tItDZRlLrZNpuqTWLE_hqaErHrJq-DKqxYeDp0Jf48CRAac5QQz5_fGmOhCun7aNd9jXGxORUJ47AM3gLs3SitJ-gzaB44iFEVYxObPCNqP7eQH-5xHOmAblc/s400/NSD05-03.gif" alt="" id="BLOGGER_PHOTO_ID_5305001767824185874" border="0" /></a><br /><div style="text-align: justify;">Wie man sieht, besteht die Kreuztabelle aus 4 x 2 Zahlenfeldern (Antworten x Geschlechter) vier Spalten- und zwei Zeilensummen sowie der Gesamtzahl der Fälle, die sich jeweils durch Addition aus den Spalten- und Zeilensummen errechen lässt. Die Tabelle zeigt im Wesentlichen die Verteilung einer Variable über die andere, d.h. sie ermöglicht die leichte Beantwortung einer Frage wie „Wie viele der befragten Jungen haben angegeben, sich stark für Politik zu interessieren?“ (573) oder „Sind in der Gruppe derjenigen Jugendlichen, die sich gar nicht für Politik interessieren, mehr Jungen oder mehr Mädchen?“ (mehr Jungen).<br /><br />Ein Rechtsklick auf die Kreuztabelle öffnet das Optionsmenü, in dem man unter anderem von der standardmäßigen Darstellung der absoluten Häufigkeiten auf eine Darstellung mit relativen Häufigkeiten umschalten kann.<br /></div><br /><a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjgZWjgKwUT1SNN1vA62e7TI2-hqnSbGNEvjJi2FKQ92RM4QLhKWv3tTq1BcT3fhGUAFs7fFDVX6VicLivaNR3KeOu1himKShWos1zD9SdXh05S2CSCnH5e_TR51FCPsiuxK2I0vwWCyA4/s1600-h/NSD05-04.gif"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer; width: 400px; height: 225px;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjgZWjgKwUT1SNN1vA62e7TI2-hqnSbGNEvjJi2FKQ92RM4QLhKWv3tTq1BcT3fhGUAFs7fFDVX6VicLivaNR3KeOu1himKShWos1zD9SdXh05S2CSCnH5e_TR51FCPsiuxK2I0vwWCyA4/s400/NSD05-04.gif" alt="" id="BLOGGER_PHOTO_ID_5305002590584454114" border="0" /></a><br /><div style="text-align: justify;">Darüber hinaus lässt sich mit einem Klick auf das Grafik-Symbol ein sogenanntes „bedingtes Balkendiagramm“ erstellen.<br /></div><br /><a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiVjXSzCslBJEpy5y3tRkTzdxT_P2VSgxzl9eHHn7Tc-SOsw_x3lOUGxP1sKLTWMR9SIWYaAGtxbicjYmLe-yphFBiGQXWgfffnn_TLzCCFN8-WB_b-90bgLG1KgeZDI8-zsOZkwNrDacw/s1600-h/NSD05-05.gif"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer; width: 400px; height: 210px;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiVjXSzCslBJEpy5y3tRkTzdxT_P2VSgxzl9eHHn7Tc-SOsw_x3lOUGxP1sKLTWMR9SIWYaAGtxbicjYmLe-yphFBiGQXWgfffnn_TLzCCFN8-WB_b-90bgLG1KgeZDI8-zsOZkwNrDacw/s400/NSD05-05.gif" alt="" id="BLOGGER_PHOTO_ID_5305002687257555858" border="0" /></a><br /><div style="text-align: justify;">Zu guter letzt wollen wir uns noch kurz ansehen, was für eine Kreuztabelle NSDStat liefert, wenn in der Variablenauswahl die Variable v8 als vertikale und die Variable v2 als horizontale Variable selektiert wird.<br /></div><br /><a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiVUaSlYvMuLTh4lmVTjeB80xwbFU1jpeKC7ihaopklhHuaFtHEFNo-wCJ1P1tTVIy0vbYQjQ8myjUdfO5hCH-yg0Re4e4H1dY-j98w9Yy4GCIbCqiFO2pypkLPKbnzAWUTfrd3N1X_nVA/s1600-h/NSD05-06.gif"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer; width: 400px; height: 218px;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiVUaSlYvMuLTh4lmVTjeB80xwbFU1jpeKC7ihaopklhHuaFtHEFNo-wCJ1P1tTVIy0vbYQjQ8myjUdfO5hCH-yg0Re4e4H1dY-j98w9Yy4GCIbCqiFO2pypkLPKbnzAWUTfrd3N1X_nVA/s400/NSD05-06.gif" alt="" id="BLOGGER_PHOTO_ID_5305002782925859586" border="0" /></a><br /><div style="text-align: justify;">Wie man sieht, vertauschen sich lediglich Zeilen und Spalten, während die Werte und auch die Summen gleich bleiben (wobei in der neuen Kreuztabelle natürlich Zeilen- und Spaltensummen ebenfalls vertauscht sind). Möchte man beispielsweise für einen Bericht eine Kreuztabelle aus zwei Variablen mit einer deutlich unterschiedlichen Zahl an möglichen (diskreten) Antwortoptionen erstellen, lohnt es sich also darüber nachzudenken, ob man lieber eine breite oder eine lange Tabelle einbinden möchte...<br /><br />In den nächsten Teilen dieses Tutorials möchte ich die bivariaten Statistiken weiter vertiefen und mich vielleicht mit der Durchführung von Chi²-Tests beschäftigen – soweit es nicht alternative Wünsche geben sollte...</div>Christian Reinbothhttp://www.blogger.com/profile/06772443468928704979noreply@blogger.com0tag:blogger.com,1999:blog-1399345967986819832.post-75093428429205197792009-02-10T01:25:00.001-08:002009-02-20T14:04:10.555-08:00Fragenbias bei CBN<div style="text-align: justify;"><span style="font-size:100%;"><span style="font-family:georgia;">Passend zum letzten Blogpost heute noch einmal ein schönes Beispiel für einen Fragenbias:</span></span><br /></div><br /><a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEg-RPQYfXa3arGyLa4nw356JhmS0wFjH8J1Ml3qPeYXJ0WREpGqsKw-G5eHWWVVpUWnVUUL7Rs1-5ZfqqVROvrTobaY68C57bRGr9WIKiZ25mejmStIr92qCNDRD1Pl9ksGcAoWmS71cW8/s1600-h/fragenbias.jpg"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer; width: 400px; height: 286px;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEg-RPQYfXa3arGyLa4nw356JhmS0wFjH8J1Ml3qPeYXJ0WREpGqsKw-G5eHWWVVpUWnVUUL7Rs1-5ZfqqVROvrTobaY68C57bRGr9WIKiZ25mejmStIr92qCNDRD1Pl9ksGcAoWmS71cW8/s400/fragenbias.jpg" alt="" id="BLOGGER_PHOTO_ID_5301097598927817410" border="0" /></a><br /><span style="font-style: italic;">„Considering the recent rise in fuel prices, do you think it is a good idea to use the Alaskan Wildlife Reserve for oil exploration?“</span><br /><br />Eine mögliche Alternativfrage wäre gewesen:<br /><br /><span style="font-style: italic;">„Considering the difficulties in preserving endangered species in Alaska, do you think it is a good idea to use the Alaskan Wildlife Reserve for oil exploration?“</span><br /><span style="font-size:100%;"><br /></span><div style="text-align: justify;"><span style="font-size:100%;">Müsste man b<span style="font-family: georgia;">ei dieser Alternativfrage mit einer anderen Verteilung der Antworten rechnen? Auf jeden Fall. Aus welchen Gründen entscheidet man sich für die eine oder die andere Version? Um auf subtile Art und Weise das Ergebnis zu beeinflussen? Oder aus der Unkenntnis heraus, dass diese einfache und kurze Versio</span>n doch die beste gewesen wäre?</span><br /></div><br /><span style="font-style: italic;">„Do you think it is a good idea to use the Alaskan Wildlife Reserve for oil exploration?“</span>Christian Reinbothhttp://www.blogger.com/profile/06772443468928704979noreply@blogger.com0tag:blogger.com,1999:blog-1399345967986819832.post-60506523913478413822009-02-05T02:30:00.000-08:002009-02-05T03:19:29.052-08:00Gutes Fragendesign: Nie zu allgemein formulieren<div style="text-align: justify;"><span style="font-size:100%;"><span style="font-family:georgia;">Zu den häufigsten Aufträgen, die in letzter Zeit bei mir eintrudeln, gehört die Programmierung von Fragebögen für <a href="http://marktforschung.wikia.com/wiki/Online-Befragung">Online-Befragungen</a>. Der Fragebogen selbst ist in den meisten Fällen schon fertiggestellt, und soll nur noch ansprechend für das Internet umgesetzt werden. </span></span><br /><br /><span style="font-size:100%;"><span style="font-family:georgia;">Immer wieder ertappe ich mich dann dabei, wie ich die Fragen während der Programmierung noch einmal umformuliere – und dann am Ende den Kunden anrufe und ihn darum bitte, die Fragen nochmal mit ihm durchgehen zu können, um irreführende Formulierungen zu entfernen. In der Regel hängen die Kunden am Anfang oft ein wenig an ihren Formulierungen, lassen sich dann aber meistens dazu überreden, doch noch das eine oder andere Wort zu ändern.</span></span><br /><br /><span style="font-size:100%;"><span style="font-family:georgia;">Einer der typischen Fehler in Fragebögen sind viel zu allgemeine Formulierungen wie zum Beispiel „Was halten Sie vom Umweltschutz?“ oder „Wie stehen Sie zum Thema Politik?“.<br /><br />Wenn man sich einmal die Frage „Was halten Sie vom Umweltschutz?“ ansieht, wird schnell klar, dass die Frage so allgemein formuliert ist, dass jeder Proband sich den Bezugsrahmen selbst wählen kann. </span></span><span style="font-size:100%;"><span style="font-family:georgia;">Vorstellbar wäre beispielsweise, dass Proband A die Frage auf den Bezugsrahmen „Umweltschutz in der Politik“ bezieht, während Proband B eher an „Umweltschutz in der eigenen Familie“ denkt.<br /><br />Unterschiedliche Probanden werden daher bei einer so gestellten Frage jeweils vor einem anderen Hintergrund antworten. Damit macht man natürlich automatisch einen Fehler, wenn man die Antworten nach Ende der Befragung gemeinsam auswertet – denn da die Probanden den Bezugsrahmen zur Beantwortung der Frage selbst wählen konnten, haben sie im Grunde auf unterschiedliche Fragen geantwortet. Weil man den Bezugsrahmen in der Regel nicht kennt (da er nicht abgefragt wird), sind die gewonnenen Daten mehr oder weniger wertlos.</span></span><br /><br /><span style="font-size:100%;"><span style="font-family:georgia;">Allgemeine Fragestellungen wie „Was halten Sie vom Umweltschutz?“ sind daher nur für solche Befragungen geeignet, deren Ziel es ist, etwas über die Mechanismen hinter der Wahl des Bezugsrahmens bei Probanden unterschiedlicher demographischer Gruppen zu erfahren, wobei die allgemeine Eingangsfrage dann durch weitere Fragen zum Bezugsrahmen ergänzt werden muss. </span></span><br /><br /><span style="font-size:100%;"><span style="font-family:georgia;">Für alle „normalen“ Befragungen aber gilt, dass jede Frage immer so gestellt werden sollte, dass Probanden wenig Interpretationsspielraum haben. Denn nur wenn eindeutig formuliert wird, kann man wissen, auf welche Frage wirklich geantwortet wurde...</span></span></div>Christian Reinbothhttp://www.blogger.com/profile/06772443468928704979noreply@blogger.com0tag:blogger.com,1999:blog-1399345967986819832.post-22423886336767592152009-01-22T11:12:00.000-08:002009-01-22T11:30:48.709-08:00Neues Lernmodul: Box-Plots erstellen und interpretieren<div style="text-align: justify;">Auf <a href="http://www.lernmodule.net/">www.lernmodule.net</a>, einer Plattform für interaktive Lernmodule und Gewinner des Europäischen E-Learning-Awards 2007, ist seit heute ein von mir entwickeltes Statistik-Lernmodul zur Erstellung und Interpretation von <a href="http://marktforschung.wikia.com/wiki/Box-Plot">Box-Plots</a> zu finden.<br /><br />Das Modul vermittelt nicht nur einen Eindruck davon, wie man Box-Plots zeichnet bzw. wie man sie korrekt liest, es wird auch aufgezeigt, welche anderen Formen der grafischen Darstellung in der Statistik üblicherweise verwendet werden - und aus welchen Gründen der Box-Plot als eine besonders informationsreiche Form der grafischen Darstellung statistischer Daten bezeichnet werden kann. Alles in allem sind alle meines Erachtens nach wichtigen Basics enthalten, wobei mir Verbesserungsvorschläge und / oder Änderungswünsche natürlich jederzeit willkommen sind.<br /></div><br /><a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEi18FoWjHQdoN4_Rn2AiYPQZbgIrQ6kpkq49wll6YgLG9olkOU01qKzB6ejyYKP-mkAZxwDlr_XQPF0bQnHxlp-eU6ug8hq5BGhAki_ZybfplMRlkSsTlMpK02CWIAKfvwyHzwL39AMIG0/s1600-h/lernmodul.jpg"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer; width: 400px; height: 324px;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEi18FoWjHQdoN4_Rn2AiYPQZbgIrQ6kpkq49wll6YgLG9olkOU01qKzB6ejyYKP-mkAZxwDlr_XQPF0bQnHxlp-eU6ug8hq5BGhAki_ZybfplMRlkSsTlMpK02CWIAKfvwyHzwL39AMIG0/s400/lernmodul.jpg" alt="" id="BLOGGER_PHOTO_ID_5294199362593049554" border="0" /></a><br /><div style="text-align: justify;">Direkt verlinken kann man das Modul leider nicht, wer es sich aber ansehen möchte kann es im Modul-Menü unter dem Fachgebiet "Mathematik" und dem Lernlevel "Hochschule" finden. Dort findet sich übrigens auch noch ein zweites von mir erstelltes Lernmodul zum Thema "statistische Lagemaße", das allerdings schon fast drei Jahre alt ist. Zwar hatte ich mir immer wieder vorgenommen, mindestens alle paar Monate ein neues Lernmodul abzuliefern, um damit das Projekt zu unterstützen, aber aufgrund meiner beruflichen Auslastung ist leider nichts daraus geworden. Vielleicht finde ich ja 2009 endlich die Zeit dazu, weitere Lernmodule zu Themen aus der Statistik zu erstellen.<br /><br />Vorschläge und Anregungen zu neuen Themen werden jederzeit gerne entgegen genommen.<br /></div>Christian Reinbothhttp://www.blogger.com/profile/06772443468928704979noreply@blogger.com0tag:blogger.com,1999:blog-1399345967986819832.post-12849269876137465682008-12-15T08:10:00.001-08:002008-12-15T08:16:01.866-08:00Das Taxi-Problem<div style="text-align: justify;font-family:georgia;"><span style="font-size:100%;">Im "Frischen Wind", meinem Blog auf Scienceblogs.de, gibt es einen <a href="http://www.scienceblogs.de/frischer-wind/2008/12/das-taxiproblem.php">brandneuen Artikel zum "Taxi-Problem"</a> (Satz von Bayes). Wer sich für das Rechnen mit bedingten Wahrscheinlichkeiten interessiert, kann ja mal hineinschauen. Für weitere Statistik-Artikel fehlt mit leider momentan die Zeit, ich gelobe aber feierlich, dass sich dieser Blog im neuen Jahr wieder deutlich mit Leben füllen wird.<br /></span></div>Christian Reinbothhttp://www.blogger.com/profile/06772443468928704979noreply@blogger.com0tag:blogger.com,1999:blog-1399345967986819832.post-55124775640320407172008-11-10T11:57:00.000-08:002008-11-10T12:00:19.728-08:00Zwei Jahre Statistikberatung Reinboth<div style="text-align: justify;"><span style="font-size:100%;"><span style="font-family:georgia;">Zwei Jahre ... so lange ist es schon her, dass ich mit dem etwas unkonventionellen Vorhaben gestartet bin, mich als <a href="http://www.statistikberatung.eu">freiberuflicher Consultant</a> in Sachen Statistik und Marktforschung zu betätigen – und erfreulicherweise hat sich das Projekt mittlerweile so gut entwickelt, dass mit etlichen weiteren Jahren der freiberuflichen Nebentätigkeit wohl gerechnet werden kann.</span></span><br /><br /><span style="font-size:100%;"><span style="font-family:georgia;">Eine der besten Entscheidungen in diesen zwei Jahren ist die Eröffnung dieses Blogs gewesen. Wer hier in den letzten Monaten einmal vorbeigesurft ist, wird allerdings vermutlich eher zu einer gegenteiligen Einschätzung gelangt sein, denn ein wenig „verlassen“ sieht der Blog schon seit einer ganzen Weile aus – nicht einmal neue Folgen des NSDStat-Kurses, der sich nach wie vor sehr hoher Zugriffszahlen erfreut, habe ich in den letzten Monaten schreiben können. </span></span><br /><br /><span style="font-size:100%;"><span style="font-family:georgia;">Dies hat viele Gründe – enorm viele Aufträge sowie etliche neue Projekte bei der </span><a style="font-family: georgia;" href="http://www.harzoptics.de/">HarzOptics GmbH</a><span style="font-family:georgia;">, meine Bloggerei im „</span><a style="font-family: georgia;" href="http://www.scienceblogs.de/frischer-wind/">Frischen Wind</a><span style="font-family:georgia;">“ und im </span><a style="font-family: georgia;" href="http://harzoptics.blogspot.com/">HarzOptics-Blog</a><span style="font-family:georgia;">... Letzten Endes sind dies alles aber nur schlechte Ausreden, denn der Statistik-Blog hat sich als Markting-Instrument sowie als Plattform zur Knüpfung vieler großartiger Branchenkontakte sehr gut bewährt – den Blog also einfach „verkümmern“ zu lassen, ist also mit Sicherheit keine gute Option.</span></span><br /><br /><span style="font-size:100%;"><span style="font-family:georgia;">Aus diesem Grund hier der wichtigste Vorsatz fürs dritte Geschäftsjahr: Es soll wieder mehr gebloggt werden – über spannende Entwicklungen in der Marktforschung, über die alltäglichen Aufgaben eines Statistik-Consultants und natürlich auch über die Arbeit mit NSDStat. Ich hoffe, dass es mir gelingt, diesen Vorsatz in den nächsten Wochen und Monaten auch umzusetzen – auf dass ich beim dritten Betriebsjubiläum weiter steigende Blog-Zugriffszahlen verkünden und mich über etliche hier gewonnene Kontakte zu Kunden und Kollegen freuen kann.</span></span></div>Christian Reinbothhttp://www.blogger.com/profile/06772443468928704979noreply@blogger.com0tag:blogger.com,1999:blog-1399345967986819832.post-66076940164598460192008-06-16T05:52:00.000-07:002008-06-16T07:05:56.736-07:00Statista - der neue Statistik-Service im Internet<div style="text-align: justify;"><span style="font-size:100%;"><span style="font-family:georgia;">Mit </span><a style="font-family: georgia;" href="http://de.statista.org/">Statista</a><span style="font-family:georgia;"> wurde ein neuer Statistik-Service im Netz gestartet, der filterbare Grafiken zur Einbindung in Blogs und andere Webseiten anbietet. Die Webseite, deren Macher laut Eigenauskunft ein "Wikipedia für Statistiken" planen, gefällt mir persönlich auf jeden Fall sehr gut - ein Urteil, dem sich auch die Online-Redaktion des SPIEGEL </span><a style="font-family: georgia;" href="http://www.spiegel.de/netzwelt/web/0,1518,558900,00.html">anschließt</a><span style="font-family:georgia;">. Die angebotenen Daten stammen ausschließlich aus seriösen Quellen - hauptsächlich von <a href="http://www.awa-online.de/">Allensbach</a>, <a href="http://www.diw.de/">DIW</a>, <a href="http://www.gesis.org/">GESIS</a> und <a href="http://www.destatis.de/">DeStatis</a> - und lassen sich grafisch aufbereitet in Form von <a href="http://marktforschung.wikia.com/wiki/Balkendiagramm">Balkendiagrammen</a> mittels eines kleinen JavaScript-Codesegments in Blogs und HTML-Seiten einbinden (vergleichbar etwa mit der Einbindung von YouTube-Videos).<br /><br /></span></span><span style="font-size:100%;"><span style="font-family:georgia;">Für Blogspot-Nutzer ist Statista allerdings (noch) ungeeignet, da sich die Ausgabegröße der Grafiken nicht reduzieren lässt. Die Breite von 510 Pixeln wird stattdessen durch Statista vorgegeben, was natürlich bedeutet, dass die Grafiken überall dort, wo weniger Platz vorhanden ist, nur teilweise oder mit "zerschossenem" Layout eingebunden werden können (In meinem Zweitblog bei ScienceBlogs hat es dagegen <a href="http://www.scienceblogs.de/frischer-wind/2008/06/mangelndes-interesse-an-der-wissenschaft.php">einwandfrei funktioniert</a>). Dienste wie <a href="http://www.widgetbox.com/">Widgetbox</a> zeigen, dass eine Skalierbarkeit auch von komplexen, grafischen JS-Applikationen durchaus möglich ist, so dass ich mir hier noch ein wenig "Nacharbeit" von Seiten der Statista-Macher wünschen würde.</span></span><span style="font-size:100%;"><span style="font-family:georgia;"><br /><br />Aus Sicht des Marktforschers hat die Statista-Nutzung auch noch einen weiteren (größeren) Pferdefuß, der hier ebenfalls nicht verschwiegen werden soll. Denn obwohl natürlich häufig (nach Augenschein) signifikante Zusammenhänge vermutet werden können, beschränkt sich Statista auf die reine Ausgabe von Grafiken und bietet keinerlei inferenzstatistische Verfahren zur Überprüfung vermeintlicher Signifikanzen an - und auf die Originaldaten hat man (natürlich) ebenfalls keinen Zugriff. Tests sind somit ausgeschlossen, die (nicht selten subjektive) Interpretation der Grafiken rückt damit in den Vordergrund.<br /><br />Alles in allem also doch </span></span><span style="font-size:100%;"><span style="font-family:georgia;">wieder </span></span><span style="font-size:100%;"><span style="font-family:georgia;">nur ein neues Grafik-Spielzeug? In gewisser Weise schon - aber zumindest das beste und unterhaltsamste, das mir im WWW bisher untergekommen ist. Vor allem die Auswahl an verfügbaren Datensätzen von Einkommen über Migration, Internetnutzung, politische Einstellungen und Gesundheit bis hin zu Markenbekanntheit ist enorm - und eine Quellenangabe ist zu jeder Statistik vorhanden. Dies macht Statista zu einem großartigen Recherchetool für Befragungsdaten aller Art - und sollte das Konzept der Seitenbetreiber aufgehen, ist ja auch nicht auszuschließen, dass <a href="http://marktforschung.wikia.com/wiki/T-Test">T-Test</a> und Chi²-Statistik irgendwann noch nachgeliefert werden.<br /></span></span></div>Christian Reinbothhttp://www.blogger.com/profile/06772443468928704979noreply@blogger.com0tag:blogger.com,1999:blog-1399345967986819832.post-26773678199900044182008-04-27T02:18:00.000-07:002008-04-27T02:20:49.997-07:00YouTube – ein Marktforschungs-Tool?<div style="text-align: justify;"><span style="font-size:100%;"><span style="font-family: georgia;">Seitdem die </span><a style="font-family: georgia;" href="http://www.youtube.de/">YouTube-Benutzeroberfläche</a><span style="font-family: georgia;"> um das neue Statistik-Tool „Insight“ </span><a style="font-family: georgia;" href="http://googleblog.blogspot.com/2008/03/insight-into-youtube-videos.html">erweitert wurde</a><span style="font-family: georgia;">, mehren sich die Ansagen aus dem Bereich der Markt- und Meinungsforschung, YouTube künftig als </span><a style="font-family: georgia;" href="http://www.nachrichten.ch/detail/304945.htm">Plattform für Fokusgruppen</a><span style="font-family: georgia;"> einsetzen zu wollen.</span></span><br /><br /><span style="font-size:100%;"><span style="font-family: georgia;">Dahinter steckt der Gedanke, dass Werbetreibende, die entweder Online-Kampagnen fahren oder TV-Kampagnen im Netz testen (was aufgrund der niedrigen Auflösung der YouTube-Filme aber eher selten vorkommt), das Verhalten der Zuschauer nun genauer evaluieren können. Neben der Information, wie häufig jeder Film aufgerufen wurde – die allerdings auch schon vor „Insight“ verfügbar war – lässt sich beispielsweise ermitteln, aus welcher geographischen Region die Zuschauer stammen. Für einen Werbetreibenden bedeutet dies, dass sich (in gewissen Grenzen) nachvollziehen lässt, wo die Kampagnen am besten und wo sie am schlechtesten „ankommen“. </span></span><br /><br /><span style="font-size:100%;"><span style="font-family: georgia;">Für den Marktforscher auf jeden Fall eine interessante Sache, obgleich es durchaus einige Features mehr gebraucht hätte, um „Insight“ zu einem echten Marktforschungs-Tool zu machen. Beispielsweise die Information, in wie viel Prozent aller Video-Aufrufe der Werbespot auch bis zum Ende abgespielt wurde, bzw. in wie vielen Fällen die Betrachtung vorzeitig abgebrochen wurde – und auch diese Information natürlich geographisch verteilt. Oder wie viele der Video-Aufrufe tatsächlich von unterschiedlichen IP aus erfolgten, bzw. wie viel Prozent der Aufrufe auf das Konto von Zuschauern gehen, die sich den Film mehrfach ansehen (was ja nicht unbedingt schlecht sein muss, da es Rückschlüsse auf die Beliebtheit zulässt). Wichtig wäre es auch zu erfahren, wie viele der Zuschauer den Film auf der YouTube-Seite selbst gesehen haben, und wie viele Aufrufe von „embedded videos“ über dritte Seiten es gab – und welche Seiten dies waren.</span></span><br /><br /><span style="font-size:100%;"><span style="font-family: georgia;">All das und noch viel mehr wünscht sich das Marktforscher-Herz. Dass es Google gelingt, einen solch umfangreichen Service zum Nulltarif auf die Beine zu stellen, kann man jedoch sicher nicht erwarten, wobei ich die Voraussage wage, dass sich bei entsprechend umfangreichem Angebot an Informationen durchaus auch zahlungswillige Werbetreibende finden lassen würden. Insgesamt also noch kein ganz großer Sprung, aber auf jeden Fall ein interessantes Feature, mit dem die Palette der für einen Online-Werbeauftritt wichtigen „Webstatistiken“ erneut erweitert wird. Google hat übrigens bereits angekündigt, „Insight“ in den nächsten Monaten um zusätzliche Statistiken erweitern zu wollen – man darf / kann also weiterhin gespannt sein.</span></span></div>Christian Reinbothhttp://www.blogger.com/profile/06772443468928704979noreply@blogger.com0tag:blogger.com,1999:blog-1399345967986819832.post-30329111095526856982008-04-16T13:33:00.001-07:002008-04-16T14:05:16.557-07:00Die NPD glaubt nicht an Meinungsforschung....<div style="text-align: justify;"><span style="font-size:100%;"><span style="font-family:georgia;">...jedenfalls nicht dann, wenn die eigene Partei nicht gut abschneidet. Dies ist jedenfalls einer </span><a style="font-family: georgia;" href="http://pressemitteilung.ws/node/125654">Pressemitteilung</a><span style="font-family:georgia;"> vom vergangenen Freitag zu entnehmen, in der dem Leipziger </span><a style="font-family: georgia;" href="http://www.imleipzig.de/">Institut für Marktforschung</a><span style="font-family:georgia;"> ziemlich direkt vorgeworfen wird, es würde Umfrageergebnisse zugunsten der SPD verschönern - die es bei einer vergleichsweise unwichtigen Umfrage der "Morgenpost" auf ganze 24 Prozent brachte. </span></span><br /><br /><span style="font-size:100%;"><span style="font-family:georgia;">Mit keiner anderen Begründung als der, dass man sich dieses Ergebnis angesichts des Bundestrends nicht vorstellen könnte (obwohl es eigentlich sogar recht gut im Bundestrend liegt), erklärt man die Umfrage für manipuliert. Geradezu verdächtig erscheint es den Statistik-Experten der "nationalen Opposition", dass SPD, Grüne und </span><strike style="font-family: georgia;">SED</strike><span style="font-family:georgia;"> Linke gemeinsam genau auf 50% der abgegebenen Stimmen kommen - da muss doch eine Manipulation dahinterstecken befinden sie und erklären die Meinungsumfrage kurzerhand zur "Meinungslenkungs-Waffe".</span></span><br /><br /><span style="font-size:100%;"><span style="font-family:georgia;">Marktforscher als Marionetten der "Systemkräfte"? Im Grunde eine unterhaltsame Verschwörungstheorie, würde sie nicht den Experten des IfM kollektiven Betrug vorwerfen - immerhin ist der Pressemitteilung (wörtlich) zu entnehmen, dass dort "regelmäßig Umfrageergebnisse einseitig zugunsten der SPD geschönt" würden. Dies wiederum macht die Verlautbarung der NPD zu einem echten Ärgernis, gegen das sich die Kolleginnen und Kollegen aus Leipzig hoffentlich erfolgreich zu Wehr setzen werden.</span></span></div>Christian Reinbothhttp://www.blogger.com/profile/06772443468928704979noreply@blogger.com0tag:blogger.com,1999:blog-1399345967986819832.post-80124306287633022632008-03-24T07:55:00.000-07:002008-03-24T08:31:54.423-07:00SampleSizer: Kostenloses Tool zur Bestimmung des optimalen Stichprobenumfangs<div style="text-align: justify;font-family:georgia;"><span style="font-size:100%;">Eine der meist gestellten Fragen bei der Erhebungsplanung ist die nach der optimalen Stichprobengröße. Die wohl häufigste Antwort auf diese Frage lautet: „Je größer desto besser“. </span><span style="font-size:100%;">Dass dies nicht die beste Antwort ist, bewies bekanntermaßen bereits George Gallup (Gründer der heute sehr bekannten <a href="http://www.gallup.com/" target="_blank">Gallup Organization</a>), der 1936 den Ausgang der US-Präsidentschaftswahl mit einer Stichprobe von nur 5000 Wählern sehr genau vorhersagen konnte, während die Analysten des Literary Digest mit einer Mega-Stichprobe von 2,3 Millionen Probanden zu einer (auch für das Magazin) desaströsen Fehleinschätzung des Wahlausgangs gelangten. Wie Gallup zeigte, kommt es primär auf das Verfahren der Stichprobenziehung an – und erst wenn die Stichprobe sauber gezogen wird, lohnt es sich über die optimale Größe derselben nachzudenken. (Mehr hierzu in meinem kurzen Artikel über das <a href="http://www.harzoptics.de/stichprobe-auswirkung.html" target="_blank">Literary Digest Desaster</a> von 1936 für die Nachwuchswissenschaftlerkonferenz 2007).<br /></span></div><div style="text-align: justify;"><br /><span style="font-size:100%;"><span style="font-family:georgia;">Wenn für eine Zufallsstichprobe oder ein adäquates Ersatzverfahren gesorgt wurde, tritt jedoch die Frage nach der optimalen Stichprobengröße wieder in den Vordergrund. Wie also lässt sich diese (mathematisch) bestimmen? In der Praxis existieren hier verschiedene Ansätze, wobei ich mit der Formel von William G. Cochran bisher die besten Erfahrungen gemacht habe:</span></span> </div><div style="text-align: justify;"> </div><p style="margin-bottom: 0cm; text-align: justify;font-family:georgia;"><span style="font-size:100%;"><a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhbkf9K2ghPrbhAscLB9aDqUT30C9s8tEnFSnRSLVLyL0UuUJHK2Sv48bTNVRQm0e0X1iYRkAfJiyJYSVAfo-vZeWeOsnlj_BBSmhbCOfvgg1EqRduYndYmV0dkSjcS0SXhd8_gIFS8v8o/s1600-h/stichprobengroesse.gif"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhbkf9K2ghPrbhAscLB9aDqUT30C9s8tEnFSnRSLVLyL0UuUJHK2Sv48bTNVRQm0e0X1iYRkAfJiyJYSVAfo-vZeWeOsnlj_BBSmhbCOfvgg1EqRduYndYmV0dkSjcS0SXhd8_gIFS8v8o/s320/stichprobengroesse.gif" alt="" id="BLOGGER_PHOTO_ID_5181327446548791234" border="0" /></a></span></p><div style="text-align: justify;"> </div><p style="margin-bottom: 0cm; text-align: justify;font-family:georgia;"><span style="font-size:100%;">Die Formel basiert auf den aus der Statistik bekannten Konfidenzintervallen. Diese schließen ein Merkmal mit einer gewissen Sicherheit zwischen zwei Grenzwerten ein (Beispiel: „Der prozentuale Anteil an den Unterstützern einer bestimmten Petition unter Familienvätern liegt mit einer Sicherheit von 95% zwischen 16% und 18%). Wer sich für die Mathematik hinter der Formel interessiert, kann sich in der Originalquelle von Cochran näher informieren:</span></p><div style="text-align: justify;"> </div><p style="margin-bottom: 0cm; text-align: justify;font-family:georgia;"><span style="font-size:100%;"><span style="font-style: italic;">Cochran, W. G. 1963. Sampling Techniques, 2nd Ed., New York: John Wiley and Sons, Inc. </span>(in nahezu jeder Hochschulbibliothek zu finden)<br /></span></p><div style="text-align: justify;"> </div><p style="margin-bottom: 0cm; text-align: justify;font-family:georgia;"><span style="font-size:100%;">Für alle Studenten, die lediglich einmalig ein Erhebungsprojekt umsetzen möchten und daher einen Richtwert für die Stichprobengröße benötigen, ist es aber sicher viel interessanter zu erfahren, welche Werte in die Formel eingehen: N (Die Größe der <a href="http://marktforschung.wikia.com/wiki/Grundgesamtheit" target="_blank">Grundgesamtheit</a>), e (Die „+/-“ - Breite des Konfidenzintervalls), p (Der Stichprobenanteil), q (entspricht 1 – p) und der Z-Wert aus der <a href="http://marktforschung.wikia.com/wiki/Normalverteilung" target="_blank">Standardnormalverteilung</a> für die gewünschte Sicherheit des Konfidenzintervalls (d.h. 1,96 für ein Intervall mit 95%iger Sicherheit). Wenn man den Stichprobenanteil (den Anteil an Probanden, welche die untersuchte Merkmalsausprägung aufweisen) nicht kennt, was ja häufig der Fall ist, setzt man im Sinne einer konservativen Schätzung der optimalen Stichprobengröße üblicherweise 50% ein, womit die maximale Schwankungsbreite erreicht wäre (und damit auch der "ungünstigste" Fall, der zu einer Maximierung des Stichprobenumfangs führt).</span></p><div style="text-align: justify;"> </div><p style="margin-bottom: 0cm; text-align: justify;font-family:georgia;"><span style="font-size:100%;">Wer einmal nachrechnen möchte: Bei einer Grundgesamtheit von 20.000 Personen, einem unbekannten Stichprobenanteil (also ersatzweise p = 0.5) und einer Intervallbreite von +/- 3% um den Stichprobenanteilswert (e = 0.03) sollten mindestens 1015 Personen befragt werden. Befolgt man diesen Hinweis und wird zudem eine saubere Stichprobe gezogen, so ist davon auszugehen, dass der „reale“ Anteilswert in der Grundgesamtheit (der sich nur durch eine Vollerhebung ermitteln ließe) mit 95%iger Wahrscheinlichkeit nur um maximal +/- 3% vom in der Stichprobe gefundenen Wert abweicht.</span></p><div style="text-align: justify;"> </div><p style="margin-bottom: 0cm; text-align: justify;font-family:georgia;"><span style="font-size:100%;">Einer meiner besten Kunden fragte kürzlich an, ob es nicht möglich wäre, ein Softwaretool zu programmieren, das einem die Berechnung der optimalen Stichprobengröße abnimmt. Nach einer Reaktivierung meiner leicht angestaubten <a href="http://www.microsoft.com/germany/express/default.aspx" target="_blank">VisualBasic-Kenntnisse</a> aus dem Informatik-Studium und zwei Versionsupdates bin ich mit dem Tool inzwischen soweit zufrieden, dass ich es auch allen anderen Interessierten zur Verfügung stellen möchte – natürlich kostenlos.</span></p><div style="text-align: justify;"> </div><p style="margin-bottom: 0cm; text-align: justify;font-family:georgia;"><span style="font-size:100%;">Mit SampleSizer (aktuell in der Version 1.2.0.4) lässt sich also die optimale Stichprobengröße ganz einfach berechnen: Nachdem man die Größe der Grundgesamtheit, den erwarteten Stichprobenanteilswert (oder, wenn unbekannt, alternativ 0.5) sowie die maximale Abweichung nach oben oder unten im Konfidenzintervall eingegeben hat, reicht ein Klick auf den „Berechnen“-Button aus, um den Richtwert für die Stichprobengröße nach Cochran zu erhalten:</span><br /></p><p style="margin-bottom: 0cm; text-align: justify;font-family:georgia;"><span style="font-size:100%;"><a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEidBjpR2Z2gGq_u97FAJ8dj4Ztq8p_yeaL3_l2xQg3nXRjJJUzJu0Tgc3q2toNmdDrF7Yv5ZDigfEhPGV4qHnEbjVRYuQvzlViV0Jf3cHMyckLYvlfBpC_cgS10Az_CzySkvXikws8kV7Q/s1600-h/SampleSizer.gif"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEidBjpR2Z2gGq_u97FAJ8dj4Ztq8p_yeaL3_l2xQg3nXRjJJUzJu0Tgc3q2toNmdDrF7Yv5ZDigfEhPGV4qHnEbjVRYuQvzlViV0Jf3cHMyckLYvlfBpC_cgS10Az_CzySkvXikws8kV7Q/s320/SampleSizer.gif" alt="" id="BLOGGER_PHOTO_ID_5181327592577679314" border="0" /></a></span></p><div style="text-align: justify;"> </div><div style="text-align: justify;"> </div><p style="margin-bottom: 0cm; text-align: justify;font-family:georgia;"><span style="font-size:100%;">Das Programm lässt sich <a href="http://www.statistikberatung.eu/SampleSizer.zip" target="_blank">hier</a> als zip-File herunterladen. Nachdem man die Datei in ein Verzeichnis entpackt hat, kann man dort mit einem Klick auf „Setup“ die Installationsroutine starten, bei der eventuell (falls auf dem Rechner noch nicht vorhanden) zusätzlich ein paar .NET-Komponenten vom Microsoft-Server heruntergeladen werden. Wer möchte, kann SampleSizer sowohl für private als auch für kommerzielle Zwecke frei einsetzen, verändert werden darf es jedoch nicht. Dafür darf es gerne weitergegeben oder auf anderen Homepages zum Download angeboten werden (natürlich auch kostenfrei), solange dabei die Quelle genannt wird.</span></p><div style="text-align: justify;"> </div><p style="margin-bottom: 0cm; text-align: justify;font-family:georgia;"><span style="font-size:100%;">Wie bei Freeware üblich distanziere ich mich natürlich von allen Schäden, die durch Installation oder Verwendung der Software oder die falsche Interpretation der Ergebnisse eintreten könnten (Bei MS-Software weiß man das ja nie so genau, aber mit VB habe ich bisher eigentlich nur gute bis hervorragende Erfahrungen gesammelt). </span><span style="font-size:100%;">Ich hoffe, der eine oder andere meiner Blogleser kann das Tool gebrauchen und freue mich natürlich über jede Rückmeldung und alle (auch kritischen) Verbesserungsvorschläge.</span></p><div style="text-align: justify;"> </div><p style="margin-bottom: 0cm; text-align: justify;font-family:georgia;"><span style="font-size:100%;">Wer also noch Ideen hat, wie man das Tool verbessern könnte, kann sich jederzeit gerne an mich wenden. Wer darüber hinaus eine Idee oder Anregung hat, welche „Statistik-Tools“ ebenfalls von allgemeinem Interesse sein könnten, kann mir ebenfalls gerne schreiben. Vielleicht lässt sich die eine oder andere Idee ja ohne allzugroßen Aufwand umsetzen – und dann könnte es in Zukunft in diesem Blog natürlich öfter mal ein Downloadangebot geben.</span></p>Christian Reinbothhttp://www.blogger.com/profile/06772443468928704979noreply@blogger.com0tag:blogger.com,1999:blog-1399345967986819832.post-16572312578733400812008-02-27T12:49:00.000-08:002008-02-27T12:57:01.998-08:00DESTATIS und de juris<p style="margin-bottom: 0cm; text-align: justify;font-family:georgia;"><span style="font-size:100%;">Ein äußerst interessantes <a href="http://www.impulse.de/tools/meldungen/homepage/823360.html" target="_blank">Urteil</a> fällte in der letzten Woche das Verwaltungsgericht Wiesbaden. Danach sind Unternehmen verpflichtet, interne Daten an das <a href="http://www.destatis.de/">Statistische Bundesamt</a> herauszugeben. Dagegen geklagt hatte ein Großhandelsunternehmen aus Schleswig-Holstein, welches die Anforderung des Bundesamtes als Eingriff in das Recht auf informelle Selbstbestimmung wertete.</span></p><div style="text-align: justify;"> </div><p style="margin-bottom: 0cm; text-align: justify;font-family:georgia;"><span style="font-size:100%;">Das Unternehmen bemängelte zudem, dass neben Aspekten des Datenschutzes auch die Kriterien unklar seien, nach denen das Bundesamt die zur Auskunft verpflichteten Unternehmen auswählt. Dieser Einschätzung widersprach das Gericht und stellte fest, dass die <a href="http://marktforschung.wikia.com/wiki/Grundgesamtheit">Grundgesamtheit</a> an theoretisch zur Auskunft verpflichteten Unternehmen sehr wohl feststehe, und dass das Bundesamt berechtigt sei, aus diesen eine Auswahl nach eigenem Urteil zu treffen. Eine Auswahl von Unternehmen aus einer vorgegebenen Grundgesamtheit – klingt für mich nach einer Stichprobe, wobei man bei Verwendung eines einfachen Stichprobenverfahrens diesen „Mechanismus“ ja problemlos hätte offenlegen können.</span></p><div style="text-align: justify;"> </div><p style="margin-bottom: 0cm; text-align: justify;font-family:georgia;"><span style="font-size:100%;">Das Großhandelsunternehmen bemängelte außerdem, dass die Nicht-Zuordnung der Daten nicht gewährleistet sei, da es in Schleswig-Holstein nur fünf Unternehmen der gleichen Größenordnung gäbe. Auch dieser Einschätzung widersprach das Gericht – wären alle fünf Unternehmen dazu verpflichtet, Daten abzuliefern, dann könnte man konkrete Geschäftszahlen nicht mehr zuordnen.</span></p><div style="text-align: justify;"> </div><p style="margin-bottom: 0cm; text-align: justify;font-family:georgia;"><span style="font-size:100%;">Das Urteil ist für Statistiker durchaus von Interesse – denn was passiert, wenn in einer zufällig gewählten Stichprobe einmal nur ein Unternehmen einer bestimmten Größenklasse auftaucht? Muss die Stichprobe dann aus juristischen Gründen so erweitert werden, dass eine Nicht-Zuordnung der Daten gewährleistet werden kann? Die <a href="http://marktforschung.wikia.com/wiki/Repr%C3%A4sentativit%C3%A4t">Repräsentativität</a> einer Erhebung würde unter solchen Maßnahmen selbstverständlich leiden, so dass unklar bleibt, was in einem solchen Fall zu geschehen hat. Mir hat sich zudem nicht erschlossen, wieso die Nicht-Zuordnung der Daten nur durch die Aufnahme von Daten ähnlicher Betriebe gewährleistet werden kann, und nicht durch die vollständige Anonymität der Erhebung selbst.</span></p><div style="text-align: justify;"> </div><p style="margin-bottom: 0cm; text-align: justify;font-family:georgia;"><span style="font-size:100%;">So oder so wird das Bundesamt wohl noch eine Weile auf die Daten warten müssen, denn ein abschließendes Urteil in der Datenklage steht noch aus: Das Großhandelsunternehmen hat bereits angekündigt, gegen das Urteil von Wiesbaden beim Bundesverwaltungsgericht in Leipzig Revision einzulegen.</span></p>Christian Reinbothhttp://www.blogger.com/profile/06772443468928704979noreply@blogger.com0tag:blogger.com,1999:blog-1399345967986819832.post-66541258680416529212008-02-25T09:19:00.000-08:002008-02-25T09:26:19.763-08:00Neues Zentrum für Statistik in Bielefeld<p style="margin-bottom: 0cm; text-align: justify;font-family:georgia;"><span style="font-size:100%;">Die Bedeutung von Statistiken in Wirtschaft, Politik und Gesellschaftswissenschaften hat über die letzten Jahrzehnte kontinuierlich zugenommen. Besonders für die Marktforschung, ein Wirtschaftszweig der in den letzten Jahren kontinuierlich gewachsen ist, stellt die Statistik natürlich so etwas wie eine „Leib- und Magenwissenschaft“ dar.</span></p><p style="margin-bottom: 0cm; text-align: justify;font-family:georgia;"><span style="font-size:100%;">Gerade im Zuge der immer wichtiger werdenden Online-Marktforschung ist es wichtig, neben grundlegenden Kenntnissen über statistische Verfahren auch über wesentliche Methodenkenntnisse zu verfügen, da die Umsetzung von traditionellen „Offline-Befragungen“ in der Online-Welt mit vielen Einschränkungen und Problemen behaftet ist. Aber nicht nur online, auch offline sind theoretische Kenntnisse unabdingbar, wenn man saubere und wissenschaftlich korrekte Marktforschung betreiben will.</span></p><p style="margin-bottom: 0cm; text-align: justify;font-family:georgia;"><span style="font-size:100%;">Um so erfreulicher ist da eine aktuelle Meldung des <a href="http://www.idw-online.de/pages/de/news247816">Informationsdienst Wissenschaft</a>: An der <a href="http://www.uni-bielefeld.de/" target="_blank">Universität Bielefeld</a> hat man die fachbereichsübergreifende Bedeutung der Statistik klar erkannt und bringt in einem in der letzten Woche neugegründeten „Zentrum für Statistik“ Wissenschaftler mit verschiedenen fachlichen Backgrounds zusammen. Durch die Zentralisierung der Statistik sollen die methodisch, empirisch und statistisch orientierten Wissenschaftler ihr Wissen bündeln, während gleichzeitig die jeweiligen fachspezifischen Richtungen der Statistik erhalten bleiben.</span></p><p style="margin-bottom: 0cm; text-align: justify;font-family:georgia;"><span style="font-size:100%;">Der Blick auf die Liste der im Zentrum vertretenen Professoren offenbart die breite wissenschaftliche Bedeutung der Statistik: Mit Fachleuten aus den Bereichen Marketing, Ökonometrie, Wirtschaftswissenschaften, Mathematik, Demographie, Epidemiologie, Sozialforschung und Methodenlehre ist das Zentrum bereits gut aufgestellt. Es kommt jedoch noch besser, denn auch der Aufbau eines Master- beziehungsweise Promotionsstudiengangs "Statistische Wissenschaften" ist bereits fest eingeplant. In Kooperation mit dem Bielefelder Zentrum für Statistk-Beratung (<a href="http://www.wiwi.uni-bielefeld.de/statbece/" target="_blank">StatBeCe</a>) sowie der Statistik- und Methodenberatung für Psychologinnen und Psychologen soll das neue Zentrum für Statistik vor allem Wissenschaftler und Studierende beraten, wobei auch angedacht ist, die Leistungen des Zentrums für Industrie und Verwaltung zu öffnen.</span></p><p style="margin-bottom: 0cm; text-align: justify;font-family:georgia;"><span style="font-size:100%;">Den Mitarbeitern und Kollegen um <a href="http://www.wiwi.uni-bielefeld.de/%7Ekauermann/kauermann/Homepage.html">Statistik-Professor Dr. Kauermann</a> kann man zu diesem ambitionierten Vorhaben wohl nur gratulieren und ihnen mit dem neuen Statistik-Zentrum einen guten Start wünschen. Sobald das gebündelte Statistik-Wissen aus Bielefeld im Netz präsentiert wird, wird es im Statistik-Blog sicher einen weiteren Link in der Blogroll geben.</span></p>Christian Reinbothhttp://www.blogger.com/profile/06772443468928704979noreply@blogger.com0tag:blogger.com,1999:blog-1399345967986819832.post-48209359162749661592008-02-18T03:38:00.000-08:002008-02-18T04:10:46.639-08:00Der Befrager – Online-Befragungen leicht gemacht<div style="text-align: justify;"><span style="font-family:Georgia,serif;">Aus vielen E-Mails weiß ich, dass in diesem Blog auch einige Studentinnen und Studenten mitlesen. Für all diejenigen Studierenden unter meinen Lesern, die im Rahmen einer Semester- oder Abschlussarbeit eine Online-Befragung durchführen möchten (eine empirische Untersuchung bietet sich ja bei vielen Aufgabenstellungen an), stellt sich natürlich auch die Frage, mit welcher Software der Fragebogen erstellt werden kann – es sei denn natürlich, man möchte sich selbst an der HTML-Programmierung versuchen (für Informatiker kann das ja ganz reizvoll sein). Für alle anderen, die sich die Arbeit so einfach wie möglich machen wollen, lohnt sich ein Blick auf das kostenfreie Online-Fragebogensystem „Befrager“, das im Netz unter </span><span style="font-size:100%;"><a style="font-family: georgia;" href="http://www.befrager.de/">http://www.befrager.de</a></span><span style="font-family:georgia;"><span style="font-size:100%;"><span style="font-family:georgia;"> zu finden ist.</span></span><br /></span></div> <p style="margin-bottom: 0cm;" align="justify"><span style="font-family:georgia;">Beim "Befrager" handelt es sich um eine von Christian Hansen entwickelte Software, mit der man äußerst einfach und komfortabel Onlinebefragungen erstellen kann. Das ganze System läuft komplett auf dem Webserver des Anbieters ab, was für den Nutzer den großen Vorteil hat, dass nichts heruntergeladen oder installiert werden muss. Statt dessen kann man den Fragebogen direkt im eigenen Browser erstellen, testen und für die Probanden freigeben. Die einzige Voraussetzung für die Nutzung ist ein Browser der JavaScript beherrscht und Cookies annehmen kann. Sind diese Voraussetzungen erfüllt, steht der Erstellung beliebig vieler Online-Fragebögen nichts mehr im Wege, wobei man auf eine Vielzahl an Frageformen und Features zurückgreifen kann. </span> </p> <p style="margin-bottom: 0cm;" align="justify"><span style="font-family:georgia;">Um einmal einen kleinen Einblick in die Möglichkeiten zu geben, habe ich ein paar alte Screenshots einer Online-Befragung herausgesucht, die ich 2005 im Rahmen meiner Diplomarbeit mit dem "Befrager" erstellt habe. Die Befragung wurde im Auftrag der Bürgerinitiative "<a href="http://www.suedharzstrecke.de/" target="_blank">Höchste Eisenbahn für den Südharz</a>" durchgeführt, die sich für den Erhalt und den Ausbau der Südharz-Eisenbahnstrecke einsetzt. Der Fragebogen richtete sich an Mitglieder und Unterstützer der Initiative, Ziel der Erhebung war es, etwas über deren ÖPNV-Nutzungsgewohnheiten in Erfahrung zu bringen.</span></p> <p style="margin-bottom: 0cm;" align="justify"><a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhPDfCj6JS2vogrGCvmNY-Z5wcQNNTmxUgK21NutAGoOpgeA0UEC5SrRvgqzDPvD6WCG4r-_4sgC5bD-yjXI23IjK7NPVmY2ZvO8kFqvFGISTC2qjSNWdVn-Zhet0Yt68gw-7bhB4I-XZY/s1600-h/Befrager01.gif"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhPDfCj6JS2vogrGCvmNY-Z5wcQNNTmxUgK21NutAGoOpgeA0UEC5SrRvgqzDPvD6WCG4r-_4sgC5bD-yjXI23IjK7NPVmY2ZvO8kFqvFGISTC2qjSNWdVn-Zhet0Yt68gw-7bhB4I-XZY/s320/Befrager01.gif" alt="" id="BLOGGER_PHOTO_ID_5168285049723622562" border="0" /></a></p> <p style="margin-bottom: 0cm;" align="justify"><span style="font-family:georgia;">Hier sieht man eine HTML-Frageseite aus der ÖPNV-Befragung mit einigen Radiobuttons. Von den vorgegebenen Antwortmöglichkeiten lässt sich bei diesem Fragetyp immer nur eine selektieren – und auch ob die Frage einfach vom Probanden übersprungen werden kann, lässt sich im "Befrager" festlegen.</span></p> <p style="margin-bottom: 0cm;" align="justify"><a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEg_m9Y681gV8biNBA6-_X9jU3XjgFI7vH7J92japb93IxOSS9cE-XV9UL2jVPZz95MidGPSMuzz9mM2lvkTCVRbSN3lQqA0L1m2ElIK4J2S4A5xu71wYjW1feboCRGWuyawBMmrF0Z34UQ/s1600-h/Befrager02.gif"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEg_m9Y681gV8biNBA6-_X9jU3XjgFI7vH7J92japb93IxOSS9cE-XV9UL2jVPZz95MidGPSMuzz9mM2lvkTCVRbSN3lQqA0L1m2ElIK4J2S4A5xu71wYjW1feboCRGWuyawBMmrF0Z34UQ/s320/Befrager02.gif" alt="" id="BLOGGER_PHOTO_ID_5168285178572641458" border="0" /></a></p> <p style="margin-bottom: 0cm;" align="justify"><span style="font-family:georgia;">Auf dieser HTML-Frageseite wurden mehrere 5-stufige Skalen eingesetzt, eine Frageform, die auch als "semantisches Differential" bekannt ist. Wer die recht kleinen Screenshots übrigens näher betrachten möchte, kann sie sich jederzeit mit einem einfachen Mausklick in vergrößerter Form anzeigen lassen.</span></p> <p style="margin-bottom: 0cm;" align="justify"><a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhd-WvF9E-UjIIvZDXYV7oJhcEU_YzcFWA3qc1D-uGpUR4f5nXQo_c1wCZzEtHkHpUwabujwQvh1OuVyfwUm6pNz7DePPrOCwTAPud1V1mxxk45OubabXjVIcT-njzGbEVV4JruYS1h2Z4/s1600-h/Befrager03.gif"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhd-WvF9E-UjIIvZDXYV7oJhcEU_YzcFWA3qc1D-uGpUR4f5nXQo_c1wCZzEtHkHpUwabujwQvh1OuVyfwUm6pNz7DePPrOCwTAPud1V1mxxk45OubabXjVIcT-njzGbEVV4JruYS1h2Z4/s320/Befrager03.gif" alt="" id="BLOGGER_PHOTO_ID_5168285277356889282" border="0" /></a></p> <p style="margin-bottom: 0cm;" align="justify"><span style="font-family:georgia;">Dieser Screenshot zeigt eine typische Matrixfrage. Wer sich bereits näher mit Online-Befragungen beschäftigt hat erkennt, dass die Matrix bereits recht umfangreich ausfällt, der empfohlene maximale Rahmen von 6 x 6 Feldern aber noch nicht überschritten wurde. Noch umfangreichere Frage-Matrizen wirken dagegen unübersichtlich und können unter Umständen dazu beitragen, dass Probanden die Beantwortung des Fragebogens vorzeitig abbrechen (man bezeichnet dies in der Online-Marktforschung auch als Drop-Out).</span></p> <p style="margin-bottom: 0cm;" align="justify"><a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiFMfP9nowNeuddhxh2zQkvPjYccEnoKaBl5KIUB1PJK9Ycz07golY015SHpASQr6S9OMwbKT-FLSfEiRFw2Z41U7UEFIMpDmjUryAFrBrmfv-bJCnYDi2pO3PAIgZ1eqbkMEnVoPG2nEQ/s1600-h/Befrager04.gif"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiFMfP9nowNeuddhxh2zQkvPjYccEnoKaBl5KIUB1PJK9Ycz07golY015SHpASQr6S9OMwbKT-FLSfEiRFw2Z41U7UEFIMpDmjUryAFrBrmfv-bJCnYDi2pO3PAIgZ1eqbkMEnVoPG2nEQ/s320/Befrager04.gif" alt="" id="BLOGGER_PHOTO_ID_5168285397615973586" border="0" /></a></p> <p style="margin-bottom: 0cm;" align="justify"><span style="font-family:georgia;">Der letzte Screenshot zeigt, dass man auch Grafiken in die Befragung einbinden kann. Oberhalb des Bildes erkennt man zudem ein Feld für die Eingabe eines freien Textes als Antwort auf eine offene Frage, die sich mit dem "Befrager" ebenfalls realisieren lässt.</span></p> <p style="margin-bottom: 0cm;" align="justify"><span style="font-family:georgia;">Das grafische Design des Fragebogens kann übrigens auf vielfältige Art und Weise verändert werden, so dass einer individuellen Fragebogengestaltung kaum Hindernisse im Wege stehen. Neben vielen Frageformen und einem guten grafischen Editor bietet der "Befrager" viele weitere Features, die sich im Rahmen eines einfachen Blogposts leider nicht demonstrieren lassen, wie beispielsweise eine Vollständigkeitsprüfung, eine sehr gute Filterführung oder die Möglichkeit, sich nach Abschluss der Feldzeit alle Ergebnisse in einer SPSS-Datei zusammengefasst herunterladen zu können.</span></p> <p style="margin-bottom: 0cm;" align="justify"><span style="font-family:georgia;">Alles in allem eine wirklich gute Software, die durchaus mit kommerziellen Paketen mithalten kann, und die sich gerade aufgrund der kostenfreien Nutzbarkeit vor allem für Studierende eignet, die ja eher selten über ein großes Softwarebudget verfügen. Wer also in nächster Zeit eine Online-Befragung plant, sollte vielleicht schon mal einen kurzen Abstecher auf <a href="http://www.befrager.de/">http://www.befrager.de</a> unternehmen und sich die Seite bookmarken.</span></p> <p style="margin-bottom: 0cm;" align="justify"><span style="font-family:georgia;">Eine Kurzübersicht der Ergebnisse meiner ÖPNV-Befragung von 2005 wurde übrigens im „<a href="http://www.suedharzstrecke.de/downloads/weissbuch_vermarktung_oepnv.pdf" target="_blank">Weissbuch zur Vermarktung von Bahn und Bus im Südharz</a>“ veröffentlicht – und aus der Diplomarbeit entstand im letzten Jahr mein zweites Buch, "Möglichkeiten und Grenzen von Online-Befragungen", das unter anderem bei <a href="http://www.amazon.de/M%C3%B6glichkeiten-Online-Befragungen-besonderer-Ber%C3%BCcksichtigung-Stichprobenqualit%C3%A4t/dp/3638827429/ref=sr_1_2/028-5525867-0162157?ie=UTF8&s=books&qid=1193321843&sr=8-2" target="_blank">Amazon</a> erhältlich ist.</span></p>Christian Reinbothhttp://www.blogger.com/profile/06772443468928704979noreply@blogger.com0tag:blogger.com,1999:blog-1399345967986819832.post-7810040279510324122008-02-04T02:09:00.000-08:002008-02-04T02:27:03.879-08:00NSDstat-Kurs: Interpretation eines Histogramms<div style="text-align: justify;"><span style="font-family:Georgia, serif;">Im vierten Teil des Blog-Tutorials zur Analysesoftware </span><a href="http://www.gesis.org/Software/NSDSTAT/index.htm"><span style="font-family:Georgia, serif;">NSDstat Pro</span></a><span style="font-family:Georgia, serif;"> soll nun nach dem </span><a href="http://marktforschung.wikia.com/wiki/Box-Plot" target="_blank"><span style="font-family:Georgia, serif;">Box-Plot</span></a><span style="font-family:Georgia, serif;"> auch noch auf die Interpretation des </span><a href="http://marktforschung.wikia.com/wiki/Histogramm" target="_blank"><span style="font-family:Georgia, serif;">Histogramms</span></a><span style="font-family:Georgia, serif;"> eingegangen werden, das ja von NSDstat stets gemeinsam mit dem Box-Plot ausgegeben wird. Als Beispieldatensatz dient wieder einmal die bekannte Jugendlichen-Befragung zum Thema Politik, als Beispielvariable erneut die Variable v8 – Politisches Interesse. Die ersten zwei Schritte – Auswahl der Variablen und Erstellung der univariaten Analyseübersicht – sind somit identisch mit den ersten beiden Schritten der letzten Tutorial-Kapitel.<br /><br />Wer die Erinnerung an die genaue Vorgehensweise noch einmal etwas auffrischen will, kann dies übrigens </span><a href="http://statistikberatung.blogspot.com/2007/12/nsdstat-kurs-erstellung-univariater.html" target="_blank"><span style="font-family:Georgia, serif;">hier</span></a><span style="font-family:Georgia, serif;"> tun. Wie immer lassen sich übrigens auch in diesem Tutorial-Posting die Grafiken mit einem Mausklick vergrößert darstellen.<br /></span></div> <p style="margin-bottom: 0cm;" align="justify"><a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEi0AVXLK4a1VSlEPexCuIj2WetMlvW7HcXvKcxQkNaqOlCL_NyLNsdwYldjwcPeQMmAu7W9ek32vDID2V4FH_1PLutfoXKdtoKHiSeLt4Z2t_hwjMj8Z-JougDw5VLwAMGTOaKFVhRgypQ/s1600-h/NSD04-01.gif"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEi0AVXLK4a1VSlEPexCuIj2WetMlvW7HcXvKcxQkNaqOlCL_NyLNsdwYldjwcPeQMmAu7W9ek32vDID2V4FH_1PLutfoXKdtoKHiSeLt4Z2t_hwjMj8Z-JougDw5VLwAMGTOaKFVhRgypQ/s320/NSD04-01.gif" alt="" id="BLOGGER_PHOTO_ID_5163065848962209602" border="0" /></a></p><p style="margin-bottom: 0cm;" align="justify"><span style="font-family:Georgia, serif;">Ein Klick auf das Grafik-Icon (das dritte Icon von oben) öffnet in der univariaten Statistik die grafische Übersicht, die bei NSDstat stets aus dem Histogramm mit der eingeblendeten <a href="http://marktforschung.wikia.com/wiki/Normalverteilung%29" target="_blank">Normalverteilungskurve</a> sowie dem darunterliegenden Box-Plot besteht, dessen Interpretation ja bereits im <a href="http://statistikberatung.blogspot.com/2008/01/nsdstat-kurs-interpretation-eines-box.html" target="_blank">letzten Teil</a> dieses Tutorials ausführlich beleuchtet wurde.</span></p> <p style="margin-bottom: 0cm;" align="justify"><a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgU2Wf-KQePwNMSPmESEq1unJ4fVUbhs1q83D2_6tigTv8y_Mhc7RBfBOsLmAasbgRWJGJ1daD0rtoFdLhyphenhyphen6bMZRRYcnWgF7WeU6rg43NXBbbF_f4vF6OUv820tyMpKPokVHLfkEthn48k/s1600-h/NSD04-02.gif"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgU2Wf-KQePwNMSPmESEq1unJ4fVUbhs1q83D2_6tigTv8y_Mhc7RBfBOsLmAasbgRWJGJ1daD0rtoFdLhyphenhyphen6bMZRRYcnWgF7WeU6rg43NXBbbF_f4vF6OUv820tyMpKPokVHLfkEthn48k/s320/NSD04-02.gif" alt="" id="BLOGGER_PHOTO_ID_5163065947746457426" border="0" /></a></p> <p style="margin-bottom: 0cm;" align="justify"><span style="font-family:Georgia, serif;">Ein solches Histogramm stellt die Häufigkeitsverteilung der Werte einer <a href="http://marktforschung.wikia.com/wiki/Intervallskala" target="_blank">intervallskalierten</a> Variablen dar (diese Voraussetzung sollte erfüllt sein – ist sie es nicht, lässt sich das Histogramm nicht sinnvoll interpretieren). Histogramme eignen sich primär für die Darstellung von stetigen Merkmalen mit einer größeren Anzahl an Ausprägungen. Bei der Konstruktion der Grafik wird von den nach der Größe geordneten Daten ausgegangen, die in eine bestimmte Anzahl von Klassen aufgeteilt werden. Über jeder dieser Klassen wird ein Rechteck konstruiert, dessen Flächeninhalt sich proportional zur absoluten bzw. relativen Häufigkeit der jeweiligen Klasse verhält.</span></p> <p style="margin-bottom: 0cm;" align="justify"><span style="font-family:Georgia, serif;">Diese Klassen müssen nicht zwangsweise die gleiche Breite besitzen – es ist aber durchaus von Vorteil wenn es so ist, da nur dann der grafische Vergleich mit der Normalverteilung möglich wird. Aus diesem Grund werden Histogramme in den meisten Statistikprogrammen per Default stets mit gleichbreiten Klassen erzeugt – so beispielsweise in <a href="http://www.spss.de/" target="_blank">SPSS</a>, wie die untenstehende Grafik verdeutlicht. Auch in NSDStat haben alle Histogramme automatisch gleichbreite Klassen, eine Voreinstellung, die auch durch den User nicht aufgehoben werden kann.</span></p> <p style="margin-bottom: 0cm;" align="justify"><a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEifWU0M_j1Ifv770vXZaoY9ApaQ5nTclTDZYImaN3ZS6Z_WbTXsRSfaTDfiQJhK2Bg1Xox10B1v5qTa1s-bEdsgHgF9WdRdrrQonC_Lj_7HI-BxeNFvDBd9xtrMptCO-Hw7707jkq73eLE/s1600-h/NSD04-03.gif"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEifWU0M_j1Ifv770vXZaoY9ApaQ5nTclTDZYImaN3ZS6Z_WbTXsRSfaTDfiQJhK2Bg1Xox10B1v5qTa1s-bEdsgHgF9WdRdrrQonC_Lj_7HI-BxeNFvDBd9xtrMptCO-Hw7707jkq73eLE/s320/NSD04-03.gif" alt="" id="BLOGGER_PHOTO_ID_5163066059415607138" border="0" /></a></p> <p style="margin-bottom: 0cm;" align="justify"><span style="font-family:Georgia, serif;">Aber welcher Vorteil ergibt sich durch das Einblenden der besagten Kurve? Nun, viele statistische Verfahren in der Marktforschung setzen voraus, dass bestimmte Variablen in der <a href="http://marktforschung.wikia.com/wiki/Grundgesamtheit" target="_blank">Grundgesamtheit</a> normalverteilt sind (so beispielsweise die <a href="http://marktforschung.wikia.com/wiki/Varianzanalyse" target="_blank">Varianzanalyse</a>). Der Marktforscher muss daher häufig prüfen, ob vom Vorliegen einer solchen Verteilung ausgegangen werden kann, wobei eine näherungsweise Übereinstimmung häufig für die Fortsetzung der Analyse ausreichend ist – eine perfekte Übereinstimmung ist bei Daten aus einer Stichprobe ja ohnehin nicht zu erwarten.</span></p> <p style="margin-bottom: 0cm;" align="justify"><span style="font-family:Georgia, serif;">Diese Prüfung auf Normalverteilung kann unter anderem anhand eines Histogramms mit eingeblendeter Normalverteilungskurve erfolgen, wobei aus mathematischer Sicht bessere Optionen existieren (mehr dazu weiter unten). Da die Balken des Histogramms die komplette Breite der Wertebereiche widerspiegeln und zudem für leere Wertebereiche ein Freiraum ausgegeben wird, kommt im Histogramm die gesamte empirische Verteilung der Variablen zum Ausdruck. Dies ermöglicht den direkten Vergleich mit einer eingezeichneten theoretischen Verteilung wie beispielsweise der Normalverteilung. </span> </p> <p style="margin-bottom: 0cm;" align="justify"><span style="font-family:Georgia, serif;">Je schwächer der Balkenverlauf dem Verlauf der eingeblendeten Normalverteilungskurve folgt, desto eher ist davon auszugehen, dass keine Normalverteilung vorliegt. Nachfolgend dazu noch ein Beispiel mit einer anderen Variablen – v9, in der das Vertrauen, welches die Jugendlichen ganz allgemein in Politiker setzen, auf der bereits von v8 bekannten Skala erfasst wurde.</span></p> <p style="margin-bottom: 0cm;" align="justify"><a onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjhSlaDBM4XaK7sHg3aFyIXA8lRdzdAxZS3F3xw0tgP2i8lT6QbgCVBxNI3UFZgwBavFpVLx6jsiNqNR9Ul0Ro8EUKT9uiBGI-jlBFZX5aYnX3DykCQTb2UQ-JIvOPZ7hVMPcxRTKI8NOo/s1600-h/NSD04-04.gif"><img style="margin: 0px auto 10px; display: block; text-align: center; cursor: pointer;" src="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjhSlaDBM4XaK7sHg3aFyIXA8lRdzdAxZS3F3xw0tgP2i8lT6QbgCVBxNI3UFZgwBavFpVLx6jsiNqNR9Ul0Ro8EUKT9uiBGI-jlBFZX5aYnX3DykCQTb2UQ-JIvOPZ7hVMPcxRTKI8NOo/s320/NSD04-04.gif" alt="" id="BLOGGER_PHOTO_ID_5163066179674691442" border="0" /></a></p> <p style="margin-bottom: 0cm;" align="justify"><span style="font-family:Georgia, serif;">Auch hier ist – analog zur bisherigen Beispielvariable v8 – zu erkennen, dass die eingeblendete Normalverteilungskurve mit dem Balkenverlauf sehr gut zusammenpasst. </span> </p> <p style="margin-bottom: 0cm;" align="justify"><span style="font-family:Georgia, serif;">Bei der Interpretation solcher Ergebnisse ist aber stets zu beachten, dass es sich lediglich um eine Prüfung und keinen statistischen Test handelt. Dies bedeutet, dass in die Grafik ausschließlich die vorliegenden Werte aus der Stichprobe einfließen, die ja nicht zwangsweise die Verteilungsverhältnisse in der Grundgesamtheit optimal abbilden, sondern aufgrund von Zufallseffekten auch stark abweichende Verhältnisse aufweisen können. Einen Test auf Vorliegen einer Normalverteilung kann nur anhand eines „echten“ statistischen Tests wie des <a href="http://marktforschung.wikia.com/wiki/Kolmogorov-Smirnov-Anpassungstest" target="_blank">Kolmogorov-Smirnov-Anpassungstests</a> erfolgen, nicht aber anhand einer grafischen Prüfung – es sei denn, es liegen die Daten einer Vollerhebung vor. </span> </p> <p style="margin-bottom: 0cm;" align="justify"><span style="font-family:Georgia, serif;">Handelt es sich jedoch um Daten aus einer Stichprobe, was in der Praxis ja meist der Fall sein wird, so stellen die grafischen Prüfungen lediglich einen Indikator dafür da, inwiefern ein Test überhaupt sinnvoll erscheint – allerdings einen guten, weshalb man sie vor der Durchführung eines aufwändigen Testverfahrens unbedingt einmal ansehen sollte.</span></p> <p style="margin-bottom: 0cm;" align="justify"><span style="font-family:Georgia, serif;">In den nächsten Teilen dieses Tutorials lösen wir uns von der univariaten Datenanalyse und wenden uns den bivariaten Statistiken zu, wobei es im nächsten Tutorial erst einmal um die Erstellung von einfachen Kreuztabellen sowie die Durchführung von Chi²-Tests gehen wird.</span></p>Christian Reinbothhttp://www.blogger.com/profile/06772443468928704979noreply@blogger.com0