Allgemeine Bevölkerung und Stichprobenverfahren. Grundlagen der Stichprobenziehung und Bildung einer einfachen Zufallsstichprobe Die Ergebnisse der Stichprobenziehung werden dargestellt

Lernziele

  1. Es ist klar, zwischen den Konzepten der Volkszählung (Qualifikation) und der Stichprobenziehung zu unterscheiden.
  2. Kennen Sie das Wesen und die Abfolge der sechs Schritte, die von Forschern durchgeführt werden, um eine Stichprobenpopulation zu erhalten.
  3. Definieren Sie den Begriff „Stichprobengrundlage“.
  4. Erklären Sie den Unterschied zwischen probabilistischem und deterministischem Sampling.
  5. Unterscheiden Sie zwischen Stichproben mit fester Größe und mehrstufigen (konsekutiven) Stichproben.
  6. Erklären Sie, was absichtliches Sampling ist, und beschreiben Sie seine Stärken und Schwächen.
  7. Definieren Sie das Konzept der Quotenstichprobe.
  8. Erklären Sie, was ein Parameter in einem Auswahlverfahren ist.
  9. Erklären Sie, was eine abgeleitete Menge ist.
  10. Erklären Sie, warum das Konzept der Stichprobenverteilung das wichtigste Konzept der Statistik ist.

Der Forscher hat also das Problem genau definiert und sich die geeigneten Forschungsdesign- und Datenerfassungswerkzeuge zu seiner Lösung gesichert. Der nächste Schritt im Forschungsprozess sollte die Auswahl der zu untersuchenden Elemente sein. Es ist möglich, jedes Element einer gegebenen Population zu untersuchen, indem man eine vollständige Zählung dieser Population durchführt. Eine vollständige Erhebung der Bevölkerung wird als Volkszählung (Qualifikation) bezeichnet. Es gibt noch eine andere Möglichkeit. Ein bestimmter Teil der Bevölkerung, eine Stichprobe von Elementen einer großen Gruppe, wird einer statistischen Untersuchung unterzogen, und anhand der für diese Teilmenge erhaltenen Daten werden bestimmte Schlussfolgerungen in Bezug auf die gesamte Gruppe gezogen. Die Fähigkeit, die aus Probendaten erhaltenen Ergebnisse auf eine große Gruppe zu verallgemeinern, hängt von der Methode ab, mit der die Probe entnommen wurde. Ein Großteil dieses Kapitels wird sich damit befassen, wie die Stichprobe gezogen werden sollte und warum.

Volkszählung (Qualifikation)
Vollständige Volkszählung (Bevölkerung).
Probe
Eine Sammlung von Elementen einer Teilmenge einer größeren Gruppe von Objekten.

Der Begriff „Bevölkerung“ oder „Sammlung“ kann sich nicht nur auf Personen beziehen, sondern auch auf Unternehmen des verarbeitenden Gewerbes, Einzel- oder Großhändler oder sogar auf völlig unbelebte Gegenstände, wie z. B. vom Unternehmen hergestellte Teile; Dieses Konzept ist definiert als die Gesamtheit der Elemente, die bestimmte gegebene Bedingungen erfüllen. Diese Bedingungen definieren eindeutig sowohl die Elemente, die zur Zielgruppe gehören, als auch die Elemente, die von der Berücksichtigung ausgeschlossen werden sollten.

Eine Studie, die darauf abzielt, das demografische Profil von Tiefkühlpizza-Konsumenten zu bestimmen, sollte damit beginnen, zu ermitteln, wer als solcher eingestuft werden sollte und wer nicht. Gehören Menschen, die eine solche Pizza mindestens einmal probiert haben, zu dieser Kategorie? Einzelpersonen, die mindestens eine Pizza pro Monat kaufen? In der Woche? Personen, die in einem Monat mehr als eine bestimmte Mindestmenge Pizza essen? Der Forscher muss bei der Bestimmung der Zielgruppe sehr genau sein. Es muss auch darauf geachtet werden, dass die Stichprobe aus der Zielpopulation gezogen wird und nicht aus „irgendeiner“ Population, was bei unzureichender oder unvollständiger Stichprobengrundlage der Fall ist. Letzteres ist eine Liste von Elementen, aus denen eine reale Probe gebildet wird.

Ein Forscher kann aus mehreren Gründen einen Stichprobenansatz einer Befragung der gesamten Bevölkerung vorziehen. Erstens erfordert eine vollständige Untersuchung einer Population, sogar einer relativ kleinen Größe, einen sehr hohen Material- und Zeitaufwand. Wenn die Volkszählung abgeschlossen ist und die Daten verarbeitet sind, sind die Informationen häufig bereits veraltet. In manchen Fällen ist die Qualifizierung einfach unmöglich. Nehmen wir an, die Forscher wollten überprüfen, ob die tatsächliche Lebensdauer von elektrischen Glühlampen mit der berechneten übereinstimmt, für die sie sie bis zum Ausfall eingeschaltet halten müssen. Wenn Sie auf diese Weise das gesamte Lampenangebot untersuchen, erhalten Sie zuverlässige Daten, aber es gibt nichts zu handeln.

Schließlich kann der Forscher zum großen Erstaunen von Anfängern die Stichprobenziehung der Volkszählung vorziehen und sich um die Genauigkeit der Ergebnisse bemühen. Volkszählungen erfordern viel Personal, was die Wahrscheinlichkeit von Verzerrungsfehlern (Nicht-Stichproben) erhöht. Dieser Umstand ist einer der Gründe, warum das US Census Bureau Stichprobenerhebungen einsetzt, um die Genauigkeit verschiedener Arten von Volkszählungen zu testen. Sie haben richtig gelesen: Um die Genauigkeit der Qualifikationsdaten zu überprüfen, können Stichprobenerhebungen durchgeführt werden.

Beispielentwurfsschritte

Auf Abb. Abbildung 15.1 zeigt eine sechsstufige Abfolge, der ein Forscher beim Entwerfen einer Stichprobe folgen kann. Zunächst ist es notwendig, die Zielpopulation oder die Menge der Elemente zu bestimmen, über die der Forscher etwas wissen möchte.

Beispielsweise müssen Forscher bei der Untersuchung der Vorlieben von Kindern entscheiden, ob die Zielpopulation nur aus Kindern, nur aus Eltern oder beidem bestehen soll.

Aggregat (Bevölkerung)
Eine Menge von Elementen, die bestimmte festgelegte Bedingungen erfüllen.
Probenahmerahmen (Basis)
Die Liste der Elemente, aus denen die Auswahl getroffen wird; kann aus Gebietseinheiten, Organisationen, Personen und anderen Elementen bestehen.

Eine bestimmte Firma testete ihre elektrischen "Rennen" nur an Kindern. Die Kinder waren restlos begeistert. Die Eltern reagierten unterschiedlich auf die Neuheit. Den Müttern gefiel die Tatsache nicht, dass die Fahrt den Kindern nicht beibrachte, autofreundlich zu sein, und den Vätern gefiel die Tatsache nicht, dass das Produkt wie ein Spielzeug hergestellt wurde.
Auch die umgekehrte Situation ist möglich. Eine Firma brachte ein neues Lebensmittelprodukt auf den Markt und startete eine landesweite Werbekampagne, die sich auf frühreife Kinder konzentrierte.Die Firma testete die Wirksamkeit von Werbespots nur an Müttern, die begeistert waren. Die Kinder hingegen fanden diese „Beschleunigung“ und damit das beworbene Produkt selbst ekelhaft. Produkt endete am 1.

Der Forscher muss entscheiden, aus wem oder was die relevante Grundgesamtheit bestehen soll: Einzelpersonen, Familien, Firmen, andere Organisationen, Kreditkartentransaktionen usw. Bei solchen Entscheidungen müssen die Elemente bestimmt werden, die aus Grundgesamtheiten ausgeschlossen werden sollen. Es sollte sowohl ein zeitlicher als auch ein räumlicher Bezug der Elemente hergestellt werden, was in einigen Fällen zusätzlichen Bedingungen oder Einschränkungen unterliegen kann. Wenn wir beispielsweise von Einzelpersonen sprechen, kann die gewünschte Population nur aus Personen über 18 Jahren oder nur aus Frauen oder nur aus Personen mit mindestens einem Sekundarschulabschluss bestehen.

Die Aufgabe, die geografischen Grenzen für die Zielpopulation in der internationalen Marktforschung zu bestimmen, kann ein besonderes Problem darstellen, da dies die Heterogenität des betrachteten Systems erhöht. Beispielsweise kann das relative Verhältnis von städtischen und ländlichen Gebieten von Land zu Land erheblich variieren. Der territoriale Aspekt hat schwerwiegende Auswirkungen auf die Zusammensetzung der Bevölkerung und innerhalb desselben Landes. Beispielsweise lebt im Norden Chiles eine überwiegend indianische Bevölkerung kompakt, während in den südlichen Regionen des Landes hauptsächlich Nachkommen von Europäern leben.

Abdeckung (Vorfall)
Der Prozentsatz der Mitglieder einer Population oder Gruppe, die die Bedingungen für die Aufnahme in die Stichprobe erfüllen.

Generell gilt: Je einfacher die Zielpopulation definiert ist, desto höher ist ihre Abdeckung (Inzidenz) und desto einfacher und billiger ist das Stichprobenverfahren. Abdeckung (Vorfall) entspricht dem prozentualen Anteil der Elemente einer Grundgesamtheit oder Gruppe, die die Bedingungen für die Aufnahme in die Stichprobe erfüllen. Die Abdeckung wirkt sich direkt auf den Zeit- und Materialaufwand aus, der für die Durchführung einer Umfrage erforderlich ist. Wenn die Abdeckung groß ist (d. h. die meisten Populationselemente erfüllen eines oder mehrere der einfachen Kriterien, die zum Identifizieren potenzieller Befragter verwendet werden), werden die Zeit- und Materialkosten, die zum Sammeln von Daten erforderlich sind, minimiert. Umgekehrt steigen mit zunehmender Anzahl an Kriterien, die potenzielle Befragte erfüllen müssen, sowohl die Sach- als auch die Zeitkosten.

Auf Abb. 15.2 zeigt den Anteil der erwachsenen Bevölkerung, der bestimmte Sportarten betreibt. Die Daten in der Abbildung zeigen, dass es viel schwieriger und teurer ist, Personen zu untersuchen, die Motorrad fahren (nur 3,6 % der Gesamtzahl der Erwachsenen), als Personen zu untersuchen, die regelmäßig Freizeitspaziergänge unternehmen (27,4 % der Gesamtzahl der Erwachsenen). Erwachsene). Die Hauptsache ist, dass der Forscher genau bestimmt, welche Elemente in die Studienpopulation aufgenommen und welche Elemente davon ausgeschlossen werden sollen. Eine klare Aussage über den Zweck der Studie erleichtert die Lösung dieses Problems erheblich. Der zweite Schritt im Stichprobenverfahren besteht darin, den Stichprobenrahmen festzulegen, der, wie Sie bereits wissen, die Liste der Elemente ist, aus denen die Stichprobe gezogen wird. Lassen Sie die Zielpopulation einer bestimmten Studie alle Familien sein, die in der Gegend von Dallas leben. Auf den ersten Blick mag das Dallas-Telefonbuch ein guter und leicht zugänglicher Stichprobenrahmen sein. Bei näherer Betrachtung wird jedoch deutlich, dass die im Verzeichnis enthaltene Familienliste nicht ganz korrekt ist, da die Nummern einiger Familien darin weggelassen werden (natürlich nicht Familien, die kein Telefon haben), während Manche Familien haben mehrere Telefonnummern. Personen, die kürzlich ihren Wohnort und dementsprechend ihre Telefonnummer geändert haben, sind ebenfalls nicht im Verzeichnis enthalten.

Erfahrene Forscher kommen zu dem Schluss, dass eine genaue Übereinstimmung zwischen dem Stichprobenrahmen und der interessierenden Zielpopulation sehr selten ist. Einer der kreativsten Schritte beim Stichprobendesign ist die Bestimmung eines geeigneten Stichprobenrahmens in Fällen, in denen es schwierig ist, Populationsmitglieder aufzulisten. Dies kann ein Abtasten von Arbeitsblöcken und Präfixen erfordern, wenn beispielsweise aufgrund von Mängeln in Telefonverzeichnissen eine Zufallswahl verwendet wird. Allerdings hat die deutliche Zunahme der Arbeitseinheiten in den letzten 10 Jahren diese Aufgabe erschwert. Ähnliche Situationen können auch bei der selektiven Beobachtung von Territorialzonen oder Organisationen mit anschließender Unterabtastung auftreten, wenn beispielsweise Einzelpersonen die Zielpopulation sind, aber keine genaue aktuelle Liste von ihnen vorliegt.

Quelle: Basierend auf Daten in SSI- LITe TM: L ow Vorfall T gezielt S Amplifikation" (Fairfield, Conn.: Survey Sampling, Inc., 1994).

Der dritte Schritt des Stichprobenverfahrens steht in engem Zusammenhang mit der Festlegung des Stichprobenrahmens. Die Wahl der Stichprobenmethode oder des Stichprobenverfahrens hängt weitgehend von dem vom Forscher gewählten Stichprobenrahmen ab. Unterschiedliche Arten von Proben erfordern unterschiedliche Arten von Probenahmerahmen. Dieses und das nächste Kapitel geben einen Überblick über die wichtigsten Arten von Stichproben, die in der Marktforschung verwendet werden. Bei ihrer Beschreibung sollte der Zusammenhang zwischen dem Stichprobenrahmen und der Methode seiner Bildung deutlich werden.

Der vierte Schritt des Stichprobenverfahrens besteht in der Bestimmung des Stichprobenumfangs. Dieses Problem wird in Kap. 17. In der fünften Phase muss der Forscher die Elemente auswählen, die der Umfrage unterzogen werden. Die dabei verwendete Methode wird durch die gewählte Probenart bestimmt; Bei der Erörterung von Stichprobenverfahren werden wir auch über die Auswahl ihrer Elemente sprechen. Und schließlich muss der Forscher die identifizierten Befragten tatsächlich untersuchen. In diesem Stadium besteht eine hohe Wahrscheinlichkeit, dass eine Reihe von Fehlern begangen werden.
Diese Probleme und einige Methoden zu ihrer Lösung werden in Kap. achtzehn.

Arten von Probenahmeplänen (Probenahme)

Alle Stichprobenverfahren können in zwei Kategorien unterteilt werden: Beobachtung von Wahrscheinlichkeitsstichproben und Beobachtung von deterministischen Stichproben. In einer probabilistischen Stichprobe kann jedes Mitglied der Grundgesamtheit mit einer bestimmten festgelegten Wahrscheinlichkeit ungleich Null enthalten sein. Die Wahrscheinlichkeit, bestimmte Mitglieder der Grundgesamtheit in die Stichprobe aufzunehmen, kann unterschiedlich sein, aber die Wahrscheinlichkeit, dass jedes Element darin enthalten ist, ist bekannt. Diese Wahrscheinlichkeit wird durch ein spezielles mechanisches Verfahren ermittelt, das zur Auswahl der Stichproben verwendet wird.

Bei deterministischen Stichproben wird es unmöglich, die Wahrscheinlichkeit abzuschätzen, dass irgendein Element in der Stichprobe enthalten ist. Die Repräsentativität einer solchen Stichprobe kann nicht garantiert werden. Zum Beispiel, Allstate Corporation entwickelte ein System zur Verarbeitung von Schadensdaten Versicherungsentschädigung 14 Millionen Haushalte (ihre Kunden). Das Unternehmen plant, diese Daten zu verwenden, um Nachfragemuster für seine Dienstleistungen zu bestimmen, wie z. B. die Wahrscheinlichkeit, dass ein Haushalt, der einen Mercedes Benz besitzt, auch ein Ferienhaus besitzt (das eine Versicherung erfordert). Obwohl die Datenbank sehr umfangreich ist, verfügt das Unternehmen nicht über die Mittel, um die Wahrscheinlichkeit abzuschätzen, dass ein bestimmter Kunde einen Anspruch geltend machen wird. Das Unternehmen kann daher nicht sicher sein, dass die Kundendaten, die den Anspruch erheben, repräsentativ für alle Kunden des Unternehmens sind; und in noch geringerem Maße - in Bezug auf potenzielle Kunden.

Alle deterministischen Stichproben basieren auf der persönlichen Position, dem Urteil oder der Präferenz des Forschers und nicht auf einem mechanischen Auswahlverfahren für Stichprobenmitglieder. Solche Präferenzen können manchmal geben gute Noten Merkmale der Grundgesamtheit, es gibt jedoch keine Möglichkeit, die Übereinstimmung der Stichprobe mit der Aufgabe objektiv zu bestimmen. Eine Bewertung der Genauigkeit der Ergebnisse der Stichprobe kann nur erfolgen, wenn die Wahrscheinlichkeiten für die Auswahl bestimmter Elemente bekannt waren. Aus diesem Grund wird das Arbeiten mit Wahrscheinlichkeitsstichproben im Allgemeinen als eine bessere Methode zum Schätzen der Größe des Stichprobenfehlers angesehen. Samples können auch in Samples mit fester Größe und sequenzielle Samples unterteilt werden. Beim Arbeiten mit Feststichproben wird der Stichprobenumfang vor Beginn der Erhebung festgelegt und der Analyse der Ergebnisse geht die Erhebung aller notwendigen Daten voraus. Wir interessieren uns hauptsächlich für Stichproben mit fester Größe, da diese Art normalerweise in der Marktforschung verwendet wird.

Wahrscheinlichkeitsstichprobe
Eine Stichprobe, in der jedes Element der Grundgesamtheit mit einer bekannten Wahrscheinlichkeit ungleich Null enthalten sein kann.
Deterministisches Sampling
Stichproben basierend auf bestimmten Präferenzen oder Urteilen, die die Auswahl bestimmter Elemente bestimmen; Gleichzeitig wird es unmöglich, die Wahrscheinlichkeit abzuschätzen, dass ein beliebiges Element der Grundgesamtheit in die Stichprobe aufgenommen wird.

Es sollte jedoch nicht vergessen werden, dass es auch sequentielle Stichproben gibt, die mit jedem der unten besprochenen grundlegenden Stichprobenentwürfe verwendet werden können.

Bei einer sequentiellen Stichprobe ist die Anzahl der ausgewählten Elemente nicht im Voraus bekannt, sie wird auf der Grundlage einer Reihe sequentieller Entscheidungen bestimmt. Wenn eine Befragung einer kleinen Stichprobe zu keinem verlässlichen Ergebnis führt, wird die Bandbreite der zu untersuchenden Elemente erweitert. Bleibt das Ergebnis danach unschlüssig, wird der Stichprobenumfang wieder erhöht. In jeder Phase wird entschieden, ob das erzielte Ergebnis als ausreichend überzeugend angesehen wird oder ob mit der Datenerhebung fortgefahren wird. Das Arbeiten mit sequentieller Stichprobennahme ermöglicht es, den Trend (Veränderungstrend) der Daten bereits während der Erhebung zu beurteilen, was die Kosten für zusätzliche Beobachtungen in Fällen reduziert, in denen sich ihre Zweckmäßigkeit als nichtig erweist.

Sowohl probabilistische als auch deterministische Stichprobenpläne fallen in eine Reihe von Typen. Beispielsweise können deterministische Stichproben nicht-repräsentativ (bequem), absichtlich oder quotiert sein; probabilistische Stichproben werden in einfache zufällige, stratifizierte oder Gruppenstichproben (Cluster) unterteilt, die wiederum in Subtypen unterteilt werden können. Auf Abb. Abbildung 15.3 zeigt die Arten von Stichproben, die in diesem und im nächsten Kapitel behandelt werden.

Festes Muster (Festes Muster)
Eine Stichprobe, deren Größe a priori bestimmt wird; die erforderlichen Informationen werden durch die ausgewählten Elemente bestimmt.
Sequentielle Probenahme
Eine Stichprobe, die auf der Grundlage einer Reihe aufeinanderfolgender Entscheidungen gebildet wird. Wenn nach Betrachtung einer kleinen Stichprobe das Ergebnis nicht schlüssig ist, wird eine größere Stichprobe berücksichtigt; führt dieser Schritt zu keinem Ergebnis, erhöht sich der Stichprobenumfang wieder usw. Somit wird in jedem Schritt entschieden, ob das erzielte Ergebnis als ausreichend überzeugend angesehen werden kann.

Es sollte daran erinnert werden, dass die Grundtypen von Proben kombiniert werden können, um komplexere Probenahmepläne zu erstellen. Wenn Sie ihre grundlegenden Anfangstypen lernen, wird es Ihnen leichter fallen, mit komplexeren Kombinationen umzugehen.

Deterministische Auswahl

Wie bereits erwähnt, spielen bei der Auswahl von Elementen einer deterministischen Stichprobe private Einschätzungen oder Entscheidungen eine entscheidende Rolle. Manchmal kommen diese Einschätzungen vom Forscher, während in anderen Fällen Außendienstmitarbeiter die Auswahl der Populationselemente übernehmen. Da die Elemente nicht mechanisch ausgewählt werden, wird es unmöglich, die Wahrscheinlichkeit des Einschließens eines beliebigen Elements in die Probe und dementsprechend den Stichprobenfehler zu bestimmen. Die Unkenntnis des Fehlers aufgrund des gewählten Stichprobenverfahrens hindert die Forscher daran, die Genauigkeit ihrer Schätzungen zu beurteilen.

Nicht repräsentative (Convenience) Proben

Nicht repräsentative (Convenience) Proben manchmal als zufällig bezeichnet, da die Auswahl der Stichprobenelemente auf „zufällige“ Weise erfolgt – diejenigen Elemente, die während des Auswahlzeitraums am zugänglichsten sind oder zu sein scheinen, werden ausgewählt.

Unser tägliches Leben ist voll von Beispielen für solche Selektionen. Wir sprechen mit Freunden und ziehen aus ihren Reaktionen und Positionen Rückschlüsse auf die in der Gesellschaft vorherrschenden politischen Vorlieben; ein lokaler Radiosender ermutigt Menschen, ihre Meinung zu einem kontroversen Thema zu äußern, ihre Meinung wird als vorherrschend interpretiert; Wir fordern die Zusammenarbeit von Freiwilligen und arbeiten mit denen zusammen, die uns freiwillig helfen. Das Problem mit Convenience Samples liegt auf der Hand – wir können nicht sicher sein, dass Samples dieser Art tatsächlich die Zielpopulation repräsentieren. Das die Meinung unserer Freunde richtig widerspiegelt Politische Sichten in der Gesellschaft vorherrscht, können wir immer noch bezweifeln, aber wir wollen oft glauben, dass größere Stichproben, ähnlich ausgewählt, repräsentativ sind. Lassen Sie uns den Irrtum einer solchen Annahme an einem Beispiel zeigen.
Vor einigen Jahren führte einer der lokalen Fernsehsender in der Stadt, in der der Autor dieses Buches lebt, eine tägliche öffentliche Meinungsumfrage zu Themen durch, die für die lokale Gemeinschaft von Interesse sind. Die Umfragen mit dem Titel „The Madison Pulse“ wurden wie folgt durchgeführt. Jeden Abend während der Sechs-Uhr-Nachrichten stellte der Sender den Zuschauern eine Frage zu einem bestimmten kontroversen Thema, auf die es eine positive oder negative Antwort geben musste.

Bei einer positiven Antwort musste man anrufen, bei einer negativen Antwort eine andere Telefonnummer. Die Anzahl der Stimmen „dafür“ und „dagegen“ wurde automatisch gezählt. Die Zehn-Uhr-Nachrichtensendung berichtete über die Ergebnisse der Telefonumfrage. Jeden Abend riefen zwischen 500 und 1000 Menschen im Studio an, um ihre Position zu diesem oder jenem Thema zu äußern; der Fernsehkommentator interpretierte die Ergebnisse der Umfrage als vorherrschende Meinung in der Gesellschaft.

Nicht repräsentative (Convenience-)Stichprobe
Manchmal als zufällig bezeichnet, weil die Auswahl der Stichprobenelemente auf „zufällige“ Weise erfolgt – diejenigen Elemente, die während des Auswahlzeitraums am zugänglichsten sind oder zu sein scheinen, werden ausgewählt.

In einer der sechsstündigen Folgen wurde den Zuschauern folgende Frage gestellt: „Finden Sie nicht, dass das Alkoholalter in Madison auf 18 gesenkt werden sollte?“ Die bestehende gesetzliche Qualifikation entsprach 21 Jahren. Das Publikum reagierte auf diese Frage mit außerordentlicher Aktivität – fast 4.000 Menschen riefen an diesem Abend im Studio an, davon sprachen sich 78 % für eine Herabsetzung der Altersgrenze aus. Es scheint klar, dass eine Stichprobe von 4.000 für eine Gemeinschaft von 180.000 „repräsentativ“ sein sollte. Wie Sie vielleicht erraten haben, waren bestimmte Altersgruppen mehr an einem bekannten Ergebnis interessiert als andere. Dementsprechend war es nicht verwunderlich, dass sich in einer Diskussion zu diesem Thema einige Wochen später herausstellte, dass die Studierenden während der für die Befragung vorgesehenen Zeit an einem Strang gezogen hatten. Sie riefen nacheinander den Fernseher an, jeder mehrmals. So war weder die Stichprobengröße noch der Anteil der Befürworter einer Gesetzesliberalisierung überraschend. Die Stichprobe war nicht repräsentativ.

Eine einfache Erhöhung der Stichprobengröße macht sie nicht repräsentativ. Die Repräsentativität der Stichprobe wird nicht durch die Größe, sondern durch das richtige Verfahren zur Auswahl der Elemente gewährleistet. Bei der freiwilligen Auswahl der Befragungsteilnehmer oder der Auswahl von Stichproben aufgrund ihrer Verfügbarkeit garantiert der Stichprobenplan keine Repräsentativität der Stichprobe. Empirische Beweise deuten darauf hin, dass Stichproben, die der Einfachheit halber ausgewählt wurden, selten repräsentativ sind (unabhängig von ihrer Größe). Telefonumfragen, die 800-900 Stimmen berücksichtigen, sind die häufigste Form großer, aber nicht repräsentativer Stichproben.

Absichtliche Probenahme
Deterministische (gezielte) Probenahme, deren Elemente manuell ausgewählt werden; Es werden diejenigen Elemente ausgewählt, die nach Meinung des Forschers den Zielen der Umfrage entsprechen.
Absichtliche Auswahl, abhängig von der Fähigkeit des Forschers, die anfängliche Gruppe von Befragten mit den gewünschten Merkmalen festzulegen; dann werden diese Befragten als Informanten verwendet, die die weitere Auswahl von Personen bestimmen.

Leider behandeln viele Menschen die Ergebnisse solcher Umfragen mit Zuversicht. Eines der charakteristischsten Beispiele für die Verwendung nicht-repräsentativer Stichproben in der internationalen Marktforschung ist die Erhebung bestimmter Länder auf der Grundlage einer Stichprobe, die aus in Deutschland lebenden Ausländern besteht dieser Moment im Hoheitsgebiet des Landes, das die Befragung initiiert hat (z. B. in den USA lebende Skandinavier). Obwohl solche Stichproben einiges Licht auf bestimmte Aspekte der betrachteten Bevölkerung werfen können, muss daran erinnert werden, dass diese Personen normalerweise eine „amerikanisierte“ Elite darstellen, deren Verbindung mit ihrem eigenen Land eher willkürlich sein kann. Die Verwendung nicht repräsentativer Stichproben wird für deskriptive oder kausale Erhebungen nicht empfohlen. Sie sind nur bei explorativer Forschung zulässig, die darauf abzielt, bestimmte Ideen oder Ideen zu testen, aber auch in diesem Fall ist es vorzuziehen, bewusst Stichproben zu verwenden.

Absichtliche Auswahl

Absichtliche Proben werden manchmal als bezeichnet unkonzentriert; ihre Elemente, die nach Meinung des Forschers den Zielen der Studie entsprechen, werden manuell ausgewählt. Procter & Gamble nutzte diese Methode, um Anzeigen für Personen im Alter von 13 bis 17 Jahren zu schalten, die in der Nähe seines Hauptsitzes in Cincinnati leben. Die Teilung des Unternehmens Lebensmittel und Getränke stellte diese Gruppe von Teenagern ein, um als eine Art Verbraucherstichprobe zu fungieren. Sie arbeiteten 10 Stunden pro Woche für 1.000 Dollar und gingen zu einem Konzert, sie sahen sich Fernsehwerbung an, besuchten mit Firmenmanagern Supermärkte, um sich Produktpräsentationen anzusehen, testeten neue Produkte und diskutierten über das Kaufverhalten. Durch die Auswahl von Vertretern für die Stichprobe durch einen „Einstellungsprozess“ und nicht zufällig, könnte sich ein Unternehmen auf Eigenschaften konzentrieren, die es als nützlich erachtet, wie z. B. die Fähigkeit eines Teenagers, sich klar auszudrücken, auf die Gefahr hin, dass ihre Ansichten möglicherweise nicht repräsentativ für ihr Alter sind Gruppe.

Wie bereits erwähnt, ist das Unterscheidungsmerkmal des bewussten Samplings die richtungsweisende Auswahl seiner Elemente. In einigen Fällen werden Stichproben ausgewählt, nicht weil sie repräsentativ sind, sondern weil sie den Forschern Informationen liefern können, die für sie von Interesse sind. Wenn sich das Gericht an der Aussage eines Sachverständigen orientiert, greift es gewissermaßen auf eine bewusste Auswahl zurück. Eine ähnliche Position kann in der Entwicklung vorherrschen Forschungsprojekte. Bei der anfänglichen Untersuchung des Problems interessiert sich der Forscher in erster Linie für die Bestimmung der Untersuchungsaussichten, die die Auswahl der Stichprobenelemente bestimmen.

Schneeball-Probenahme ist eine Art der absichtlichen Probenahme, die beim Umgang mit bestimmten Arten von Populationen verwendet wird. Diese Stichprobe hängt von der Fähigkeit des Forschers ab, eine anfängliche Gruppe von Befragten mit den gewünschten Merkmalen anzugeben. Diese Befragten werden dann als Informanten verwendet, um die weitere Auswahl von Personen zu bestimmen.

Stellen Sie sich zum Beispiel vor, dass ein Unternehmen den Bedarf an einem Produkt evaluieren möchte, mit dem gehörlose Menschen am Telefon kommunizieren können. Forscher können mit der Entwicklung dieses Problems beginnen, indem sie Schlüsselfiguren in der Gehörlosengemeinschaft identifizieren; Letzterer könnte andere Mitglieder der Gruppe benennen, die bereit wären, an der Umfrage teilzunehmen. Mit dieser Taktik wächst die Probe wie ein Schneeball.

Während sich der Forscher in den Anfangsstadien der Problemlösung befindet, wenn die Aussichten und möglichen Grenzen der geplanten Umfrage bestimmt werden, kann die Verwendung von absichtlichen Stichproben sehr effektiv sein. Aber wir sollten auf keinen Fall die Schwächen dieser Art von Proben vergessen, da sie auch vom Forscher in deskriptiven oder kausalen Studien verwendet werden können, was sich nicht nachteilig auf die Qualität ihrer Ergebnisse auswirken wird. Ein klassisches Beispiel für diese Vergesslichkeit ist der Verbraucherpreisindex („VPI“). Wie Südman betont ( Sudmann): „CPI wird nur für 56 Städte und Ballungsräume ermittelt, deren Auswahl auch vom politischen Faktor beeinflusst wird. Tatsächlich können diese Städte nur sich selbst darstellen, während der Index aufgerufen wird Verbraucherpreisindex für Städter mit Stundenlohn*, und Angestellte und erscheint den meisten Menschen als Index, der das Preisniveau in jedem Gebiet der Vereinigten Staaten widerspiegelt. Auch die Auswahl der Verkaufsstellen erfolgt nicht zufällig, was zur Folge hat Die Abschätzung möglicher Stichprobenfehler wird unmöglich» (unsere Kursivschrift) 2 .

* Das heißt, Arbeiter. - Notiz. pro.

Quotenproben

Die dritte Art der deterministischen Stichprobe − Quotenproben; seine bekannte Repräsentativität wird dadurch erreicht, dass darin der gleiche Anteil an Elementen mit bestimmten Merkmalen wie in der befragten Grundgesamtheit enthalten ist (siehe „Forschungsfenster 15.1“). Versuchen Sie beispielsweise, eine repräsentative Stichprobe von Studenten zu erstellen, die auf dem Campus leben. Wenn es in einer bestimmten Stichprobe von 500 Personen keinen einzigen älteren Studenten gibt, haben wir das Recht, ihre Repräsentativität und die Gültigkeit der Anwendung der Ergebnisse dieser Stichprobe auf die untersuchte Population anzuzweifeln. Beim Arbeiten mit proportionaler Stichprobenziehung kann der Forscher sicherstellen, dass der Anteil der Studierenden an der Stichprobe ihrem Anteil an der Gesamtzahl der Studierenden entspricht.

Angenommen, ein Forscher führt eine selektive Untersuchung von Universitätsstudenten durch, während er daran interessiert ist, dass die Stichprobe nicht nur ihre Zugehörigkeit zu dem einen oder anderen Geschlecht widerspiegelt, sondern auch ihre Verteilung nach Kursen. Die Gesamtzahl der Studenten sei 10.000: 3.200 Erstsemester, 2.600 Studenten im zweiten Jahr, 2.200 Studenten im dritten Jahr und 2.000 Studenten im vierten Jahr; davon 7.000 Jungen und 3.000 Mädchen. Für eine Stichprobe von 1.000 Personen erfordert der proportionale Stichprobenplan 320 Erstsemester, 260 Studenten im zweiten Jahr, 220 Drittklässler und 200 Absolventen, 700 Jungen und 300 Mädchen. Der Forscher kann diesen Plan umsetzen, indem er jedem Interviewer eine bestimmte Quote gibt, die bestimmt, welche Studenten er kontaktieren soll.

Quotenstrichprobenerhebung Eine deterministische Stichprobe, die so ausgewählt ist, dass der Anteil der Stichprobenelemente mit bestimmten Merkmalen ungefähr dem Anteil gleicher Elemente in der untersuchten Grundgesamtheit entspricht; Jedem Außendienstmitarbeiter wird eine Quote zugewiesen, die die Merkmale der Bevölkerung festlegt, mit der er Kontakt aufnehmen muss.

Ein Interviewer, der 20 Interviews führen soll, kann angewiesen werden, Folgendes zu fragen:

            • sechs Studenten im ersten Jahr - fünf Jungen und ein Mädchen;
            • sechs Studenten im zweiten Jahr - vier Jungen und zwei Mädchen;
            • vier Studenten im dritten Jahr - drei Jungen und ein Mädchen;
            • vier Studenten im vierten Jahr - zwei Jungen und zwei Mädchen.

Beachten Sie, dass die Auswahl bestimmter Stichprobenelemente nicht durch den Forschungsplan bestimmt wird, sondern durch die Wahl des Interviewers, der nur die Bedingungen erfüllen muss, die durch die Quote festgelegt wurden: fünf Studienanfänger befragen, ein Studienanfänger usw.

Beachten Sie auch, dass diese Quote die Geschlechterverteilung der Studentenpopulation genau widerspiegelt, aber die Verteilung der Studenten auf die Kurse etwas verzerrt; 70 % (14 von 20) Interviews werden mit Jungen geführt, aber nur 30 % (6 von 20) mit Studienanfängern, während sie 32 % der Gesamtzahl der Studierenden ausmachen. Die jedem einzelnen Interviewer zugewiesene Quote spiegelt möglicherweise nicht die Verteilung der Kontrollmerkmale in der Grundgesamtheit wider und spiegelt dies normalerweise nicht wider – nur die endgültige Stichprobe sollte proportional sein.

Dabei ist zu bedenken, dass die proportionale Stichprobenziehung mehr von persönlichen, subjektiven Einstellungen oder Urteilen abhängt als von einem objektiven Stichprobenverfahren. Zudem gehört hier im Gegensatz zum bewussten Sampling die persönliche Beurteilung nicht dem Projektentwickler, sondern dem Interviewer. Es stellt sich die Frage, ob anteilige Stichproben als repräsentativ angesehen werden können, selbst wenn sie das Verhältnis von der Grundgesamtheit innewohnenden Komponenten mit bestimmten Kontrollmerkmalen wiedergeben. Dazu sind drei Anmerkungen zu machen.

Erstens kann sich die Stichprobe in einigen anderen wichtigen Merkmalen auffallend von der Grundgesamtheit unterscheiden, was einen schwerwiegenden Einfluss auf das Ergebnis haben kann. Wenn sich die Studie beispielsweise dem Problem rassistischer Vorurteile unter Studenten widmet, kann es nicht gleichgültig sein, woher die Befragten kamen: aus der Stadt oder vom Land. Da die Quote für das Merkmal „Stadt/Land“ nicht ausgewiesen ist, ist eine genaue Darstellung dieses Merkmals unwahrscheinlich. Natürlich gibt es eine solche Alternative: Quoten für alle potenziell signifikanten Merkmale zu definieren. Allerdings führt eine Erhöhung der Anzahl von Steuercharakteristiken zu einer Verkomplizierung der Spezifikation. Dies wiederum erschwert – und macht sie teilweise sogar unmöglich – die Auswahl der Musterelemente und führt in jedem Fall zu deren Verteuerung. Wenn beispielsweise auch die Stadt- oder Landzugehörigkeit und der sozioökonomische Status für die Studie relevant sind, muss der Interviewer möglicherweise nach einem Studienanfänger suchen, der aus der Stadt stammt und der oberen oder mittleren Schicht angehört. Ich stimme zu, dass es viel einfacher ist, nur einen männlichen Neuling zu finden.

Zweitens ist es sehr schwierig sicherzustellen, dass diese Stichprobe wirklich repräsentativ ist. Natürlich kann man in der Stichprobe prüfen, ob die Verteilung von Merkmalen, die nicht in die Kontrolle eingehen, deren Verteilung in der Grundgesamtheit entspricht. Ein solcher Test kann jedoch nur zu negativen Schlussfolgerungen führen. Es ist möglich, nur die Divergenz der Verteilungen aufzudecken. Wenn sich die Verteilungen der Stichprobe und der Grundgesamtheit für jedes dieser Merkmale wiederholen, besteht die Möglichkeit, dass sich die Stichprobe in einem anderen, nicht ausdrücklich spezifizierten Merkmal von der Grundgesamtheit unterscheidet.

Und schließlich drittens. Interviewer, die sich selbst überlassen sind, neigen zu bestimmten Handlungen. Sie greifen allzu oft darauf zurück, ihre Freunde zu befragen. Da sie sich oft als die Interviewer selbst entpuppen, besteht die Gefahr von Fehlern. Beweise aus England deuten darauf hin, dass Quotenstichproben dazu tendieren:

  1. Übertreibung der Rolle der am besten zugänglichen Elemente;
  2. Herunterspielen der Rolle kleiner Familien;
  3. Übertreibung der Rolle von Familien mit Kindern;
  4. Herunterspielen der Rolle der Industriearbeiter;
  5. Herunterspielen der Rolle derjenigen mit den höchsten und niedrigsten Einkommen;
  6. Herunterspielen der Rolle schlecht ausgebildeter Bürger;
  7. Herunterspielen der Rolle von Personen, die eine niedrige soziale Position einnehmen.
Interviewer, die vorgegebene Quoten wählen, indem sie zufällige Passanten anhalten, konzentrieren sich wahrscheinlich auf Bereiche mit einer großen Anzahl potenzieller Befragter, wie Einkaufszentren, Bahnhöfe und Flughäfen, Eingänge zu großen Supermärkten und dergleichen. Diese Praxis führt zu einer Überrepräsentation der Personengruppen, die solche Orte am häufigsten besuchen. Wenn Hausbesuche erforderlich sind, sind Interviewer oft von Bequemlichkeit getrieben.
Beispielsweise führen sie möglicherweise nur tagsüber Umfragen durch, was zu einer Unterschätzung der Meinung der Arbeitnehmer führt. Sie betreten unter anderem keine baufälligen Gebäude und fahren in der Regel nicht in die oberen Stockwerke von Gebäuden ohne Aufzug.

Abhängig von den Besonderheiten des untersuchten Problems können diese Tendenzen zu verschiedenen Arten von Fehlern führen, aber ihre Korrektur in der Phase der Datenanalyse scheint sehr, sehr schwierig zu sein. Andererseits stehen Forschern mit einer objektiven Auswahl von Stichprobenelementen gewisse Werkzeuge zur Verfügung, die es ermöglichen, das Verfahren zur Beurteilung der Repräsentativität einer gegebenen Stichprobe zu vereinfachen. Bei der Analyse des Problems der Repräsentativität solcher Proben berücksichtigt der Forscher weniger die Zusammensetzung der Probe als das Verfahren zur Auswahl ihrer Elemente.

Forschungsfenster: Brillant! Aber wer wird es lesen?

Jedes Jahr geben Werbetreibende Millionen von Dollar für Anzeigen aus, die auf den Seiten unzähliger Publikationen vom Werbezeitalter bis zum Yankee erscheinen. Eine gewisse Beurteilung von Text und Bild kann vor der Veröffentlichung sozusagen zu Hause in einer Werbeagentur erfolgen; es wird erst nach der Veröffentlichung der Anzeige wirklich getestet und beurteilt, umgeben von Dutzenden von ebenso sorgfältig gestalteten Anzeigen, die um die Aufmerksamkeit des Lesers wetteifern.

Gesellschaft Roper Stärke weltweit bewertet die Lesbarkeit von Anzeigen in Verbraucher-, Wirtschafts-, Fach- und Fachzeitschriften und -zeitungen. Die Ergebnisse der Recherche werden Werbetreibenden und Agenturen zur Kenntnis gebracht – natürlich gegen ein angemessenes Honorar. Weil Werbetreibende jeden Tag große Anstrengungen unternehmen, um ihre Anzeigen beim Verbraucher, dem Unternehmen, zu platzieren Stärke beschlossen, ein Muster zu erstellen, das den Abonnenten zeitnahe und genaue Informationen über die Wirksamkeit von Werbung geben würde. Jedes Jahr das Unternehmen Stärke befragte mehr als 50.000 Menschen und berücksichtigte dabei etwa 20.000 Anzeigen. Jährlich wurden etwa 500 Einzelpublikationen untersucht.

Starch verwendete eine proportionale Stichprobe mit mindestens 100 Lesern eines Geschlechts und 100 Lesern des anderen Geschlechts. Starch kam zu dem Schluss, dass sich bei dieser Stichprobengröße die Hauptabweichungen im Grad der Lesbarkeit stabilisierten. Leser über 18 Jahre wurden persönlich befragt, und alle Veröffentlichungen wurden berücksichtigt, mit Ausnahme derjenigen, die für spezielle Bevölkerungsgruppen bestimmt waren (z. B. wurden Mädchen im entsprechenden Alter befragt, um Veröffentlichungen der Zeitschrift Seventeen zu bewerten).

Bei der Durchführung von Umfragen wurde das Verbreitungsgebiet einer bestimmten Publikation berücksichtigt. Nehmen wir an, die Studie des Magazins Los Angeles hat sich mit Lesern befasst, die in Südkalifornien leben. "Zeit" wurde bundesweit untersucht. Die Umfrage widmete sich einzelnen Ausgaben des Magazins und wurde gleichzeitig in 20-30 Städten durchgeführt.

Jedem Interviewer wurde ein kleines Kontingent an Interviews zugeteilt, was dazu diente, die Streuung der Befragungsergebnisse zu minimieren. Fragebögen wurden an Personen unterschiedlicher Berufe und Altersgruppen mit unterschiedlichem Einkommen verteilt. Jede dieser Studien ermöglichte es, Positionen einer ziemlich breiten Leserschaft vorzustellen. Bei der Betrachtung einer Reihe von Fach-, Wirtschafts- und Branchenpublikationen wurden auch die Besonderheiten ihrer Subskription und Verbreitung berücksichtigt. Abonnementlisten für Veröffentlichungen mit relativ geringer Auflage ermöglichten die Auswahl akzeptabler Befragter.

Bei jeder Umfrage baten die Interviewer die Befragten, durch die Publikation zu blättern, und fragten, ob ihnen eine Anzeige aufgefallen sei. Wenn die Antwort ja war, stellte der Registrar eine Reihe von Fragen, um den Grad der Akzeptanz der Anzeige zu beurteilen.

Diese Bewertung könnte dreifach sein:

  • Achtung: diejenigen, die bereits auf die Tatsache des Erscheinens einer solchen Ankündigung geachtet haben.
  • Bekannt: Personen, die sich an irgendeinen Teil der Werbung erinnerten, der sich mit der beworbenen Marke oder dem Werbetreibenden befasste.
  • Lesen: Personen, die mindestens die Hälfte der Anzeige gelesen haben.

Nach der Befragung aller Anzeigen erfassten die Interviewer wichtige Klassifizierungsinformationen: Geschlecht, Alter, Beruf, Familienstand, Nationalität, Einkommen, Familiengröße und Familienzusammensetzung, die eine Kreuztabelle des Leserinteresses ermöglichten.

Bei bestimmungsgemäßer Verwendung Unternehmensdaten Stärke ermöglichen es Werbetreibenden und Agenturen, sowohl erfolglose als auch erfolgreiche Arten von Werbemaßnahmen zu identifizieren, die die Aufmerksamkeit des Lesers auf sich ziehen und halten. Informationen dieser Art sind für Werbetreibende, die in erster Linie an der Effektivität ihrer Werbekampagne interessiert sind, äußerst wertvoll.

Quelle: Roper Starch Worldwide, Mamaronek, NY 10543.

Wahrscheinlichkeitsstichproben

Der Forscher kann die Wahrscheinlichkeit bestimmen, irgendein Element der Population in die Wahrscheinlichkeitsstichprobe aufzunehmen, da die Auswahl seiner Elemente auf der Grundlage eines objektiven Prozesses durchgeführt wird und nicht von den Launen und Vorlieben des Forschers oder Außendienstmitarbeiters abhängt. Da das Elementauswahlverfahren objektiv ist, kann der Forscher die Zuverlässigkeit der erhaltenen Ergebnisse bewerten, was im Fall von deterministischen Stichproben unmöglich war, egal wie sorgfältig die Auswahl der Elemente der letzteren war.

Es sollte nicht angenommen werden, dass probabilistische Stichproben immer repräsentativer sind als deterministische. Tatsächlich kann eine deterministische Stichprobe auch repräsentativer sein. Der Vorteil von Wahrscheinlichkeitsstichproben besteht darin, dass sie eine Schätzung des potenziellen Stichprobenfehlers ermöglichen. Wenn der Forscher mit einer deterministischen Stichprobe arbeitet, hat er keine objektive Methode, um deren Angemessenheit für die Ziele der Studie zu beurteilen.

Einfache Zufallsstichprobe

Auf einfache Stichproben stoßen die meisten Menschen auf die eine oder andere Weise, entweder im Rahmen eines Statistikkurses am Institut oder durch das Lesen von Ergebnissen einschlägiger Studien in Zeitungen oder Zeitschriften. In einer einfachen Zufallsstichprobe hat jedes in der Stichprobe enthaltene Element die gleiche gegebene Wahrscheinlichkeit, zu den untersuchten Elementen zu gehören, und jede Kombination von Elementen in der ursprünglichen Grundgesamtheit kann möglicherweise zu einer Stichprobe werden. Wenn wir zum Beispiel eine einfache Zufallsstichprobe aller an einem bestimmten College eingeschriebenen Studenten ziehen wollen, müssen wir nur eine Liste aller Studenten erstellen, jedem darin enthaltenen Namen eine Nummer zuweisen und einen Computer verwenden, um zufällig einen bestimmten auszuwählen Anzahl der Elemente.

Bevölkerung

Bevölkerung
Eine Reihe von Elementen, die bestimmte festgelegte Bedingungen erfüllen; auch Studienpopulation (Zielpopulation) genannt.
Parameter
Ein bestimmtes Merkmal oder ein Indikator der allgemeinen oder untersuchten Bevölkerung.

Allgemeiner oder studierter Satz ist die Sammlung, aus der die Auswahl getroffen wird. Diese Bevölkerung (Bevölkerung) kann durch eine Reihe spezifischer Parameter beschrieben werden, die Merkmale der allgemeinen Bevölkerung sind, von denen jeder ein bestimmter quantitativer Indikator ist, der eine Bevölkerung von einer anderen unterscheidet.

Stellen Sie sich vor, dass die untersuchte Bevölkerung die gesamte erwachsene Bevölkerung von Cincinnati ist. Um diese Bevölkerung zu beschreiben, können eine Reihe von Parametern verwendet werden: Durchschnittsalter, der Anteil der Bevölkerung mit höhere Bildung, Einkommensniveau usw. Bitte beachten Sie, dass alle diese Indikatoren einen bestimmten festen Wert haben. Natürlich können wir sie berechnen, indem wir eine vollständige Volkszählung der untersuchten Bevölkerung durchführen. In der Regel verlassen wir uns aber nicht auf die Qualifizierung, sondern auf die von uns ausgewählte Stichprobe und verwenden die bei der selektiven Beobachtung gewonnenen Werte, um die erforderlichen Parameter der Grundgesamtheit zu bestimmen.

Wir veranschaulichen das Gesagte in der Tabelle. 15.1 ein Beispiel für eine hypothetische Population von 20 Personen. Die Arbeit mit einer kleinen hypothetischen Population wie dieser hat eine Reihe von Vorteilen. Erstens erleichtert die kleine Stichprobengröße die Berechnung der Populationsparameter, die zu ihrer Beschreibung verwendet werden können. Zweitens ermöglicht Ihnen dieser Band zu verstehen, was passieren kann, wenn ein bestimmter Stichprobenplan angenommen wird. Beides macht es einfach, die Ergebnisse der Probe mit dem "wahren" und in diesem Fall zu vergleichen bekannter Wert Menge, was nicht über eine typische Situation gesagt werden kann, in der der tatsächliche Wert der Menge unbekannt ist. Der Vergleich der Bewertung mit dem „wahren“ Wert gewinnt in diesem Fall besondere Klarheit.

Angenommen, wir möchten anhand zweier zufällig ausgewählter Elemente das Durchschnittseinkommen von Einzelpersonen in der ursprünglichen Population schätzen. Das Durchschnittseinkommen wird sein Parameter sein. Um diesen Durchschnittswert abzuschätzen, den wir mit μ bezeichnen, müssen wir die Summe aller Werte durch ihre Anzahl dividieren:

Populationsmittelwert μ = Summe der Populationselemente / Anzahl der Elemente.

In unserem Fall ergeben die Berechnungen:

Abgeleitete Bevölkerung

Abgeleitete Bevölkerung besteht aus allen möglichen Stichproben, die nach einem vorgegebenen Stichprobenplan (Stichprobenplan) aus der Allgemeinbevölkerung ausgewählt werden können. Statistiken ist ein Merkmal oder Indikator der Stichprobe. Der Stichprobenstatistikwert wird verwendet, um einen bestimmten Populationsparameter zu schätzen. Unterschiedliche Stichproben liefern unterschiedliche Statistiken oder Schätzungen für denselben Populationsparameter.

Abgeleitete Bevölkerung
Die Menge aller möglichen unterscheidbaren Stichproben, die gemäß einem vorgegebenen Stichprobenplan aus der Allgemeinbevölkerung ausgewählt werden können. Statistik Ein Merkmal oder Maß einer Stichprobe.

Betrachten Sie den abgeleiteten Satz aller möglichen Stichproben, die aus unserer hypothetischen Population von 20 Personen durch einen Stichprobenplan ausgewählt werden können, der davon ausgeht, dass die Stichprobengröße ist n=2 kann durch zufällige, nicht wiederholte Auswahl erhalten werden.

Nehmen Sie für einen Moment an, dass die Daten für jede Bevölkerungseinheit - in unserem Fall der Name und das Einkommen einer Person - auf Kreise geschrieben werden, wonach sie in einen Krug gesenkt und gemischt werden. Der Forscher nimmt einen Kreis aus dem Krug, schreibt Informationen darauf ab und legt ihn beiseite. Dasselbe macht er mit dem zweiten Krug, der aus dem Krug genommen wird. Dann stellt der Forscher beide Becher wieder in den Krug, mischt seinen Inhalt und wiederholt die gleiche Abfolge von Aktionen. Im Tisch. 15.2 zeigt die möglichen Ergebnisse des genannten Verfahrens. Bei 20 Kreisen sind 190 solcher Paarkombinationen möglich.

Für jede Kombination können Sie das Durchschnittseinkommen berechnen. Sagen wir mal zur Probenahme AB (k= 1)

k-e Stichprobenmittelwert = Summe der Stichproben / Anzahl der Stichproben =

Auf Abb. 15.4 zeigt die Schätzung des mittleren Einkommens für die gesamte Bevölkerung und die Fehlerhöhe für jede Schätzung für die Stichproben k = 25.62.108.147 und 189 .

Bevor wir die Beziehung zwischen dem Durchschnittseinkommen der Stichprobe (Statistik) und dem Durchschnittseinkommen der Grundgesamtheit (ein Parameter, der geschätzt werden muss) betrachten, lassen Sie uns ein paar Worte über die abgeleitete Grundgesamtheit sagen. Erstens erstellen wir in der Praxis keine Aggregate dieser Art. Es würde zu viel Zeit und Mühe erfordern. Der Praktiker ist darauf beschränkt, nur eine Probe der erforderlichen Größe zusammenzustellen. Der Forscher verwendet Konzept abgeleitete Grundgesamtheit und das damit verbundene Konzept der Stichprobenverteilung bei der Formulierung abschließender Schlussfolgerungen.

Wie wird weiter unten gezeigt. Zweitens ist zu bedenken, dass eine abgeleitete Grundgesamtheit als die Gesamtheit aller möglichen unterschiedlichen Stichproben definiert ist, die gemäß einem vorgegebenen Stichprobenplan aus der Grundgesamtheit ausgewählt werden können. Wenn irgendein Teil des Stichprobenplans geändert wird, ändert sich auch die abgeleitete Grundgesamtheit. Wenn der Forscher also beim Auswählen von Kreisen die erste der entfernten Scheiben in den Krug zurücklegt, bevor er die zweite entfernt, enthält der abgeleitete Satz.

Samples AA, BB usw. Wenn die Anzahl der nicht wiederholten Samples 3 statt 2 ist, gibt es Samples vom Typ ABC, und es gibt 1140 davon, nicht 190, wie es im vorherigen Fall der Fall war. Wenn die einfache Zufallsauswahl auf eine andere Methode zur Bestimmung der Elemente der Stichprobe geändert wird, ändert sich auch die abgeleitete Grundgesamtheit.

Es sollte auch daran erinnert werden, dass die Auswahl einer Stichprobe einer bestimmten Größe aus der allgemeinen Grundgesamtheit der Auswahl eines Elements (1 von 190) aus der abgeleiteten Grundgesamtheit entspricht. Diese Tatsache erlaubt uns, viele statistische Schlussfolgerungen zu ziehen.

Stichprobenmittelwert und allgemeiner Mittelwert

Können wir den Mittelwert der Stichprobe mit dem wahren Mittelwert der Grundgesamtheit gleichsetzen? Jedenfalls gehen wir davon aus, dass sie miteinander verbunden sind. Wir gehen aber auch davon aus, dass sich ein Fehler einschleichen wird. So ist beispielsweise davon auszugehen, dass die von Internetnutzern erhaltenen Informationen deutlich von den Ergebnissen einer Befragung der „normalen“ Bevölkerung abweichen werden. In anderen Fällen können wir von einer ziemlich genauen Übereinstimmung ausgehen, da wir sonst den Beispielwert nicht verwenden könnten, um den Wert des allgemeinen zu schätzen. Aber wie groß kann der Fehler sein, den wir dabei machen?

Lassen Sie uns alle in der Tabelle enthaltenen Stichprobenmittelwerte zusammenzählen. 15.2, und dividieren Sie die resultierende Summe durch die Anzahl der Proben, d.h. lassen Sie uns die Mittelwerte mitteln.
Wir erhalten folgendes Ergebnis:

Er deckt sich mit dem Durchschnittswert der Allgemeinbevölkerung. Sie sagen, dass wir es in diesem Fall zu tun haben unvoreingenommene Statistik.

Eine Statistik wird als unverzerrt bezeichnet, wenn ihr Durchschnitt über alle möglichen Stichproben gleich dem geschätzten Populationsparameter ist. Beachten Sie, dass wir hier nicht über einen bestimmten Wert sprechen. Die partielle Schätzung kann sehr weit vom wahren Wert entfernt sein – nehmen Sie zum Beispiel die AB- oder ST-Abtastungen. In einigen Fällen ist der wahre Wert der Grundgesamtheit unter Berücksichtigung einer möglichen Stichprobe möglicherweise nicht erreichbar, selbst wenn die Statistiken unvoreingenommen sind. In unserem Fall ist dies nicht der Fall: Eine Anzahl möglicher Stichproben – zum Beispiel AT – ergibt einen Stichprobenmittelwert, der dem wahren Mittelwert der Grundgesamtheit entspricht.

Es ist sinnvoll, die Verteilung dieser Stichprobenschätzungen und insbesondere die Beziehung zwischen dieser Streuung der Schätzungen und der Variation des Einkommensniveaus in der Bevölkerung zu betrachten. Als Streuungsmaß wird die Varianz der Allgemeinbevölkerung verwendet. Um die Varianz der Grundgesamtheit zu bestimmen, müssen wir die Abweichung jedes Werts vom Mittelwert berechnen, die Quadrate aller Abweichungen addieren und die resultierende Summe durch die Anzahl der Terme dividieren. Bezeichnen Sie mit a^ die Varianz der allgemeinen Bevölkerung. Dann:

Populationsvarianz σ 2 = Summe der quadrierten Differenzen jedes Elements
Bevölkerung und Bevölkerungsdurchschnitt / Anzahl der Bevölkerungselemente =

Streuung Mittelwert Einkommensniveau kann auf die gleiche Weise definiert werden. Das heißt, wir können es finden, indem wir die Abweichungen jedes Mittelwerts von ihrem Gesamtmittelwert bestimmen, die Quadrate der Abweichungen summieren und die resultierende Summe durch die Anzahl der Terme dividieren.

Wir können die Varianz des durchschnittlichen Einkommensniveaus auch auf andere Weise definieren, indem wir die Varianz der Einkommensniveaus in der Allgemeinbevölkerung verwenden, da zwischen diesen beiden Größen ein direkter Zusammenhang besteht. Genauer gesagt, in Fällen, in denen die Stichprobe nur einen kleinen Teil der Grundgesamtheit darstellt, ist die Varianz des Stichprobenmittelwerts gleich der Varianz der Grundgesamtheit dividiert durch die Stichprobengröße:

wobei σ x 2 die Varianz des durchschnittlichen Stichprobenwertes des Einkommensniveaus ist, σ 2 die Varianz des Einkommensniveaus in der Allgemeinbevölkerung ist, n— Stichprobengröße.

Vergleichen wir nun die Verteilung der Ergebnisse mit der Verteilung eines quantitativen Merkmals in der Allgemeinbevölkerung. Abbildung 15.5 zeigt, dass die Verteilung des in Box A gezeigten Populationsmerkmals multi-vertex ist (jeder der 20 Werte kommt nur einmal vor) und symmetrisch um den wahren Populationsmittelwert von 9400 ist.

Stichprobenverteilung
Die Verteilung der Werte einer bestimmten Statistik, berechnet für alle möglichen unterscheidbaren Stichproben, die nach einem bestimmten Stichprobenplan aus der Grundgesamtheit extrahiert werden können.

Die im Feld B dargestellte Notenverteilung basiert auf den Daten der Tabelle. 15.3, die wiederum durch Zuweisung von Werten aus Tabelle zusammengestellt wurde. 15.2 an die eine oder andere Gruppe, je nach Größe, mit anschließender Berechnung ihrer Anzahl in der Gruppe. Feld B ist ein traditionelles Histogramm, das ganz am Anfang des Statistikstudiums betrachtet wird Stichprobenverteilung Statistiken. Nebenbei bemerken wir Folgendes: Das Konzept der Stichprobenverteilung ist das wichtigste Konzept der Statistik, es ist der Eckpfeiler der Konstruktion statistischer Inferenzen. Aufgrund der bekannten Stichprobenverteilung der untersuchten Statistik kann auf den entsprechenden Parameter der Allgemeinbevölkerung geschlossen werden. Wenn andererseits nur bekannt ist, dass sich die Stichprobenschätzung von Stichprobe zu Stichprobe ändert, aber die Art dieser Änderung unbekannt ist, wird es unmöglich, den dieser Schätzung zugeordneten Stichprobenfehler zu bestimmen. Da die Stichprobenverteilung einer Schätzung beschreibt, wie sie sich von Stichprobe zu Stichprobe ändert, bietet sie eine Grundlage zur Bestimmung der Gültigkeit einer Stichprobenschätzung. Aus diesem Grund ist ein Wahrscheinlichkeits-Stichprobendesign für statistische Inferenzen so wichtig.

Angesichts der bekannten Wahrscheinlichkeiten, jedes Mitglied der Grundgesamtheit in die Stichprobe aufzunehmen, können Interviewer die Stichprobenverteilung verschiedener Statistiken finden. Auf diese Verteilungen verlassen sich Forscher – sei es der Stichprobenmittelwert, der Anteil der Stichprobe, die Stichprobenvarianz oder eine andere Statistik – wenn sie das Ergebnis einer Stichprobenbeobachtung auf die Allgemeinbevölkerung ausdehnen. Beachten Sie auch, dass bei Stichproben der Größe 2 die Verteilung der Stichprobenmittelwerte unimodal und symmetrisch um den wahren Mittelwert ist.

Wir haben also gezeigt:

  1. Der Mittelwert aller möglichen Stichprobenmittelwerte ist gleich dem allgemeinen Mittelwert.
  2. Die Varianz der Stichprobenmittelwerte hängt in gewisser Weise mit der allgemeinen Varianz zusammen.
  3. Die Verteilung der Stichprobenmittelwerte ist unimodal, während die Verteilung der Werte eines quantitativen Merkmals in der Allgemeinbevölkerung multimodal ist.

Zentraler Grenzwertsatz

Ein Satz, der besagt, dass für einfache Zufallsstichproben der Größe n, isoliert von der Allgemeinbevölkerung mit dem allgemeinen Durchschnitt μ und der Varianz σ 2 , insgesamt n die Verteilung des Stichprobenmittelwerts x nähert sich der Normalverteilung mit einem Mittelpunkt gleich μ und einer Varianz σ 2 . Die Genauigkeit dieser Annäherung nimmt mit zunehmendem Wert zu n.

Zentraler Grenzwertsatz. Die unimodale Verteilung von Schätzungen kann als Manifestation des zentralen Grenzwertsatzes angesehen werden, der dies für einfache Zufallsstichproben des Volumens besagt n, ausgewählt aus der Allgemeinbevölkerung mit dem wahren Mittelwert μ und der Varianz σ 2 , für groß n Die Verteilung der Stichprobenmittelwerte nähert sich der Normalverteilung mit einem Zentrum, das dem wahren Mittelwert entspricht, und einer Varianz, die dem Verhältnis der Varianz der Grundgesamtheit zur Stichprobengröße entspricht, d. h.:

Diese Annäherung wird immer genauer, da n. Merk dir das. Unabhängig von der Art der Grundgesamtheit ist die Verteilung der Stichprobenmittelwerte für ausreichend große Stichproben normal. Was versteht man unter einem ausreichend großen Volumen? Wenn die Verteilung der Werte eines quantitativen Merkmals der Allgemeinbevölkerung normal ist, bedeutet die Verteilung der Stichproben für Stichproben mit einem Volumen von n=1. Wenn die Verteilung einer Variablen (quantitatives Attribut) in der Grundgesamtheit symmetrisch, aber nicht normal ist, ergeben sehr kleine Stichproben eine normale Verteilung der Stichprobenmittelwerte. Weist die Verteilung eines quantitativen Merkmals der Allgemeinbevölkerung eine ausgeprägte Asymmetrie auf, sind größere Stichproben erforderlich. Allerdings kann die Verteilung des Stichprobenmittelwerts nur dann als normal angesehen werden, wenn es sich um eine ausreichend große Stichprobe handelt.

Um Schlussfolgerungen anhand einer Normalkurve zu ziehen, ist es überhaupt nicht erforderlich, von der Bedingung der Normalität der Werteverteilung eines quantitativen Merkmals der Allgemeinbevölkerung auszugehen. Vielmehr verlassen wir uns auf den zentralen Grenzwertsatz und ermitteln je nach Populationsverteilung einen solchen Stichprobenumfang, der es uns erlauben würde, mit einer Normalkurve zu arbeiten. Glücklicherweise wird die Normalverteilung der Statistik durch relativ kleine Stichproben bereitgestellt - Abb. 15.6 zeigt diesen Umstand deutlich. Schätzungen des Konfidenzintervalls. Kann uns das obige dabei helfen, bestimmte Schlussfolgerungen über den allgemeinen Durchschnitt zu ziehen? Tatsächlich wählen wir in der Praxis nur eine und nicht alle möglichen Stichproben einer bestimmten Größe aus und ziehen auf der Grundlage der erhaltenen Daten bestimmte Rückschlüsse auf die Zielgruppe.

Wie passiert es? Wie Sie wissen, hat bei einer Normalverteilung ein bestimmter Prozentsatz aller Beobachtungen eine bestimmte Standardabweichung; Angenommen, 95 % der Beobachtungen passen innerhalb von ±1,96 Standardabweichungen vom Mittelwert. Die Normalverteilung von Stichprobenmitteln, auf die der zentrale Grenzwertsatz angewendet werden kann, bildet in diesem Sinne keine Ausnahme. Der Mittelwert einer solchen Stichprobenverteilung ist gleich dem allgemeinen Mittelwert μ, und seine Standardabweichung wird als Standardfehler des Mittelwerts bezeichnet:

Es stellt sich heraus, dass:

  • 68,26 % der Stichprobenmittelwerte weichen vom allgemeinen Mittelwert um nicht mehr als ± σ x ab;
  • 95,45 % der Stichprobenmittelwerte weichen vom allgemeinen Mittelwert um nicht mehr als ±σ x ab;
  • 99,73 % der Stichprobenmittelwerte weichen vom allgemeinen Mittelwert um nicht mehr als ± σ x ab,

d.h. je nach gewähltem Wert ein gewisser Anteil an Stichprobenmitteln z wird in dem durch den Wert bestimmten Intervall eingeschlossen z. Dieser Ausdruck kann als Ungleichung umgeschrieben werden:

Allgemeiner Durchschnitt - z < Среднее по выборке < Генеральное среднее + z(Standardfehler des Mittelwerts)

Der Stichprobenmittelwert liegt also mit einer bestimmten Wahrscheinlichkeit in dem Intervall, dessen Grenzen die Summe und die Differenz des Mittelwerts der Verteilung und einer bestimmten Anzahl von Standardabweichungen sind. Diese Ungleichung kann in die Form umgewandelt werden:

Stichprobenmittelwert - z(Standardfehler des Mittelwerts)< Генеральное среднее < Среднее по выборке + z(Standardfehler des Mittelwerts)

Wird zum Beispiel in 95 % der Fälle das Verhältnis 15,1 eingehalten ( z= 1,96), dann wird in 95 % der Fälle auch das Verhältnis 15,2 beobachtet. In Fällen, in denen die Schlussfolgerung auf einem einzelnen Stichprobenmittelwert basiert, verwenden wir Ausdruck 15.2.

Es ist wichtig, sich an den Ausdruck 15.2 zu erinnern bedeutet nicht, dass das einer bestimmten Stichprobe entsprechende Intervall unbedingt den allgemeinen Mittelwert enthalten muss. Das Intervall hat mehr mit dem Auswahlverfahren zu tun. Das um diesen Mittelwert gebildete Intervall kann den wahren Mittelwert der Grundgesamtheit enthalten oder nicht. Unser Vertrauen in die Richtigkeit der getroffenen Schlussfolgerungen basiert auf der Tatsache, dass 95 % aller gemäß dem ausgewählten Stichprobenplan konstruierten Intervalle den wahren Mittelwert enthalten. Wir glauben, dass unsere Stichprobe zu diesen 95 % gehört.

Um diesen wichtigen Punkt zu veranschaulichen, stellen Sie sich für einen Moment vor, dass die Verteilung der Stichprobe für die Stichprobengröße bedeutet n= 2 in unserem hypothetischen Beispiel ist normal. Tabelle 15.4 veranschaulicht grafisch das Ergebnis für die ersten 10 der möglichen 190 Stichproben, die gemäß dem gegebenen Design ausgewählt werden können. Beachten Sie, dass nur 7 von 10 Intervallen einen allgemeinen oder wahren Mittelwert enthalten. Das Vertrauen in die Richtigkeit der Schlussfolgerung beruht nicht auf einer privaten Einschätzung, sondern genau Verfahren Schätzungen. Dieses Verfahren ist so, dass für 100 Proben, für die der Probenmittelwert und das Konfidenzintervall berechnet werden, in 95 Fällen dieses Intervall den wahren allgemeinen Wert enthält. Die Genauigkeit dieser Probe wird durch das Verfahren bestimmt, mit dem die Probe gebildet wurde. Ein repräsentatives Stichprobendesign garantiert nicht die Repräsentativität aller Stichproben. Statistische Inferenzverfahren basieren auf der Repräsentativität des Stichprobenplans, weshalb dieses Verfahren für Wahrscheinlichkeitsstichproben so entscheidend ist.

Probabilistisches Sampling ermöglicht es uns, die Genauigkeit der Ergebnisse als Nähe der erstellten Schätzungen zum wahren Wert zu bewerten. Je größer der Standardfehler der Statistik, desto größer die Streuung der Schätzungen und desto geringer die Genauigkeit des Verfahrens.

Einige mögen durch die Tatsache verwirrt sein, dass sich das Konfidenzniveau auf das Verfahren bezieht und nicht auf einen bestimmten Stichprobenwert. Es sollte jedoch daran erinnert werden, dass der Wert des Konfidenzniveaus der Schätzung des allgemeinen Werts angepasst werden kann Forscher. Wenn Sie kein Risiko eingehen möchten und befürchten, auf eines dieser fünf Stichprobenintervalle zu stoßen, das den Mittelwert der Grundgesamtheit nicht enthält, können Sie ein Konfidenzintervall von 99 % wählen, bei dem nur eines der hundert Stichprobenintervalle keinen enthält der Bevölkerungsdurchschnitt. Wenn Sie die Stichprobengröße erhöhen können, erhöhen Sie außerdem das Vertrauen in das Ergebnis, wodurch die gewünschte Genauigkeit der Schätzung des Populationswerts erreicht wird. Darauf werden wir in Kap. 17.

Das Verfahren, das wir beschreiben, hat noch eine Komponente, die eine gewisse Verlegenheit hervorrufen kann. Bei der Schätzung des Konfidenzintervalls werden drei Größen verwendet: x , z und σ x . Der Stichprobenmittelwert x wird aus den Stichprobendaten berechnet, z wird basierend auf dem gewünschten Konfidenzniveau ausgewählt. Aber was ist mit dem mittleren quadratischen Fehler des Mittelwerts σ x ? Es ist gleich:

und deshalb müssen wir, um es zu bestimmen, die Standardabweichung des quantitativen Attributs der allgemeinen Bevölkerung fragen, d. H. 5. Was ist in Fällen zu tun, in denen die Standardabweichung s Unbekannt? Dieses Problem tritt aus zwei Gründen nicht auf. Erstens ändert sich die Schwankung für die meisten quantitativen Merkmale, die in der Marktforschung verwendet werden, normalerweise viel langsamer als das Niveau der meisten Variablen, die für den Vermarkter von Interesse sind. Dementsprechend können wir, wenn die Studie wiederholt wird, den vorherigen, zuvor erhaltenen Wert von s in den Berechnungen verwenden. Zweitens können wir, sobald die Stichprobe ausgewählt und die Daten erhalten sind, die Populationsvarianz schätzen, indem wir die Stichprobenvarianz bestimmen. Die unverzerrte Stichprobenvarianz ist definiert als:

Stichprobenabweichung ŝ 2 = Summe der quadrierten Abweichungen vom Stichprobenmittelwert / (Anzahl der Stichproben -1). Um die Stichprobenvarianz zu bestimmen, müssen wir zuerst den Stichprobenmittelwert finden. Dann werden die Differenzen zwischen jedem der Stichprobenwerte und dem Stichprobenmittelwert gefunden; diese Differenzen werden quadriert, summiert und durch eine Zahl dividiert, die der Anzahl der Stichprobenbeobachtungen minus eins entspricht. Die Stichprobenvarianz liefert nicht nur eine Schätzung der Gesamtvarianz, sondern kann auch zur Schätzung des Standardfehlers des Mittelwerts verwendet werden. Wenn die allgemeine Varianz σ 2 bekannt ist, ist auch der mittlere quadratische Fehler σ x bekannt, weil:

Wenn die allgemeine Varianz unbekannt ist, kann der Standardfehler des Mittelwerts nur geschätzt werden. Diese Schätzung ist gegeben ŝ x , was gleich der Standardabweichung der Stichprobe dividiert durch ist Quadratwurzel von der Stichprobengröße, d.h. . Der Schätzwert wird auf die gleiche Weise bestimmt wie der Schätzwert des wahren Werts bestimmt wurde, aber anstelle der allgemeinen Standardabweichung wird die Standardabweichung der Stichprobe in die Berechnungsformel eingesetzt. Sagen wir also für Beispiel AB mit einem Beispielmittelwert von 5800:

Dementsprechend ist ŝ = 283 und

und 95% Abstand ist jetzt

was kleiner als der vorherige Wert ist.

Im Tisch. 15.5 fasst die in diesem Kapitel besprochenen Berechnungsformeln für verschiedene Mittelwerte und Streuungen zusammen. Bildung einer einfachen Zufallsstichprobe. In unserem Beispiel wurde die Auswahl der Stichprobenelemente anhand eines Krugs durchgeführt, der alle Elemente der ursprünglichen Grundgesamtheit enthielt. Dadurch konnten wir die Konzepte der abgeleiteten Grundgesamtheit und Stichprobenverteilung visualisieren. Wir raten davon ab, eine solche Methode in der Praxis anzuwenden, da dies die Fehlerwahrscheinlichkeit erhöht. Tassen können sich sowohl in Größe als auch in Textur unterscheiden, was in bestimmten Fällen dazu führen kann, dass eine gegenüber der anderen bevorzugt wird. Als Beispiel für einen solchen Fehler kann die per Lotterie durchgeführte Auswahl der Teilnehmer am Vietnamkrieg dienen.

Die Auswahl erfolgte, indem Scheiben mit Geburtsdaten aus der großen Trommel gezogen wurden. Das Fernsehen übertrug dieses Verfahren im ganzen Land. Leider wurden die Discs systematisch in die Trommel geladen, wobei die Januardaten zuerst und die Dezemberdaten zuletzt kamen. Obwohl die Trommel intensiv gedreht wurde, fielen Dezemberdaten viel häufiger als Januar. Anschließend wurde dieses Verfahren so überarbeitet, dass die Wahrscheinlichkeit solcher systematischer Fehler deutlich reduziert wurde. Das bevorzugte Verfahren zum Erzeugen einer einfachen Zufallsstichprobe basiert auf der Verwendung einer Tabelle von Zufallszahlen.

Die Verwendung einer solchen Tabelle beinhaltet die folgende Abfolge von Schritten. Zunächst müssen den Elementen der Grundgesamtheit fortlaufende Nummern von 1 bis zugeordnet werden N; in unserer hypothetischen Bevölkerung zum Element ABER Dem Element wird die Nummer 1 zugewiesen B- Zahl 2 usw. Zweitens muss die Anzahl der Ziffern in der Tabelle der Zufallszahlen mit der Zahl übereinstimmen N. Zum N= 20 zweistellige Zahlen werden verwendet; zum N zwischen 100 und 999 - dreistellige Zahlen usw. Drittens muss die Startposition zufällig bestimmt werden. Wir können die entsprechende Tabelle mit Zufallszahlen öffnen und mit geschlossenen Augen, wie sie sagen, mit dem Finger darauf zeigen. Da die Zahlen in der Zufallszahlentabelle in zufälliger Reihenfolge sind, spielt die Startposition keine Rolle.

Und schließlich können wir uns in jede beliebige Richtung bewegen - nach oben, unten oder quer, und diejenigen Elemente auswählen, deren Nummern Zufallszahlen aus der Tabelle entsprechen. Betrachten Sie zur Veranschaulichung des Gesagten die verkürzte Tabelle der Zufallszahlen (Tab. 15.6). Weil die N= 20, sollten wir nur mit zweistelligen Zahlen arbeiten. In diesem Sinne Tab. 15.6 passt perfekt zu uns. Angenommen, wir haben uns im Voraus entschieden, die Spalte nach unten zu verschieben, die Ausgangsposition befindet sich am Schnittpunkt der elften Reihe und der vierten Spalte, wo sich die Zahl 77 befindet.Diese Zahl ist zu groß und sollte daher verworfen werden. Die nächsten beiden Zahlen werden ebenfalls verworfen, während der vierte Wert 02 verwendet wird, da 2 die Elementnummer ist BEI.

Die nächsten fünf Zahlen werden ebenfalls als zu groß verworfen, während die Zahl 05 das Element anzeigt E. Also die Elemente BEI und E wird unsere Zwei-Elemente-Stichprobe, anhand derer wir das Einkommensniveau dieser Population beurteilen. Es ist auch eine alternative Strategie möglich, bei der ein Computerprogramm, das Zufallszahlen erzeugt, als Grundlage für die Auswahl verwendet wird. Neuere Veröffentlichungen weisen darauf hin, dass die von solchen Programmen generierten Zahlen nicht völlig zufällig sind, was sich in gewisser Weise beim Erstellen komplexer mathematischer Modelle manifestieren kann, aber sie können für die meisten angewandten Marktforschungen verwendet werden. Beachten Sie erneut, dass eine einfache Zufallsstichprobe die Zusammenstellung einer fortlaufend nummerierten Liste von Elementen der allgemeinen Bevölkerung erfordert.

Mit anderen Worten, jedes Mitglied der ursprünglichen Population muss identifiziert werden. Für einige Bevölkerungsgruppen ist dies nicht schwierig, zum Beispiel in einer Studie der 500 größten amerikanischen Unternehmen, deren Liste im Fortune-Magazin aufgeführt ist. Diese Liste wurde bereits erstellt, sodass die Bildung einer einfachen Stichprobe in diesem Fall nicht schwierig sein wird. Für andere Ausgangspopulationen (z. B. für alle Familien, die in einer bestimmten Stadt leben) ist die Erstellung einer allgemeinen Liste äußerst schwierig, was die Forscher zwingt, auf andere Stichprobenerhebungsschemata zurückzugreifen.

Zusammenfassung

Lernziel 1
Unterscheiden Sie klar zwischen den Konzepten der Volkszählung (Qualifikation) und der Stichprobenziehung

Eine vollständige Zählung der Bevölkerung (Bevölkerung) heißt qualifiziert. Probe Satz, gebildet aus den ausgewählten Elementen.

Lernziel 2
Kennen Sie das Wesen und die Abfolge der sechs Schritte, die von Forschern durchgeführt werden, um eine Stichprobenpopulation zu erhalten

Der Probenahmeprozess gliedert sich in sechs Schritte:

  1. Bevölkerungszuordnung;
  2. Bestimmung des Stichprobenrahmens;
  3. Wahl des Auswahlverfahrens;
  4. Bestimmung des Stichprobenumfangs;
  5. Auswahl von Beispielelementen;
  6. Prüfung der ausgewählten Elemente.

Lernziel 3
Definieren Sie das Konzept des „Stichprobenrahmens“

Der Stichprobenrahmen ist die Liste der Gegenstände, aus denen die Stichprobe gezogen wird.

Lernziel 4
Erklären Sie den Unterschied zwischen probabilistischem und deterministischem Sampling

In einer probabilistischen Stichprobe kann jedes Mitglied der Bevölkerung mit einer bestimmten Zahl eingeschlossen werden gegeben ungleich Null Wahrscheinlichkeit. Die Wahrscheinlichkeiten, bestimmte Mitglieder der Grundgesamtheit in die Stichprobe aufzunehmen, können voneinander abweichen, aber die Wahrscheinlichkeit, dass jedes Element darin enthalten ist, ist bekannt. Bei deterministischen Stichproben wird es unmöglich, die Wahrscheinlichkeit abzuschätzen, dass irgendein Element in der Stichprobe enthalten ist. Die Repräsentativität einer solchen Stichprobe kann nicht garantiert werden. Alle deterministischen Auswahlen basieren vielmehr auf einer persönlichen Position, einem Urteil oder einer Präferenz. Solche Präferenzen können manchmal gute Schätzungen der Merkmale der Population liefern, aber es gibt keine Möglichkeit, die Eignung der Stichprobe für die Aufgabe objektiv zu bestimmen.

Lernziel 5
Unterscheiden Sie zwischen Stichproben mit fester Größe und mehrstufigen (konsekutiven) Stichproben

Beim Arbeiten mit Feststichproben wird der Stichprobenumfang vor Beginn der Erhebung festgelegt und der Analyse der Ergebnisse geht die Erhebung aller erforderlichen Daten voraus. Bei einer sequentiellen Stichprobe ist die Anzahl der ausgewählten Elemente nicht im Voraus bekannt, sie wird auf der Grundlage einer Reihe sequentieller Entscheidungen bestimmt.

Lernziel 6
Erklären Sie, was absichtliches Sampling ist, und beschreiben Sie seine Stärken und Schwächen

Die absichtlichen Stichprobenelemente werden von Hand ausgewählt und dem Forscher in geeigneter Weise für die Zwecke der Umfrage vorgelegt. Es wird davon ausgegangen, dass die ausgewählten Elemente ein vollständiges Bild der untersuchten Population vermitteln können. Solange sich der Forscher in den frühen Stadien der Problemlösung befindet, wenn die Aussichten und möglichen Grenzen der geplanten Erhebung bestimmt werden, kann der Einsatz einer absichtlichen Stichprobenziehung sehr effektiv sein. Aber wir sollten auf keinen Fall die Schwächen dieser Art von Proben vergessen, da sie auch vom Forscher in deskriptiven oder kausalen Studien verwendet werden können, was sich nicht nachteilig auf die Qualität ihrer Ergebnisse auswirken wird.

Lernziel 7
Definieren Sie das Konzept der Quotenstichprobe

Die verhältnismäßige Stichprobenziehung wird so gewählt, dass der Anteil der Stichprobenelemente mit bestimmten Merkmalen in etwa dem Anteil gleicher Elemente in der untersuchten Grundgesamtheit entspricht; Dazu wird jedem Zähler eine Quote zugewiesen, die die Merkmale der Bevölkerung festlegt, mit der er Kontakt aufnehmen muss.

Lernziel 8
Erklären Sie, was ein Parameter in einem Auswahlverfahren ist

Parameter - ein bestimmtes Merkmal oder ein Indikator der allgemeinen oder untersuchten Bevölkerung; ein bestimmter quantitativer Indikator, der einen Satz von einem anderen unterscheidet.

Lernziel 9
Erklären Sie, was eine abgeleitete Menge ist

Die abgeleitete Grundgesamtheit besteht aus allen möglichen Stichproben, die gemäß einem vorgegebenen Stichprobenplan aus der Grundgesamtheit ausgewählt werden können.

Lernziel 10
Erklären Sie, warum das Konzept der Stichprobenverteilung das wichtigste Konzept der Statistik ist.

Das Konzept der Stichprobenverteilung ist der Eckpfeiler der statistischen Inferenz. Aufgrund der bekannten Stichprobenverteilung der untersuchten Statistik kann auf den entsprechenden Parameter der Allgemeinbevölkerung geschlossen werden. Wenn andererseits nur bekannt ist, dass sich die Stichprobenschätzung von Stichprobe zu Stichprobe ändert, aber die Art dieser Änderung unbekannt ist, wird es unmöglich, den dieser Schätzung zugeordneten Stichprobenfehler zu bestimmen. Da die Stichprobenverteilung einer Schätzung beschreibt, wie sie sich von Stichprobe zu Stichprobe ändert, bietet sie eine Grundlage zur Bestimmung der Gültigkeit einer Stichprobenschätzung.

Statistische Studien sind sehr zeitaufwändig und teuer, daher entstand die Idee, die kontinuierliche Beobachtung durch eine selektive zu ersetzen.

Der Hauptzweck der diskontinuierlichen Beobachtung besteht darin, die Merkmale der untersuchten statistischen Grundgesamtheit für den untersuchten Teil davon zu erhalten.

Selektive Beobachtung- Dies ist eine Methode der statistischen Forschung, bei der verallgemeinernde Indikatoren der Bevölkerung nur für einen einzelnen Teil festgelegt werden, basierend auf den Bestimmungen der Zufallsauswahl.

Bei der Stichprobenmethode wird nur ein bestimmter Teil der untersuchten Bevölkerung untersucht, während die zu untersuchende statistische Bevölkerung als allgemeine Bevölkerung bezeichnet wird.

Eine Stichprobe oder einfach eine Stichprobe kann als Teil der Einheiten bezeichnet werden, die aus der allgemeinen Bevölkerung ausgewählt wurden und einer statistischen Untersuchung unterzogen werden.

Der Wert der Stichprobenmethode: Mit einer minimalen Anzahl von untersuchten Einheiten wird die statistische Forschung in kürzeren Zeiträumen und mit den niedrigsten Kosten für Mittel und Arbeit durchgeführt.

In der Allgemeinbevölkerung wird der Anteil der Einheiten, die das untersuchte Merkmal aufweisen, als allgemeiner Anteil bezeichnet (bezeichnet als R), und der Durchschnittswert des untersuchten variablen Merkmals ist der allgemeine Durchschnitt (bezeichnet als X).

In der Stichprobenpopulation wird der Anteil des untersuchten Merkmals als Stichprobenanteil bezeichnet, oder Teil (mit w bezeichnet), der Durchschnittswert in der Stichprobe ist Stichprobenmittelwert.

Wenn während des Zeitraums der Umfrage alle Regeln seiner wissenschaftlichen Organisation eingehalten werden, liefert die Stichprobenmethode ziemlich genaue Ergebnisse und daher diese Methode es ist zweckmäßig, die Überprüfung der Daten der kontinuierlichen Beobachtung zu beantragen.

Diese Methode hat sich in der staatlichen und nicht-departementalen Statistik verbreitet, da sie bei der Untersuchung der minimalen Anzahl von untersuchten Einheiten eine gründliche und genaue Untersuchung ermöglicht.

Die untersuchte Grundgesamtheit besteht aus Einheiten mit unterschiedlichen Merkmalen. Die Zusammensetzung der Stichprobe kann von der Zusammensetzung der Allgemeinbevölkerung abweichen, diese Diskrepanz zwischen den Merkmalen der Stichprobe und der Allgemeinbevölkerung stellt den Stichprobenfehler dar.

Der selektiven Beobachtung innewohnende Fehler charakterisieren die Größe der Diskrepanz zwischen den Daten der selektiven Beobachtung und der Gesamtpopulation. Fehler, die während der Stichprobenziehung auftreten, werden als Repräsentativitätsfehler bezeichnet und in zufällige und systematische Fehler unterteilt.

Wenn die Stichprobenpopulation aufgrund der nicht kontinuierlichen Natur der Beobachtung die gesamte Population nicht genau wiedergibt, spricht man von Zufallsfehlern, und ihre Größe wird auf der Grundlage des Gesetzes der großen Zahlen und der Wahrscheinlichkeitstheorie mit ausreichender Genauigkeit bestimmt.

Systematische Fehler entstehen durch Verletzung des Prinzips der zufälligen Auswahl von Bevölkerungseinheiten für die Beobachtung.

2. Arten und Schemata der Auswahl

Die Größe des Stichprobenfehlers und die Methoden zu seiner Bestimmung hängen von der Art und dem Schema der Auswahl ab.

Es gibt vier Arten der Auswahl eines Satzes von Beobachtungseinheiten:

1) zufällig;

2) mechanisch;

3) typisch;

4) seriell (verschachtelt).

zufällige Auswahl- die gebräuchlichste Auswahlmethode in einer Zufallsstichprobe, sie wird auch als Lotteriemethode bezeichnet, bei der für jede Einheit der statistischen Grundgesamtheit ein Los mit einer Seriennummer erstellt wird.

Als nächstes wird die erforderliche Anzahl von Einheiten der statistischen Grundgesamtheit zufällig ausgewählt. Unter diesen Bedingungen hat jeder von ihnen die gleiche Wahrscheinlichkeit, in die Stichprobe zu gelangen, zum Beispiel Gewinnziehungen, wenn ein bestimmter Teil der Zahlen, die für Gewinne ausmachen, zufällig aus der Gesamtzahl der ausgegebenen Tickets ausgewählt wird. In diesem Fall haben alle Nummern die gleiche Chance, in die Stichprobe zu gelangen.

Mechanische Auswahl- Dies ist eine Methode, bei der die gesamte Population nach einem Zufallskriterium in Gruppen homogener Größe eingeteilt wird, dann wird jeder Gruppe nur eine Einheit entnommen.Alle Einheiten der untersuchten statistischen Population werden in einer bestimmten Reihenfolge vorgeordnet, aber abhängig Abhängig vom Stichprobenumfang wird die erforderliche Stückzahl in einem bestimmten Intervall mechanisch ausgewählt .

Typische Auswahl - Dies ist ein Verfahren, bei dem die zu untersuchende statistische Grundgesamtheit nach einem wesentlichen, typischen Merkmal in qualitativ homogene, ähnliche Gruppen eingeteilt wird, dann wird aus jeder dieser Gruppen eine bestimmte Anzahl von Einheiten zufällig ausgewählt, proportional zum Anteil der Gruppe die gesamte Bevölkerung.

Die typische Auswahl liefert genauere Ergebnisse, da sie Vertreter aller typischen Gruppen in der Stichprobe umfasst.

Serielle (Verschachtelungs-)Auswahl. Ganze Gruppen (Serien, Nester), zufällig oder mechanisch ausgewählt, unterliegen der Auswahl. Für jede solche Gruppe, Serie, wird eine kontinuierliche Beobachtung durchgeführt und die Ergebnisse werden auf die gesamte Bevölkerung übertragen.

Die Abtastgenauigkeit hängt auch vom Auswahlschema ab. Die Stichprobenziehung kann nach dem Schema der wiederholten und nicht wiederholten Auswahl erfolgen.

Neuauswahl. Jede ausgewählte Einheit oder Serie wird an die gesamte Grundgesamtheit zurückgegeben und kann erneut abgetastet werden.Dies ist das sogenannte zurückgegebene Ballschema.

Wiederkehrende Auswahl. Jede vermessene Einheit wird zurückgezogen und nicht der Bevölkerung zurückgegeben, sie wird also nicht erneut vermessen. Dieses Schema wird als nicht zurückgegebener Ball bezeichnet.

Die sich nicht wiederholende Auswahl liefert genauere Ergebnisse, da die Beobachtung bei gleicher Stichprobengröße mehr Einheiten der untersuchten Grundgesamtheit abdeckt.

Kombinierte Auswahl kann einen oder mehrere Schritte durchlaufen. Eine Stichprobe wird als einstufig bezeichnet, wenn die einmal ausgewählten Einheiten der Grundgesamtheit einer Untersuchung unterzogen werden.

Eine Stichprobe wird als mehrstufig bezeichnet, wenn die Auswahl der Grundgesamtheit Stufen, aufeinander folgende Stufen durchläuft und jede Stufe, jede Stufe der Auswahl ihre eigene Auswahleinheit hat.

Mehrphasige Stichprobenziehung - In allen Stufen der Stichprobenziehung wird dieselbe Stichprobeneinheit beibehalten, es werden jedoch mehrere Stufen, Phasen von Stichprobenerhebungen durchgeführt, die sich in der Breite des Erhebungsprogramms und der Stichprobengröße voneinander unterscheiden.

Merkmale der Parameter der Grund- und Stichprobenpopulationen sind durch folgende Symbole gekennzeichnet:

N- das Volumen der allgemeinen Bevölkerung;

n– Stichprobengröße;

X– allgemeiner Durchschnitt;

X ist der Stichprobenmittelwert;

R– allgemeiner Anteil;

w - Stichprobenanteil;

2 - allgemeine Varianz (Streuung eines Merkmals in der Allgemeinbevölkerung);

2 - Stichprobenvarianz desselben Merkmals;

? - Standardabweichung in der Allgemeinbevölkerung;

? ist die Standardabweichung in der Stichprobe.

3. Stichprobenfehler

Jede Einheit in einer Stichprobenbeobachtung sollte die gleiche Chance haben, mit den anderen ausgewählt zu werden – dies ist die Grundlage einer Zufallsstichprobe.

Selbststichprobe - dies ist die Auswahl von Einheiten aus der gesamten allgemeinen Bevölkerung durch Lotterie oder auf andere ähnliche Weise.

Das Zufallsprinzip besagt, dass die Aufnahme oder der Ausschluss eines Objekts aus der Stichprobe durch keinen anderen Faktor als den Zufall beeinflusst werden kann.

Probe teilen ist das Verhältnis der Anzahl der Einheiten in der Stichprobe zur Anzahl der Einheiten in der Allgemeinbevölkerung:


Die Selbst-Random-Selektion in ihrer reinen Form ist die erste unter allen anderen Selektionsarten, sie enthält und verwirklicht die Grundprinzipien der selektiven statistischen Beobachtung.

Die zwei Haupttypen von verallgemeinernden Indikatoren, die bei der Stichprobenmethode verwendet werden, sind der Durchschnittswert eines quantitativen Attributs und der relative Wert eines alternativen Attributs.

Der Stichprobenanteil (w) oder die Besonderheit wird durch das Verhältnis der Anzahl der Einheiten bestimmt, die das untersuchte Merkmal aufweisen m, auf die Gesamtzahl der Probenahmeeinheiten (n):


Um die Zuverlässigkeit von Stichprobenindikatoren zu charakterisieren, werden die durchschnittlichen und marginalen Fehler der Stichprobe unterschieden.

Der Stichprobenfehler, auch Repräsentativitätsfehler genannt, ist die Differenz zwischen der entsprechenden Stichprobe und allgemeinen Merkmalen:

?x = | x - x |;

?w =|х – p|.

Nur Stichprobenbeobachtungen weisen einen Stichprobenfehler auf

Stichprobenmittelwert und Stichprobenanteil sind Zufallsvariablen, die nehmen verschiedene Bedeutungen abhängig von den Einheiten der untersuchten Grundgesamtheit, die in die Stichprobe aufgenommen wurden. Dementsprechend sind auch Stichprobenfehler Zufallsvariablen und können auch unterschiedliche Werte annehmen. Daher wird der Durchschnitt der möglichen Fehler bestimmt - der durchschnittliche Stichprobenfehler.

Der durchschnittliche Stichprobenfehler wird durch den Stichprobenumfang bestimmt: Je größer die Grundgesamtheit ist, desto kleiner ist der durchschnittliche Stichprobenfehler. Indem wir eine Stichprobenerhebung mit einer zunehmenden Anzahl von Einheiten der Allgemeinbevölkerung abdecken, charakterisieren wir die Gesamtbevölkerung immer genauer.

Der durchschnittliche Stichprobenfehler hängt vom Variationsgrad des untersuchten Merkmals ab, der Variationsgrad wiederum ist durch Varianz gekennzeichnet? 2 oder w(l - w)- für ein alternatives Zeichen. Je kleiner die Merkmalsvarianz und -varianz ist, desto kleiner ist der mittlere Stichprobenfehler und umgekehrt.

Für zufälliges Resampling werden mittlere Fehler theoretisch mit den folgenden Formeln berechnet:

1) für das durchschnittliche quantitative Merkmal:


wo? 2 - der Durchschnittswert der Streuung eines quantitativen Merkmals.

2) für eine Aktie (Alternativzeichen):


Wie ist also die Varianz des Merkmals in der Population? 2 nicht genau bekannt ist, verwendet man in der Praxis den für die Stichprobengesamtheit berechneten Wert der Varianz S 2 nach dem Gesetz der großen Zahl, wonach die Stichprobengesamtheit bei ausreichend großem Stichprobenumfang die Merkmale der Allgemeinbevölkerung genau wiedergibt .

Die Formeln für den mittleren Stichprobenfehler für zufälliges Resampling lauten wie folgt. Für den Durchschnittswert eines quantitativen Merkmals: Die allgemeine Varianz wird durch das Wahlfach durch das folgende Verhältnis ausgedrückt:


wobei S 2 der Dispersionswert ist.

Mechanische Probenahme- dies ist die Auswahl von Einheiten in einer Stichprobe aus dem Allgemeinen, die nach einem neutralen Kriterium in gleiche Gruppen eingeteilt wird; wird so durchgeführt, dass nur eine Einheit aus jeder solchen Gruppe in der Stichprobe ausgewählt wird.

Bei der mechanischen Auswahl werden die Einheiten der untersuchten statistischen Grundgesamtheit vorläufig in einer bestimmten Reihenfolge angeordnet, wonach eine bestimmte Anzahl von Einheiten in einem bestimmten Intervall mechanisch ausgewählt wird. In diesem Fall ist die Größe des Intervalls in der Allgemeinbevölkerung gleich dem Kehrwert des Stichprobenanteils.

Da die mechanische Auswahl bei ausreichend großer Grundgesamtheit hinsichtlich der Genauigkeit der Ergebnisse nahe an der Zufallsauswahl liegt, werden zur Bestimmung des mittleren Fehlers der mechanischen Stichprobe die Formeln der zufälligen, nicht wiederholten Stichprobe verwendet.

Um Einheiten aus einer heterogenen Bevölkerung auszuwählen, wird die sogenannte typische Stichprobe verwendet. Sie wird verwendet, wenn alle Einheiten der Allgemeinbevölkerung gemäß den Merkmalen, von denen die untersuchten Indikatoren abhängen, in mehrere qualitativ homogene, ähnliche Gruppen unterteilt werden können.

Dann wird aus jeder typischen Gruppe eine individuelle Auswahl von Einheiten in die Stichprobe durch eine Zufalls- oder mechanische Stichprobe getroffen.

Bei der Untersuchung komplexer statistischer Grundgesamtheiten wird normalerweise eine typische Stichprobenziehung verwendet.

Eine typische Probenahme liefert genauere Ergebnisse. Die Typisierung der Allgemeinbevölkerung gewährleistet die Repräsentativität einer solchen Stichprobe, die Repräsentation jeder typologischen Gruppe darin, wodurch der Einfluss der Intergruppenvarianz auf den durchschnittlichen Stichprobenfehler ausgeschlossen werden kann. Bei der Bestimmung des durchschnittlichen Fehlers einer typischen Stichprobe dient daher der Durchschnitt der gruppeninternen Varianzen als Streuungsindikator.

Bei der seriellen Probenahme handelt es sich um eine zufällige Auswahl aus einer Grundgesamtheit gleichgroßer Gruppen, um in solchen Gruppen ausnahmslos alle Einheiten einer Beobachtung zu unterziehen.

Da alle Einheiten ausnahmslos innerhalb von Gruppen (Serien) untersucht werden, hängt der durchschnittliche Stichprobenfehler (bei Auswahl gleicher Serien) nur von der Varianz zwischen den Gruppen (Interserien) ab.

4. Möglichkeiten zur Ausweitung der Stichprobenergebnisse auf die Bevölkerung

Die Charakterisierung der Allgemeinbevölkerung anhand von Stichprobenergebnissen ist das oberste Ziel der Stichprobenbeobachtung.

Das Stichprobenverfahren wird verwendet, um die Merkmale der Allgemeinbevölkerung für bestimmte Indikatoren der Stichprobe zu erhalten. Je nach Zielsetzung der Studie erfolgt dies durch direkte Rückrechnung der Stichprobenindikatoren für die Allgemeinbevölkerung oder durch die Methode der Berechnung von Korrekturfaktoren.

Die Methode der direkten Rückrechnung ist die, mit der sich die Kennziffern der Stichprobe teilen w oder mittel X werden unter Berücksichtigung des Stichprobenfehlers auf die Allgemeinbevölkerung ausgedehnt.

Die Methode der Korrekturfaktoren wird angewendet, wenn das Stichprobenverfahren dazu dient, die Ergebnisse der vollständigen Rechnungslegung zu verfeinern. Mit dieser Methode werden die Daten der jährlichen Viehzählungen der Bevölkerung veredelt.

Probe - Das:

1) die Gesamtheit der Elemente des Studiengegenstandes, die direkt untersucht werden;

2) Methoden und Verfahren zur Auswahl von Elementen des Studiengegenstands.

Bevölkerung - ein vollständiger Satz von Objekten, die sich auf das untersuchte Problem beziehen. In soziologischen Studien als G.S. Meistens handelt es sich um Aggregate von Einzelpersonen - die Bevölkerung (Städte, Länder usw.), eine soziale Gruppe (Jugendliche, Arbeitslose, Geschäftsleute usw.), das Publikum der Massenmedien (MSK) usw. In vielen jedoch Fälle, G. S. . kann aus größeren Elementen (Objekten) bestehen - Familien (Haushalte), akademische Gruppen, Unternehmen, Religionsgemeinschaften, einzelne Siedlungen oder Staaten usw.

Stichprobenpopulation - Teil der für die Untersuchung ausgewählten Objekte aus der Allgemeinbevölkerung, um einen Rückschluss auf die Gesamtbevölkerung zu ziehen.

Damit die durch die Untersuchung der Stichprobe gewonnene Schlussfolgerung auf die gesamte Bevölkerung ausgedehnt werden kann, muss die Stichprobe die Eigenschaft haben, repräsentativ zu sein.

Repräsentativität ist die Fähigkeit der Stichprobe, die untersuchte Population zu repräsentieren. Je genauer die Zusammensetzung der Stichprobe die Grundgesamtheit zu den untersuchten Themen repräsentiert, desto höher ist ihre Repräsentativität.

BEISPIEL: Repräsentativität kann durch das folgende Beispiel veranschaulicht werden. Angenommen, die Bevölkerung besteht aus allen Schülern der Schule (600 Personen aus 20 Klassen, 30 Personen in jeder Klasse). Untersuchungsgegenstand ist die Einstellung zum Rauchen. Eine Stichprobe von 60 Gymnasiasten repräsentiert die Bevölkerung viel schlechter als eine Stichprobe von denselben 60 Personen, die 3 Schüler aus jeder Klasse umfasst. Hauptgrund dafür ist die ungleiche Altersverteilung in den Klassen. Daher ist im ersten Fall die Repräsentativität der Stichprobe gering und im zweiten Fall hoch (ceteris paribus).

Beispieltypen

1. Stichproben.

1.1 Einfache Zufallsauswahl.

1.2 Die Methode der systematischen (oder mechanischen) Probenahme.

1.3 Serielles (verschachteltes oder Cluster-)Sampling.

1.4 Geschichtete Probenahme.

2. Nicht-zufällige Stichprobe (Nicht-Wahrscheinlichkeit).

2.2. zufällige Auswahl.

2.3. Mehrstufige und einstufige Probenahme.

1. Stichproben.

Ein Merkmal der Zufallsstichprobe ist, dass alle Einheiten der Allgemeinbevölkerung die gleiche Wahrscheinlichkeit haben, in die Stichprobe aufgenommen zu werden. Für Stichproben, Zufallsprinzip. Grundlage der Stichprobe können Mitarbeiterlisten des Unternehmens, Telefonverzeichnisse, Meldelisten von Autobesitzern, Wählerlisten in Wahllokalen, Hausbücher sowie verschiedene vom Soziologen selbst erstellte Listen je nach Zielsetzung der Untersuchung sein (eine Liste von Straßen, auf denen dann die Auswahl der Befragten erfolgt).

Zufallsstichproben werden normalerweise in öffentlichen Meinungsumfragen vor Wahlen, Referenden und anderen öffentlichen Veranstaltungen verwendet.

Plus dieser Methode ist die vollständige Beachtung des Zufallsprinzips und damit die Vermeidung systematischer Fehler.

Nachteile dieser Methode:

– Die Notwendigkeit einer Liste von Bevölkerungselementen.

- Schwierigkeiten bei der Durchführung der Umfrage.

– Relativ große Stichprobengröße.

Probe - eine Reihe von Fällen (Subjekte, Objekte, Ereignisse, Proben), die nach einem bestimmten Verfahren aus der allgemeinen Bevölkerung für die Teilnahme an der Studie ausgewählt werden.

Stichprobengröße

Stichprobengröße – die Anzahl der in der Stichprobe enthaltenen Fälle. Aus statistischen Gründen wird eine Fallzahl von mindestens 30-35 empfohlen.

Abhängige und unabhängige Stichproben

Beim Vergleich zweier (oder mehrerer) Stichproben ist ihre Abhängigkeit ein wichtiger Parameter. Wenn es möglich ist, in zwei Stichproben für jeden Fall ein homomorphes Paar zu bilden (d. h. wenn ein Fall aus Stichprobe X genau einem Fall aus Stichprobe Y entspricht und umgekehrt) (und diese Beziehungsbasis für das Merkmal wichtig ist gemessen an den Proben), werden solche Proben als abhängig bezeichnet. Beispiele für abhängige Auswahlen:

  1. Zwillingspaar
  2. zwei Messungen eines beliebigen Merkmals vor und nach der experimentellen Exposition,
  3. Ehemänner und Ehefrauen
  4. usw.

Wenn zwischen den Proben keine solche Beziehung besteht, gelten diese Proben als unabhängig, zum Beispiel:

  1. Männer und Frauen,
  2. Psychologen und Mathematiker.
  3. Dementsprechend haben abhängige Stichproben immer die gleiche Größe, während die Größe unabhängiger Stichproben unterschiedlich sein kann.

Proben werden anhand verschiedener statistischer Kriterien verglichen:

  • Student's t-Test
  • Wilcoxon-T-Test
  • Mann-Whitney-U-Test
  • Kriterium der Vorzeichen
  • usw.

Repräsentativität

Die Stichprobe kann als repräsentativ oder nicht repräsentativ betrachtet werden.

Ein Beispiel für eine nicht repräsentative Stichprobe

In den Vereinigten Staaten ist eines der berühmtesten historischen Beispiele für nicht-repräsentatives Sampling der Fall, der sich während der Präsidentschaftswahlen im Jahr 1936 ereignete. Der Literary Digest, der die Ereignisse mehrerer vorangegangener Wahlen erfolgreich vorhergesagt hatte, verfehlte seine Vorhersagen, indem er zehn Millionen Test-Stimmzettel an seine Abonnenten, aus Telefonbüchern im ganzen Land ausgewählte Personen und Personen aus Kfz-Zulassungslisten verschickte. Bei 25 % der abgegebenen Stimmzettel (knapp 2,5 Millionen) verteilten sich die Stimmen wie folgt:

57 % bevorzugten den republikanischen Kandidaten Alf Landon

40 % entschieden sich für den damaligen demokratischen Präsidenten Franklin Roosevelt

Bekanntlich gewann Roosevelt die eigentlichen Wahlen mit mehr als 60 % der Stimmen. Der Fehler von The Literary Digest war folgender: Um die Repräsentativität der Stichprobe zu erhöhen – weil sie wussten, dass sich die Mehrheit ihrer Abonnenten als Republikaner betrachtete – erweiterten sie die Stichprobe um Personen, die aus Telefonbüchern und Registrierungslisten ausgewählt wurden. Sie berücksichtigten jedoch nicht die Realitäten ihrer Zeit und rekrutierten sogar noch mehr Republikaner: Während der Weltwirtschaftskrise war es hauptsächlich die Mittel- und Oberschicht (dh die Mehrheit der Republikaner, nicht der Demokraten), die es sich leisten konnte eigene Handys und Autos.

Planarten für Baugruppen aus Mustern

Es gibt mehrere Haupttypen von Gruppenbauplänen:

  • Studieren Sie mit Versuchs- und Kontrollgruppen, die unterschiedlichen Bedingungen ausgesetzt werden.
  • Studieren Sie mit Versuchs- und Kontrollgruppen unter Verwendung einer gepaarten Auswahlstrategie
  • Studieren Sie mit nur einer Gruppe - experimentell.
  • Eine Studie mit einem gemischten (faktoriellen) Plan - alle Gruppen werden in unterschiedliche Bedingungen versetzt.

Gruppenbildungsstrategien

Die Auswahl von Gruppen für ihre Teilnahme an einem psychologischen Experiment erfolgt mit verschiedenen Strategien, die notwendig sind, um die größtmögliche Achtung der internen und externen Validität zu gewährleisten.

  • Randomisierung (zufällige Auswahl)
  • Echte Gruppen einbeziehen

Randomisierung

Randomisierung, oder zufällige Auswahl, wird verwendet, um einfache Zufallsstichproben zu erstellen. Die Verwendung einer solchen Stichprobe basiert auf der Annahme, dass jedes Mitglied der Bevölkerung mit gleicher Wahrscheinlichkeit in die Stichprobe aufgenommen wird. Um beispielsweise eine Zufallsstichprobe von 100 Studenten zu erstellen, können Sie Papiere mit den Namen aller Universitätsstudenten in einen Hut stecken und dann 100 Zettel daraus entnehmen – dies ist eine zufällige Auswahl (Goodwin J., S. 147).

Paarweise Auswahl

Paarweise Auswahl- eine Strategie zur Bildung von Stichprobengruppen, bei der Probandengruppen aus Probanden gebildet werden, die hinsichtlich der für das Experiment bedeutsamen Nebenparameter gleichwertig sind. Diese Strategie ist effektiv für Experimente mit Versuchs- und Kontrollgruppen mit der besten Option - der Rekrutierung

Die Forschung beginnt normalerweise mit einer Annahme, die eine Überprüfung unter Einbeziehung von Fakten erfordert. Diese Annahme – eine Hypothese – wird in Bezug auf den Zusammenhang von Phänomenen oder Eigenschaften in einer bestimmten Menge von Objekten formuliert.

Um solche Annahmen auf Fakten zu überprüfen, ist es notwendig, die entsprechenden Eigenschaften ihrer Träger zu messen. Aber es ist unmöglich, Angst bei allen Frauen und Männern zu messen, ebenso wie es unmöglich ist, Aggressivität bei allen Jugendlichen zu messen. Daher sind sie bei der Durchführung einer Studie auf einen relativ kleinen Kreis von Vertretern der relevanten Bevölkerungsgruppen beschränkt.

Bevölkerung- dies ist die Gesamtheit der Objekte, in Bezug auf die eine Forschungshypothese formuliert wird.

Zum Beispiel alle Männer; oder alle Frauen; oder alle Einwohner einer Stadt. Die allgemeine Bevölkerungsgruppe, in Bezug auf die der Forscher auf der Grundlage der Ergebnisse der Studie Schlussfolgerungen ziehen wird, kann zahlenmäßig kleiner und bescheidener sein, beispielsweise alle Erstklässler einer bestimmten Schule.

Die Allgemeinbevölkerung ist also zwar nicht unendlich zahlreich, aber in der Regel eine Vielzahl potentieller Themen, die einer kontinuierlichen Forschung nicht zugänglich sind.

Stichprobe oder Stichprobenpopulation- Dies ist eine Gruppe von Objekten mit begrenzter Anzahl (in der Psychologie - Subjekte, Befragte), die speziell aus der allgemeinen Bevölkerung ausgewählt wurden, um ihre Eigenschaften zu untersuchen. Dementsprechend wird die Untersuchung der Eigenschaften der Allgemeinbevölkerung an einer Stichprobe bezeichnet selektive Forschung. Fast alle psychologischen Studien sind selektiv und ihre Schlussfolgerungen gelten für die allgemeine Bevölkerung.

Nachdem also die Hypothese formuliert und die entsprechenden Grundgesamtheiten ermittelt wurden, steht der Forscher vor dem Problem der Organisation der Stichprobe. Die Stichprobe sollte so sein, dass die Verallgemeinerung der Schlussfolgerungen der Stichprobenstudie gerechtfertigt ist - Verallgemeinerung, ihre Verteilung auf die allgemeine Bevölkerung. Die Hauptkriterien für die Gültigkeit der Schlussfolgerungen der Studiedies sind die Repräsentativität der Stichprobe und die statistische Validität der (empirischen) Ergebnisse.

Stichprobenrepräsentativität- mit anderen Worten, ihre Repräsentativität ist die Fähigkeit der Stichprobe, die untersuchten Phänomene ziemlich vollständig zu repräsentieren - unter dem Gesichtspunkt ihrer Variabilität in der Allgemeinbevölkerung.

Natürlich kann nur die allgemeine Bevölkerung ein vollständiges Bild des untersuchten Phänomens in all seiner Bandbreite und Nuancen der Variabilität vermitteln. Daher ist die Repräsentativität immer in dem Maße eingeschränkt, in dem die Stichprobe begrenzt ist. Und es ist die Repräsentativität der Stichprobe, die das Hauptkriterium bei der Bestimmung der Grenzen der Verallgemeinerung der Ergebnisse der Studie ist. Dennoch gibt es Techniken, die es ermöglichen, eine für den Forscher ausreichende repräsentative Stichprobe zu erhalten (Diese Techniken werden im Kurs "Experimentelle Psychologie" untersucht).


Die erste und wichtigste Technik ist eine einfache zufällige (randomisierte) Auswahl. Es geht darum sicherzustellen, dass jedes Mitglied der Bevölkerung die gleichen Chancen hat, in die Stichprobe aufgenommen zu werden. Die Zufallsauswahl bietet die Möglichkeit, in die Stichprobe unterschiedlichster Vertreter der Allgemeinbevölkerung zu gelangen. Gleichzeitig werden besondere Maßnahmen ergriffen, um den Anschein einer Regelmäßigkeit bei der Auswahl auszuschließen. Und das lässt hoffen, dass am Ende in der Stichprobe das untersuchte Gut, wenn nicht in seiner Gesamtheit, so doch in seiner größtmöglichen Vielfalt vertreten sein wird.

Die zweite Möglichkeit, Repräsentativität zu gewährleisten, ist die geschichtete Zufallsauswahl oder die Auswahl nach den Eigenschaften der Allgemeinbevölkerung. Es beinhaltet eine vorläufige Bestimmung der Eigenschaften, die die Variabilität der untersuchten Eigenschaft beeinflussen können (dies können Geschlecht, Einkommensniveau oder Bildung usw. sein). Anschließend wird das prozentuale Verhältnis der Anzahl der sich in diesen Eigenschaften unterscheidenden Gruppen (Schichten) in der Allgemeinbevölkerung ermittelt und ein identisches prozentuales Verhältnis der entsprechenden Gruppen in der Stichprobe bereitgestellt. Weiterhin werden in jeder Untergruppe der Stichprobe die Probanden nach dem Prinzip der einfachen Zufallsauswahl ausgewählt.

Statistische Gültigkeit, oder statistischer Signifikanz werden die Ergebnisse der Studie mit statistischen Inferenzverfahren ermittelt.

Sind wir mit bestimmten Schlussfolgerungen aus den Ergebnissen der Studie gegen Entscheidungsfehler abgesichert? Natürlich nicht. Schließlich basieren unsere Entscheidungen auf den Ergebnissen einer Untersuchung einer Stichprobenpopulation sowie auf unserem psychologischen Wissensstand. Vor Fehlern sind wir nicht ganz gefeit. In der Statistik gelten solche Fehler als akzeptabel, wenn sie höchstens in einem Fall von 1000 auftreten (Irrtumswahrscheinlichkeit α = 0,001 bzw. zugehöriger Wert der Konfidenzwahrscheinlichkeit des richtigen Schlusses p = 0,999); in einem Fall von 100 (Irrtumswahrscheinlichkeit α = 0,01 oder der zugehörige Wert der Konfidenzwahrscheinlichkeit des richtigen Schlusses p = 0,99) oder in fünf Fällen von 100 (Irrtumswahrscheinlichkeit α = 0,05 oder der zugehörige Wert der Konfidenzwahrscheinlichkeit von). die korrekte Ausgabe p=0,95). Es ist in der Psychologie üblich, Entscheidungen auf den letzten beiden Ebenen zu treffen.

Wenn man von statistischer Signifikanz spricht, wird manchmal das Konzept des „Signifikanzniveaus“ (als α bezeichnet) verwendet. Die Zahlenwerte von p und α ergänzen sich bis 1.000 – ein kompletter Satz von Ereignissen: Entweder wir haben die richtige Schlussfolgerung gezogen, oder wir haben einen Fehler gemacht. Diese Pegel werden nicht berechnet, sie werden festgelegt. Das Signifikanzniveau kann als eine Art "rote" Linie verstanden werden, deren Schnittpunkt es uns erlaubt, von diesem Ereignis als nicht zufällig zu sprechen. In jedem kompetenten wissenschaftlichen Bericht oder jeder Veröffentlichung müssen die gezogenen Schlussfolgerungen von einer Angabe der p- oder α-Werte begleitet werden, bei denen die Schlussfolgerungen gezogen werden.

Methoden der statistischen Inferenz werden in der Vorlesung "Mathematische Statistik" ausführlich behandelt. Im Moment stellen wir nur fest, dass sie bestimmte Anforderungen an die Nummer stellen, oder Stichprobengröße.

Leider gibt es keine strengen Empfehlungen zur vorläufigen Bestimmung der erforderlichen Stichprobengröße. Zudem erhält der Forscher auf die Frage nach der notwendigen und ausreichenden Anzahl davon meist zu spät eine Antwort – erst nach Auswertung der Daten der bereits befragten Stichprobe. Die allgemeinsten Empfehlungen können jedoch formuliert werden:

1. Bei der Entwicklung einer Diagnosetechnik wird die größte Stichprobengröße benötigt - von 200 bis 1000-2500 Personen.

2. Wenn es notwendig ist, 2 Proben zu vergleichen, muss ihre Gesamtzahl mindestens 50 Personen betragen; die Anzahl der verglichenen Proben sollte ungefähr gleich sein.

3. Wenn die Beziehung zwischen Eigenschaften untersucht wird, sollte die Stichprobengröße mindestens 30-35 Personen betragen.

4. Je mehr Variabilität der untersuchten Eigenschaft, desto größer sollte die Stichprobengröße sein. Daher kann die Variabilität verringert werden, indem die Homogenität der Stichprobe beispielsweise nach Geschlecht, Alter usw. erhöht wird. Dies verringert natürlich die Möglichkeit, verallgemeinernde Schlussfolgerungen zu ziehen.

Abhängige und unabhängige Stichproben. Eine typische Forschungssituation liegt vor, wenn eine für den Forscher interessante Eigenschaft an zwei oder mehr Proben zum Zwecke ihres weiteren Vergleichs untersucht wird. Diese Proben können je nach Verfahren für ihre Organisation in unterschiedlichen Anteilen vorliegen. Unabhängige Proben zeichnen sich dadurch aus, dass die Auswahlwahrscheinlichkeit eines Subjekts einer Stichprobe nicht von der Auswahl eines Subjekts einer anderen Stichprobe abhängt. Gegen, abhängige Proben zeichnen sich dadurch aus, dass jeder Proband einer Stichprobe nach einem bestimmten Kriterium mit einem Probanden einer anderen Stichprobe abgeglichen wird.

Im Allgemeinen beinhalten abhängige Stichproben eine paarweise Auswahl von Probanden in den verglichenen Stichproben und unabhängige Stichproben - eine unabhängige Auswahl von Probanden.

Es ist zu beachten, dass die Fälle von „teilweise abhängigen“ (oder „teilweise unabhängigen“) Stichproben nicht zulässig sind: Dies verletzt ihre Repräsentativität auf unvorhersehbare Weise.

Abschließend stellen wir fest, dass zwei Paradigmen der psychologischen Forschung unterschieden werden können.

Sogenannt R-Methodik beinhaltet die Untersuchung der Variabilität einer bestimmten Eigenschaft (psychologisch) unter dem Einfluss eines Einflusses, Faktors oder einer anderen Eigenschaft. Die Stichprobe ist eine Reihe von Subjekten.

Ein anderer Ansatz Q-Methodik, beinhaltet die Untersuchung der Variabilität des Subjekts (einzeln) unter dem Einfluss verschiedener Reize (Bedingungen, Situationen usw.). Es entspricht der Situation, wenn die Probe ist eine Reihe von Stimuli.