אוכלוסיה כללית ושיטת דגימה. יסודות הדגימה ויצירת מדגם אקראי פשוט תוצאות המדגם מוצגות

מטרות למידה

  1. ברור להבחין בין המושגים של מפקד (הסמכה) ודגימה.
  2. דע את המהות והרצף של ששת השלבים המיושמים על ידי חוקרים כדי להשיג אוכלוסיית מדגם.
  3. הגדירו את המושג "מסגרת דגימה".
  4. הסבר את ההבדל בין דגימה הסתברותית לדטרמיניסטית.
  5. הבחנה בין דגימה בגודל קבוע לבין דגימה רב-שלבית (רצופה).
  6. הסבירו מהי דגימה מכוונת ותאר את נקודות החוזק והחולשות שלה.
  7. הגדירו את המושג דגימת מכסות.
  8. הסבר מהו פרמטר בהליך בחירה.
  9. הסבר מהי קבוצה נגזרת.
  10. הסבירו מדוע מושג התפלגות הדגימה הוא המושג החשוב ביותר בסטטיסטיקה.

לכן, החוקר הגדיר במדויק את הבעיה והבטיח את עיצוב המחקר ואיסוף הנתונים המתאימים לפתרונן. השלב הבא בתהליך המחקר צריך להיות בחירת אותם אלמנטים שייבדקו. ניתן לבחון כל מרכיב באוכלוסייה נתונה על ידי ביצוע מפקד מלא של אוכלוסייה זו. סקר מלא של האוכלוסייה נקרא מפקד (הסמכה). יש אפשרות נוספת. חלק מסוים באוכלוסייה, מדגם של מרכיבים של קבוצה גדולה, עובר בדיקה סטטיסטית, ולפי הנתונים המתקבלים על תת-קבוצה זו, מסקנות מסוימות לגבי הקבוצה כולה. היכולת להכליל את התוצאות המתקבלות מנתוני המדגם לקבוצה גדולה תלויה בשיטה שבה נלקחה המדגם. חלק גדול מפרק זה יוקדש לאופן שבו יש לשרטט את המדגם ומדוע.

מפקד אוכלוסין (הסמכה)
מפקד אוכלוסין מלא (אוכלוסיה).
לִטעוֹם
אוסף של אלמנטים של תת-קבוצה של קבוצה גדולה יותר של אובייקטים.

המושג "אוכלוסיה" או "אוסף" יכול להתייחס לא רק לאנשים, אלא גם לחברות הפועלות בתעשיית הייצור, לקמעונאים או לסיטונאים, או אפילו לחפצים דוממים לחלוטין, כגון חלקים המיוצרים על ידי המיזם; מושג זה מוגדר כמכלול האלמנטים העומדים בתנאים מסוימים. תנאים אלו מגדירים באופן ייחודי הן את המרכיבים השייכים לקבוצת היעד והן את המרכיבים שיש להוציא מהשיקול.

מחקר שמטרתו לקבוע את הפרופיל הדמוגרפי של צרכני פיצה קפואה צריך להתחיל בזיהוי מי צריך ולא צריך להיות מסווג ככזה. האם אנשים שניסו פיצה כזו לפחות פעם אחת שייכים לקטגוריה הזו? אנשים שקונים לפחות פיצה אחת בחודש? בשבוע? אנשים שאוכלים יותר מכמות מינימלית מסוימת של פיצה בחודש? על החוקר לדייק מאוד בקביעת קבוצת היעד. כמו כן, יש להקפיד שהמדגם יילקח מאוכלוסיית היעד ולא מאוכלוסיה "איזושהי", דבר המקרה כאשר מסגרת הדגימה אינה מספקת או לא מלאה. האחרון הוא רשימה של אלמנטים שמהם תיווצר מדגם אמיתי.

חוקר עשוי להעדיף גישת דגימה על פני סקר של כלל האוכלוסייה מכמה סיבות. ראשית, בחינה מלאה של אוכלוסייה, אפילו בגודל קטן יחסית, דורשת עלויות חומר וזמן גדולות מאוד. לעתים קרובות, עד השלמת המפקד ועיבוד הנתונים, המידע כבר לא מעודכן. במקרים מסוימים, ההסמכה פשוט בלתי אפשרית. נניח שהחוקרים יצאו לבדוק את התאימות של חיי השירות בפועל של מנורות ליבון חשמליות עם זה המחושב, שעבורו הם צריכים להשאיר אותם דולקים עד שהם נכשלים. אם תבחן את כל היצע המנורות בצורה כזו, יתקבלו נתונים אמינים, אבל לא יהיה מה לסחור.

לבסוף, לתדהמתם הגדולה של מתחילים, החוקר עשוי להעדיף דגימה על פני מפקד, תוך שאיפה לדיוק התוצאות. מפקדים דורשים צוות גדול, מה שמגביר את הסבירות לטעויות הטיה (ללא דגימה). נסיבות אלו הן אחת הסיבות שבגללן לשכת מפקד האוכלוסין האמריקאית משתמשת בסקרים מדגמיים כדי לבדוק את הדיוק של סוגים שונים של מפקדים. קראתם נכון: ניתן לערוך סקרים לדוגמה כדי לבדוק את דיוק נתוני ההסמכה.

שלבי עיצוב לדוגמה

על איור. איור 15.1 מציג רצף בן שישה שלבים שחוקר יכול לעקוב אחריו בעת תכנון מדגם. קודם כל, יש צורך לקבוע את אוכלוסיית היעד או את קבוצת האלמנטים שעליהם החוקר רוצה לדעת משהו.

לדוגמה, כאשר חוקרים את העדפות הילדים, החוקרים צריכים להחליט אם אוכלוסיית היעד תהיה מורכבת מילדים בלבד, רק הורים או שניהם.

מצטבר (אוכלוסיה)
קבוצה של אלמנטים העומדים בתנאים מסוימים שצוינו.
מסגרת דגימה (בסיס)
רשימת האלמנטים שמהם תיעשה הבחירה; עשוי להיות מורכב מיחידות טריטוריאליות, ארגונים, אנשים וגורמים אחרים.

חברה מסוימת בדקה את ה"מירוצים" החשמליים שלה רק על ילדים. הילדים היו מרותקים לגמרי. הורים הגיבו אחרת לחידוש. האמהות לא אהבו את העובדה שהנסיעה לא לימדה ילדים להיות ידידותיים לרכב, והאבות לא אהבו את העובדה שהמוצר עשוי כמו צעצוע.
גם המצב ההפוך אפשרי. משרד השיק מוצר מזון חדש והשיק קמפיין פרסומי בפריסה ארצית שהתמקד בילד הפג, המשרד בדק את יעילות הפרסומות רק על אמהות שהתרגשו. הילדים, לעומת זאת, מצאו את ה"האצה" הזו, ואיתה גם המוצר המפורסם עצמו, מגעיל. המוצר הסתיים 1.

על החוקר להחליט ממי או ממה תהיה האוכלוסייה הרלוונטית: יחידים, משפחות, חברות, ארגונים אחרים, עסקאות בכרטיסי אשראי וכו'. בקבלת החלטות כאלה יש צורך לקבוע את המרכיבים שיש להחריג מאוכלוסיות. יש לבצע התייחסות זמנית וגיאוגרפית של אלמנטים, שבמקרים מסוימים עשויים להיות כפופים לתנאים או הגבלות נוספות. לדוגמה, אם מדובר ביחידים, האוכלוסייה הרצויה עשויה להיות מורכבת רק מאנשים מעל גיל 18, או רק מנשים, או רק מאנשים בעלי השכלה תיכונית לפחות.

המשימה של קביעת הגבולות הגיאוגרפיים עבור אוכלוסיית היעד במחקר שיווק בינלאומי יכולה להיות בעיה מיוחדת, שכן הדבר מגביר את ההטרוגניות של המערכת הנבדקת. לדוגמה, היחס היחסי בין אזורים עירוניים וכפריים יכול להשתנות באופן משמעותי ממדינה למדינה. להיבט הטריטוריאלי יש השפעה רצינית על הרכב האוכלוסייה ובתוך אותה מדינה. לדוגמה, בצפון צ'ילה, אוכלוסייה הודית ברובה חיה בצורה קומפקטית, בעוד שבאזורים הדרומיים של המדינה חיים בעיקר צאצאים של אירופאים.

כיסוי (תקרית)
אחוז בני אוכלוסייה או קבוצה העומדים בתנאי ההכללה במדגם.

ככלל, ככל שאוכלוסיית היעד מוגדרת פשוטה יותר, כך הכיסוי שלה (שכיחות) גבוה יותר והליך הדגימה קל וזול יותר. כיסוי (תקרית)מתאים לשיעור המרכיבים של אוכלוסייה או קבוצה, מבוטא באחוז, העומדים בתנאי ההכללה במדגם. הכיסוי משפיע ישירות על הזמן ועלויות החומר הנדרשות לביצוע סקר. אם הכיסוי גדול (כלומר. רוברכיבים באוכלוסייה עומדים בקריטריונים פשוטים אחד או יותר המשמשים לזיהוי משיבים פוטנציאליים), הזמן והעלויות החומריות הנדרשות לאיסוף נתונים ממוזערים. לעומת זאת, עם עלייה במספר הקריטריונים שעל המשיבים הפוטנציאליים לעמוד בהם, עלויות החומר והזמן עולות.

על איור. 15.2 מציג את שיעור האוכלוסייה הבוגרת העוסקת בענפי ספורט מסוימים. הנתונים בתרשים מצביעים על כך שהרבה יותר קשה ויקר לבחון אנשים שנכנסים לרכיבה על אופנוע (רק 3.6% מסך המבוגרים) מאשר לבחון אנשים שמסתובבים בטיולים פנאי רגילים (27.4% מסך כל המבוגרים). מבוגרים). העיקר שהחוקר ידייק בקביעה אילו אלמנטים יש לכלול באוכלוסיית המחקר ואילו אלמנטים יש להוציא ממנה. הצהרה ברורה של מטרת המחקר מקלה מאוד על פתרון בעיה זו. השלב השני בתהליך הדגימה הוא קביעת מסגרת הדגימה, שהיא, כפי שאתה כבר יודע, רשימת האלמנטים שמהם תישאב הדגימה. תן לאוכלוסיית היעד של מחקר מסוים להיות כל המשפחות המתגוררות באזור דאלאס. במבט ראשון, ספריית הטלפונים של דאלאס עשויה להיות מסגרת דגימה טובה ונגישה בקלות. אף על פי כן, בבדיקה מעמיקה יותר מתברר שרשימת המשפחות הכלולות במדריך אינה נכונה לחלוטין, משום שמספרים של חלק מהמשפחות נשמטים בה (כמובן, היא אינה כוללת משפחות שאין להן טלפון), בעוד למשפחות מסוימות יש מספר מספרי טלפון. גם אנשים שהחליפו לאחרונה את מקום מגוריהם ובהתאם את מספר הטלפון שלהם, אינם נמצאים בספרייה.

חוקרים מנוסים מגיעים למסקנה שהתאמה מדויקת בין מסגרת הדגימה לאוכלוסיית היעד המעניינת היא נדירה מאוד. אחד השלבים היצירתיים ביותר בתכנון הדגימה הוא קביעת מסגרת דגימה מתאימה במקרים בהם קשה לרשום את חברי האוכלוסייה. הדבר עשוי לדרוש דגימה מקוביות עבודה וקידומות כאשר, למשל, נעשה שימוש בחיוג אקראי עקב ליקויים בספריות הטלפון. עם זאת, הגידול המשמעותי ביחידות העבודה ב-10 השנים האחרונות הקשה על משימה זו. מצבים דומים יכולים להיווצר גם במהלך תצפית סלקטיבית של אזורים טריטוריאליים או ארגונים עם דגימת משנה לאחר מכן, כאשר, למשל, פרטים הם אוכלוסיית היעד, אך אין רשימה עדכנית מדויקת שלהם.

מקור: מבוסס על נתונים הכלולים ב-SSI- LITe TM: ל ow שכיחות טממוקד ס ampling" (Fairfield, Conn.: Survey Sampling, Inc., 1994).

השלב השלישי בהליך הדגימה קשור קשר הדוק לקביעת מסגרת הדגימה. בחירת שיטת הדגימה או הליך הדגימה תלויה במידה רבה במסגרת הדגימה שאומצה על ידי החוקר. סוגים שונים של דגימות דורשים סוגים שונים של מסגרות דגימה. זה והפרק הבא יתנו סקירה כללית של הסוגים העיקריים של דוגמאות המשמשות במחקר שיווקי. כאשר מתארים אותם, הקשר בין מסגרת הדגימה לשיטת היווצרותה צריך להיות ברור.

השלב הרביעי בהליך הדגימה הוא קביעת גודל המדגם. בעיה זו נדונה בפרק. 17. בשלב החמישי, החוקר צריך לבחור בפועל את האלמנטים שיעברו לסקר. השיטה המשמשת לכך נקבעת לפי סוג המדגם הנבחר; כאשר דנים בשיטות דגימה, נדבר גם על בחירת המרכיבים שלה. ולבסוף, החוקר צריך לבחון בפועל את המשיבים שזוהו. בשלב זה ישנה סבירות גבוהה לביצוע מספר טעויות.
בעיות אלו וכמה שיטות לפתרון שלהן נדונות בפרק. 18.

סוגי תוכניות דגימה (דגימה)

ניתן לחלק את כל שיטות הדגימה לשתי קטגוריות: תצפית על מדגמי הסתברות ותצפית על מדגמים דטרמיניסטיים. במדגם הסתברותי, כל אחד מבני האוכלוסייה יכול להיכלל בהסתברות מסוימת שאינה אפס. ההסתברות לכלול בני אוכלוסייה מסוימים במדגם עשויה להיות שונה, אך ההסתברות לכלול בו כל מרכיב ידועה. הסתברות זו נקבעת על ידי הליך מכני מיוחד המשמש לבחירת חברי המדגם.

עבור מדגמים דטרמיניסטיים, הערכת ההסתברות לכלול אלמנט כלשהו במדגם הופכת לבלתי אפשרית. לא ניתן להבטיח ייצוגיות של מדגם כזה. לדוגמה, Allstate Corporationפיתחה מערכת לעיבוד נתונים על תביעות עבור פיצויי ביטוח 14 מיליון משקי בית (לקוחותיהם). החברה מתכננת להשתמש בנתונים אלה כדי לקבוע דפוסי ביקוש לשירותיה, כמו הסבירות שמשק בית שבבעלותו מרצדס בנץ יהיה בעל גם בית נופש (שידרוש ביטוח). למרות שמאגר הנתונים גדול מאוד, לחברה אין אמצעים להעריך את הסבירות שלקוח מסוים יגיש תביעה. החברה אינה יכולה אפוא להיות בטוחה כי נתוני הלקוחות המעוררים את התביעה מייצגים את כלל לקוחות החברה; ובמידה פחותה עוד יותר - ביחס ללקוחות פוטנציאליים.

כל המדגמים הדטרמיניסטיים מבוססים על העמדה האישית, שיקול הדעת או ההעדפה של החוקר, ולא על הליך בחירה מכאני של חברי המדגם. העדפות כאלה יכולות לפעמים לתת ציונים טוביםעם זאת, מאפייני האוכלוסייה, אין דרך לקבוע באופן אובייקטיבי את עמידתו של המדגם במשימה. הערכה של דיוק תוצאות המדגם יכולה להיעשות רק אם ההסתברויות לבחירת אלמנטים מסוימים היו ידועות. מסיבה זו, עבודה עם דגימת הסתברות נחשבת בדרך כלל כשיטה טובה יותר להערכת גודל טעות הדגימה. ניתן גם לחלק דגימות לדגימות בגודל קבוע ולדגימות עוקבות. בעבודה עם מדגמים בגודל קבוע, גודל המדגם נקבע לפני תחילת הסקר, ולניתוח התוצאות מקדימה איסוף כל הנתונים הדרושים. אנו נתעניין בעיקר בדגימות בגודל קבוע, מכיוון שסוג זה משמש בדרך כלל במחקר שיווקי.

דגימת הסתברות
מדגם שבו ניתן לכלול כל מרכיב באוכלוסייה בהסתברות ידועה שאינה אפס.
דגימה דטרמיניסטית
דגימה המבוססת על העדפות מסוימות או שיפוטיות שקובעות את הבחירה של אלמנטים מסוימים; יחד עם זאת, לא ניתן להעריך את ההסתברות לכלול מרכיב שרירותי של האוכלוסייה במדגם.

עם זאת, אין לשכוח שישנן גם דוגמאות עוקבות שניתן להשתמש בהן עם כל אחד מעיצובי הדגימה הבסיסיים הנידונים להלן.

במדגם עוקב, מספר האלמנטים שנבחרו אינו ידוע מראש, הוא נקבע על סמך סדרה של החלטות עוקבות. אם סקר של מדגם קטן אינו מוביל לתוצאה מהימנה, מורחב מגוון האלמנטים שיש לבחון. אם התוצאה נשארת לא חד משמעית לאחר מכן, גודל המדגם גדל שוב. בכל שלב מתקבלת החלטה האם לראות בתוצאה שהתקבלה מספיק משכנעת או להמשיך באיסוף נתונים. עבודה עם דגימה רציפה מאפשרת להעריך את המגמה (מגמת השינוי) של הנתונים תוך כדי איסוף, מה שמפחית את העלויות הכרוכות בתצפיות נוספות במקרים בהם כדאיותם עולה בתוהו.

תוכניות דגימה הסתברותיות ודטרמיניסטיות מתחלקות למספר סוגים. לדוגמה, דגימות דטרמיניסטיות יכולות להיות לא מייצגות (נוחות), מכוונות או מכסות; דגימות הסתברותיות מחולקות לאקראיות פשוטות, מרובדות או קבוצתיות (אשכול), הן, בתורן, יכולות להיות מחולקות לתת-סוגים. על איור. איור 15.3 מציג את סוגי הדגימות שיידונו בפרק זה ובפרק הבא.

מדגם קבוע (מדגם קבוע)
מדגם שגודלו נקבע אפריורי; המידע הנדרש נקבע על ידי האלמנטים שנבחרו.
דגימה רציפה
מדגם שנוצר על בסיס סדרה של החלטות עוקבות. אם, לאחר בחינת מדגם קטן, התוצאה אינה חד משמעית, מדגם גדול יותר נחשב; אם שלב זה אינו מוביל לתוצאה, גודל המדגם גדל שוב וכו'. כך, בכל שלב, מתקבלת החלטה האם התוצאה המתקבלת יכולה להיחשב משכנעת מספיק.

יש לזכור שניתן לשלב את סוגי הדגימות הבסיסיים ליצירת תוכניות דגימה מורכבות יותר. אם תלמד את הסוגים הראשוניים הבסיסיים שלהם, יהיה לך קל יותר להתמודד עם שילובים מורכבים יותר.

בחירות דטרמיניסטיות

כפי שכבר צוין, בעת בחירת מרכיבים ממדגם דטרמיניסטי, להערכות או החלטות פרטיות יש תפקיד מכריע. לעיתים הערכות אלו מגיעות מהחוקר, בעוד שבמקרים אחרים בחירת מרכיבי האוכלוסייה ניתנת לצוותי השטח. מכיוון שהאלמנטים אינם נבחרים באופן מכאני, לא ניתן לקבוע את ההסתברות לכלול אלמנט שרירותי במדגם, ובהתאם, את טעות הדגימה. אי ידיעת השגיאה עקב הליך הדגימה שנבחר מונעת מהחוקרים להעריך את דיוק ההערכות שלהם.

דוגמאות לא מייצגות (נוחות).

דוגמאות לא מייצגות (נוחות).מכונה לפעמים אקראית, מאחר שהבחירה של רכיבי מדגם מתבצעת בצורה "אקראית" - נבחרים אותם אלמנטים שנראים או נראים הנגישים ביותר במהלך תקופת הבחירה.

שֶׁלָנוּ חיי היום - יוםגדוש בדוגמאות לבחירות כאלה. אנו משוחחים עם חברים ועל סמך תגובותיהם ועמדותיהם אנו מסיקים מסקנות לגבי הנטיות הפוליטיות הרווחות בחברה; תחנת רדיו מקומית מעודדת אנשים להביע את דעתם בנושא שנוי במחלוקת, דעתם מתפרשת כרווחת; אנו קוראים לשיתוף פעולה של מתנדבים ועובדים עם המתנדבים לעזור לנו. הבעיה עם מדגמי נוחות ברורה - אנחנו לא יכולים להיות בטוחים שמדגמים מהסוג הזה אכן מייצגים את אוכלוסיית היעד. שדעת חברינו משקפת נכונה דעות פוליטיותהרווח בחברה, אנחנו עדיין יכולים לפקפק, אבל לעתים קרובות אנחנו רוצים להאמין שמדגמים גדולים יותר, שנבחרו באופן דומה, הם מייצגים. הבה נראה את הכשל של הנחה כזו באמצעות דוגמה.
לפני מספר שנים ערכה אחת מתחנות הטלוויזיה המקומיות בעיר שבה מתגורר מחבר ספר זה סקר דעת קהל יומי בנושאים המעניינים את הקהילה המקומית. הסקרים, שנקראו "The Madison Pulse", נערכו באופן הבא. מדי ערב במהלך חדשות השעה שש, התחנה שאלה את הצופים שאלה בנוגע לנושא ספציפי שנוי במחלוקת, עליה היה צורך לתת תשובה חיובית או שלילית.

במקרה של תשובה חיובית, היה צורך להתקשר לאחד, במקרה של תשובה שלילית - למספר טלפון אחר. מספר הקולות "בעד" ו"נגד" נספר אוטומטית. מהדורת החדשות של השעה עשר דיווחה על תוצאות הסקר הטלפוני. מדי ערב התקשרו לאולפן בין 500 ל-1000 איש כדי להביע את עמדתם בנושא זה או אחר; פרשן הטלוויזיה פירש את תוצאות הסקר כדעה הרווחת בחברה.

מדגם לא מייצג (נוחות).
לפעמים נקרא אקראי, מכיוון שהבחירה של רכיבי הדגימה מתבצעת בצורה "אקראית" - נבחרים אותם אלמנטים שהם או נראים הנגישים ביותר במהלך תקופת הבחירה.

באחד מהפרקים בני שש השעות, נשאלו הצופים את השאלה הבאה: "אתה לא חושב שצריך להוריד את גיל השתייה במדיסון ל-18?" ההסמכה המשפטית הקיימת תואמת ל-21 שנים. הקהל הגיב לשאלה זו בפעילות יוצאת דופן - כמעט 4,000 איש התקשרו לאולפן באותו ערב, מתוכם 78% בעד הורדת הגבלת הגיל. נראה ברור שמדגם של 4,000 "צריך להיות מייצג" של קהילה של 180,000. שום דבר כזה. כפי שאולי ניחשתם, קבוצות גיל מסוימות התעניינו בתוצאה ידועה יותר מאחרות. לפיכך, לא היה זה מפתיע שבדיון בנושא זה כמה שבועות לאחר מכן, התברר שבמשך הזמן שהוקצב לסקר, פעלו התלמידים בתיאום. הם התקשרו לטלוויזיה בתורם, כל אחד כמה פעמים. לפיכך, לא גודל המדגם ולא אחוז התומכים לליברליזציה של החוק לא היו מפתיעים. המדגם לא היה מייצג.

עצם הגדלת גודל המדגם לא הופכת אותו למייצג. הייצוגיות של המדגם מובטחת לא על ידי הגודל, אלא על ידי ההליך הנכון לבחירת אלמנטים. כאשר משתתפי הסקר נבחרים מרצון או פריטי מדגם נבחרים על בסיס זמינותם, תוכנית הדגימה אינה מבטיחה ייצוגיות של המדגם. עדויות אמפיריות מצביעות על כך שדגימות שנבחרו מטעמי נוחות אינן מייצגות לעתים רחוקות (ללא קשר לגודלן). סקרים טלפוניים, שקובעים 800-900 הצבעות, הם הצורה הנפוצה ביותר של מדגמים גדולים אך לא מייצגים.

דגימה מכוונת
דגימה דטרמיניסטית (ממוקדת), שמרכיביה נבחרים באופן ידני; נבחרים אותם מרכיבים שלדעת החוקר עומדים במטרות הסקר.
דגימה מכוונת, בהתאם ליכולתו של החוקר להגדיר את מערך הנשאלים הראשוני עם המאפיינים הרצויים; אז המשיבים האלה משמשים כמודיעים שקובעים את הבחירה הנוספת של פרטים.

לרוע המזל, אנשים רבים מתייחסים בביטחון לתוצאות של סקרים כאלה. אחת הדוגמאות האופייניות ביותר לשימוש בדגימות לא מייצגות במחקר שיווק בינלאומי היא סקר מדינות מסוימות המבוסס על מדגם המורכב מזרים המתגוררים ב הרגע הזהבשטח המדינה שיזמה את הסקר (למשל סקנדינבים המתגוררים בארה"ב). למרות שמדגמים כאלה עשויים לשפוך אור על היבטים מסוימים של האוכלוסייה הנבדקת, יש לזכור שאנשים אלה מייצגים בדרך כלל אליטה "אמריקנית", שהקשר שלה עם ארצם עשוי להיות שרירותי למדי. השימוש במדגמים לא מייצגים אינו מומלץ עבור סקרים תיאוריים או סיבתיים. הם מותרים רק במחקר חקרני שמטרתו לבדוק רעיונות או רעיונות מסוימים, אך גם במקרה זה עדיף להשתמש בדגימות מכוונות.

בחירות מכוונות

דגימות מכוונות נקראות לפעמים לא ממוקד; המרכיבים שלהם, שלדעת החוקר עומדים במטרות המחקר, נבחרים באופן ידני. פרוקטר אנד גמבלהשתמש בשיטה זו בעת הצגת מודעות לאנשים בגילאי 13 עד 17 המתגוררים ליד המטה שלה בסינסינטי. חלוקת החברה מוצרי מזוןומשקאות שכרו את הקבוצה הזו של בני נוער לשמש מעין מדגם של צרכנים. הם עבדו 10 שעות בשבוע בתמורה ל-1,000 דולר והלכו להופעה, צפו בפרסומות בטלוויזיה, ביקרו בסופרמרקטים עם מנהלי חברות כדי לצפות בתצוגות מוצרים, בדקו מוצרים חדשים ודנו בהתנהגות קנייה. על ידי בחירת נציגים למדגם בתהליך של "גיוס עובדים" ולא אקראי, חברה יכולה להתמקד בתכונות שנחשבות לה מועילות, כמו יכולתו של נער להביע את עצמו בבהירות, תוך סיכון שהשקפותיו אינן מייצגות את גילו. קְבוּצָה.

כפי שכבר הוזכר, המאפיין המבחין של דגימה מכוונת הוא הבחירה הכיוונית של האלמנטים שלה. במקרים מסוימים, פריטים לדוגמה נבחרים לא בגלל שהם מייצגים, אלא בגלל שהם יכולים לספק לחוקרים מידע שמעניין אותם. כאשר בית המשפט מונחה בעדותו של מומחה, הוא, במובן מסוים, פונה לשימוש בבחירה מכוונת. עמדה דומה עשויה לשלוט בפיתוח פרויקטי מחקר. במהלך המחקר הראשוני של הנושא, החוקר מתעניין בעיקר בקביעת הסיכויים למחקר, הקובע את בחירת מרכיבי המדגם.

דגימת כדורי שלגהוא סוג של דגימה מכוונת המשמשת כאשר עוסקים בסוגים ספציפיים של אוכלוסיות. מדגם זה תלוי ביכולתו של החוקר לציין קבוצה ראשונית של נשאלים עם המאפיינים הרצויים. המשיבים הללו משמשים אז כמודיעים כדי לקבוע בחירה נוספת של אנשים.

תארו לעצמכם, למשל, שחברה רוצה להעריך את הצורך במוצר שיאפשר לחירשים לתקשר בטלפון. חוקרים יכולים להתחיל לפתח בעיה זו על ידי זיהוי דמויות מפתח בקהילת החירשים; האחרון יכול למנות חברים אחרים בקבוצה שיסכימו להשתתף בסקר. עם הטקטיקה הזו, המדגם צומח כמו כדור שלג.

בעוד החוקר נמצא בשלבים ראשוניים של פתרון בעיות, כאשר נקבעים הסיכויים והמגבלות האפשריות של הסקר המתוכנן, השימוש בדגימה מכוונת יכול להיות יעיל מאוד. אבל בשום מקרה אסור לנו לשכוח חולשותדגימות מסוג זה, שכן הן יכולות לשמש גם את החוקר במחקרים תיאוריים או סיבתיים, אשר לא יאטו להשפיע על איכות התוצאות שלהם. דוגמה קלאסית לשכחה זו היא מדד המחירים לצרכן ("CPI"). כפי שסודמן מציין ( סודמן): "מדד המחירים לצרכן נקבע רק עבור 56 ערים ומטרופולינים, שהבחירה בהם מושפעת גם מהגורם הפוליטי. למעשה, ערים אלו יכולות לייצג רק את עצמן, בעוד המדד נקרא מדד המחירים לצרכן לאזרחים המקבלים לפי שעה שכר *, ו עובדיםונראה לרוב האנשים כמדד המשקף את רמת המחירים בכל אזור בארצות הברית. גם הבחירה בחנויות קמעונאיות נעשית באופן לא אקראי, וכתוצאה מכך הערכה של טעות דגימה אפשרית הופכת לבלתי אפשרית» (הניטה שלנו) 2 .

* כלומר עובדים. - הערה. לְכָל.

דגימות מכסות

הסוג השלישי של דגימה דטרמיניסטית - דגימות מכסה; הייצוגיות הידועה שלו מושגת על ידי הכללת בו אותו שיעור של אלמנטים בעלי מאפיינים מסוימים כמו באוכלוסייה הנסקרת (ראה "חלון מחקר 15.1"). כדוגמה, שקול לנסות ליצור מדגם מייצג של סטודנטים החיים בקמפוס. אם אין סטודנט בכיר אחד במדגם מסוים של 500 פרטים, תהיה לנו הזכות לפקפק בייצוגיותו ובתקפות יישום התוצאות שהתקבלו במדגם זה על האוכלוסייה הנחקרת. בעבודה עם דגימה פרופורציונלית, החוקר יכול לוודא ששיעור הסטודנטים לתואר ראשון במדגם מתאים לשיעורם בסך הסטודנטים.

נניח שחוקר עורך מחקר סלקטיבי על סטודנטים באוניברסיטאות, תוך שהוא מעוניין בכך שהמדגם משקף לא רק את השתייכותם למגדר זה או אחר, אלא גם את התפלגותם לפי קורסים. תנו למספר הסטודנטים הכולל להיות 10,000: 3,200 סטודנטים א', 2,600 סטודנטים ב', 2,200 סטודנטים שנה ג' ו- 2,000 סטודנטים שנה ד'; מתוכם 7,000 בנים ו-3,000 בנות. עבור מדגם של 1,000 איש, תוכנית הדגימה היחסית דורשת 320 סטודנטים א', 260 סטודנטים ב', 220 שנה ג' ו-200 בוגרים, 700 בנים ו-300 בנות. החוקר יכול ליישם תוכנית זו על ידי מתן לכל מראיין מכסה מסוימת, שתקבע לאילו תלמידים עליו לפנות.

דגימת מכסותמדגם דטרמיניסטי שנבחר באופן ששיעורם של מרכיבי המדגם בעלי מאפיינים מסוימים תואם בקירוב לשיעורם של אותם יסודות באוכלוסייה הנחקרת; לכל עובד שטח נקבעת מכסה הקובעת את מאפייני האוכלוסייה עמה עליו לפנות.

ניתן להורות למראיין שאמור לערוך 20 ראיונות לשאול:

            • שישה תלמידי שנה א' - חמישה בנים ובת אחת;
            • שישה מחזורים ב' - ארבעה בנים ושתי בנות;
            • ארבעה תלמידי שנה ג' - שלושה בנים ובת אחת;
            • תלמידי שנה ד' - שני בנים ושתי בנות.

שימו לב, בחירת מרכיבי המדגם הספציפיים אינה נקבעת על פי תכנית המחקר, אלא על פי בחירתו של המראיין, הנקרא לעמוד רק בתנאים שנקבעו במכסה: ראיון חמישה סטודנטים טריים, סטודנט טרי וכו'.

שימו לב גם שמכסה זו משקפת במדויק את ההתפלגות המגדרית של אוכלוסיית הסטודנטים, אך מעוותת במידת מה את התפלגות התלמידים בין הקורסים; 70% (14 מתוך 20) ראיונות הם עם בנים, אך רק 30% (6 מתוך 20) עם סטודנטים בשנה א', בעוד שהם מהווים 32% מכלל הסטודנטים. המכסה המוקצה לכל מראיין אינדיבידואלי עשויה שלא, ובדרך כלל, לא משקפת את התפלגות מאפייני השליטה באוכלוסייה - רק המדגם הסופי צריך להיות פרופורציונלי.

יש לזכור כי דגימה פרופורציונלית תלויה יותר בעמדות או שיקולים אישיים סובייקטיביים מאשר בהליך דגימה אובייקטיבי. יתרה מכך, בניגוד לדגימה מכוונת, השיפוט האישי כאן אינו שייך ליזם הפרויקט, אלא למראיין. נשאלת השאלה האם מדגמים פרופורציונליים יכולים להיחשב מייצגים, גם אם הם משחזרים את היחס בין המרכיבים הטבועים באוכלוסייה שיש להם מאפייני בקרה מסוימים. בעניין זה יש להעיר שלוש הערות.

ראשית, המדגם עשוי להיות שונה מהאוכלוסייה בכמה מאפיינים חשובים אחרים, שיכולים להיות בעלי השפעה רצינית על התוצאה. לדוגמה, אם המחקר מוקדש לבעיית הדעות הקדומות הגזעיות הקיימות בסביבת הסטודנטים, נסיבות שאינן אדישות עשויות להתברר כמקום שממנו הגיעו הנשאלים: מהעיר או מהעיר. כפר. מכיוון שלא נקבעה המכסה של המאפיין "מהעיר/כפרי", ייצוג מדויק של מאפיין זה הופך להיות בלתי סביר. כמובן, יש אלטרנטיבה כזו: להגדיר מכסות לכל המאפיינים בעלי פוטנציאל משמעותי. עם זאת, עלייה במספר מאפייני הבקרה מובילה לסיבוך של המפרט. זה, בתורו, מסבך - ולפעמים אף הופך את זה לבלתי אפשרי - את בחירת האלמנטים לדוגמא וממילא מביא לעליית מחירו. אם, למשל, השתייכות עירונית או כפרית ומעמד סוציואקונומי רלוונטיים גם הם למחקר, אזי המראיין יצטרך לחפש סטודנט שנה א' שהוא עירוני ומעמד גבוה או בינוני. אני מסכים שלמצוא רק גבר טרי זה הרבה יותר קל.

שנית, קשה מאוד לוודא שהמדגם הזה באמת מייצג. כמובן שניתן לבדוק במדגם האם התפלגות המאפיינים שאינם כלולים בבקרה, התפלגותם באוכלוסיה. עם זאת, בדיקה כזו יכולה להוביל רק למסקנות שליליות. אפשר לחשוף רק את הפער בין ההתפלגויות. אם ההתפלגויות של המדגם והאוכלוסייה עבור כל אחד מהמאפיינים הללו חוזרות זו על זו, קיימת אפשרות שהמדגם שונה מהאוכלוסייה בתכונה אחרת, שאינה מוגדרת במפורש.

ולבסוף, שלישית. מראיינים, כשהם משאירים לנפשם, נוטים לפעולות מסוימות. לעתים קרובות מדי הם פונים לחקור את חבריהם. מכיוון שלעתים קרובות הם מתגלים כמו המראיינים עצמם, קיימת סכנה לטעות. עדויות מאנגליה מצביעות על כך שדגימות מכסות נוטות:

  1. הגזמה בתפקידם של האלמנטים הנגישים ביותר;
  2. הפחתת תפקידן של משפחות קטנות;
  3. הגזמה בתפקידן של משפחות עם ילדים;
  4. הפחתת תפקידם של עובדי התעשייה;
  5. הפחתת תפקידם של בעלי ההכנסה הגבוהה והנמוכה ביותר;
  6. הפחתת תפקידם של אזרחים בעלי השכלה נמוכה;
  7. מפחית את תפקידם של אנשים בעלי עמדה חברתית נמוכה.
מראיינים שבוחרים במכסות קבועות מראש על ידי עצירת עוברי אורח אקראיים, צפויים להתמקד באזורים עם מספר רב של מגיבים פוטנציאליים, כמו קניונים, תחנות רכבתושדות תעופה, כניסות לסופרמרקטים גדולים וכדומה. נוהג זה מוביל לייצוג יתר של אותן קבוצות של אנשים המבקרים במקומות כאלה לרוב. כאשר נדרשים ביקורי בית, המראיינים מונעים לעתים קרובות על ידי נוחות.
למשל, הם עשויים לערוך סקרים רק במהלך היום, מה שמוביל לחוסר הערכה של דעתם של העובדים. בין היתר לא נכנסים למבנים רעועים וככלל לא עולים לקומות העליונות של בניינים שאין בהם מעליות.

בהתאם לפרטי הבעיה הנבדקת, נטיות אלו עלולות להוביל לסוגים שונים של שגיאות, אך תיקון שלהן בשלב ניתוח הנתונים נראה מאוד מאוד קשה. מצד שני, בבחירה אובייקטיבית של מרכיבי מדגם, עומדים לרשות החוקרים כלים מסוימים המאפשרים לפשט את ההליך להערכת הייצוגיות של מדגם נתון. בעת ניתוח בעיית הייצוגיות של דגימות כאלה, החוקר מתייחס לא כל כך בהרכב המדגם אלא בהליך בחירת המרכיבים שלו.

חלון מחקר: מבריק! אבל מי יקרא את זה?

מדי שנה, מפרסמים מוציאים מיליוני דולרים על מודעות המופיעות בדפי אינספור פרסומים מעידן הפרסום ועד היאנקי. הערכה מסוימת של הטקסט והתמונה יכולה להיעשות לפני פרסומו, כמו שאומרים, בבית, במשרד פרסום; זה לא באמת נבדק ונשפט עד לאחר פרסום המודעה, מוקף בעשרות מודעות מעוצבות בקפידה באותה מידה שמתחרות על תשומת לב הקורא.

חֶברָה עמילן רופר ברחבי העולםמעריך את יכולת הקריאה של פרסומות המוצגות במגזינים ובעיתונים לצרכנים, עסקים, מסחר ומקצועיים. תוצאות המחקר מובאות לידיעת המפרסמים והסוכנויות - כמובן בתשלום הולם. מכיוון שמפרסמים עושים מאמצים רבים מדי יום כדי להעביר את המודעות שלהם לצרכן, החברה עֲמִילָןהחליטה ליצור מדגם שייתן למנויים מידע בזמן ומדויק על יעילות הפרסום. כל שנה החברה עֲמִילָןראיין יותר מ-50,000 אנשים, תוך כדי התחשבות בכ-20,000 פרסומות. כ-500 פרסומים בודדים נחקרו מדי שנה.

עמילן השתמש בדגימה פרופורציונלית, עם מינימום של 100 קוראים ממין אחד ו-100 קוראים מהמין השני. עמילן הגיע למסקנה שעם גודל המדגם הזה, הסטיות העיקריות ברמת הקריאות התייצבו. קוראים מעל גיל 18 רואיינו באופן אישי, וכל הפרסומים נשקלו, למעט אלו המיועדים לאוכלוסיות מיוחדות (נניח, נערות בגיל המתאים רואיינו להערכת פרסומים ממגזין Seventeen).

בעת ביצוע סקרים, אזור התפוצה של פרסום מסוים נלקח בחשבון. נניח שהמחקר של מגזין לוס אנג'לס בחן קוראים המתגוררים בדרום קליפורניה. "זמן" נחקר בפריסה ארצית. הסקר הוקדש לגיליונות בודדים של המגזין ונערך ב-20-30 ערים במקביל.

לכל מראיין ניתנה מכסה קטנה של ראיונות, ששימשה את המטרה של צמצום השונות של תוצאות הסקר. שאלונים חולקו בין אנשים ממקצועות וגילאים שונים עם הכנסה שונה. כל מחקר כזה איפשר להציג עמדות בפני קהל קוראים רחב למדי. כאשר שוקלים מספר פרסומים מקצועיים, עסקיים ותעשייתיים, נלקחו בחשבון גם הפרטים של המנוי וההפצה שלהם. רשימות מנויים שהוקדשו לפרסומים בעלי תפוצה מצומצמת למדי אפשרו לבחור מגיבים מקובלים.

בכל סקר, המראיינים ביקשו מהמשיבים לעיין בפרסום ושאלו אם הבחינו במודעה כלשהי. אם התשובה הייתה חיובית, הרשם שאל שורה של שאלות להערכת מידת קבלת הפרסומת.

הערכה זו יכולה להיות משולשת:

  • שימו לב: מי שכבר שם לב לעצם הופעתה של הודעה כזו.
  • מכירים: מי שזכר חלק כלשהו בפרסומת, שעסק בסימן המסחרי או המפרסם המפורסם.
  • קראו: אנשים שקוראים לפחות מחצית מהפרסומת.

לאחר שסקרו את כל המודעות, המראיינים רשמו מידע סיווג מרכזי: מגדר, גיל, עיסוק, מצב משפחתי, לאום, הכנסה, גודל המשפחה והרכב המשפחה, מה שאיפשר הצלבה של מידת עניין הקוראים.

בשימוש נכון, נתוני החברה עֲמִילָןלאפשר למפרסמים ולסוכנויות לזהות הן סוגים לא מוצלחים והן סוגים מוצלחים של תוכניות פרסום שמושכות ומחזיקות את תשומת הלב של הקורא. מידע מסוג זה הוא בעל ערך רב עבור מפרסמים שמתעניינים בעיקר ביעילות מסע הפרסום שלהם.

מקור: Roper Starch Worldwide, Mamaronek, NY 10543.

דגימות הסתברות

החוקר יכול לקבוע את ההסתברות לכלול כל מרכיב מהאוכלוסייה במדגם ההסתברות, שכן בחירת המרכיבים שלו מתבצעת על בסיס תהליך אובייקטיבי כלשהו ואינה תלויה בגחמות ובנטיות של החוקר או עובד השטח. מאחר שהליך בחירת האלמנטים הוא אובייקטיבי, החוקר יכול להעריך את מהימנות התוצאות שהתקבלו, דבר שהיה בלתי אפשרי במקרה של מדגמים דטרמיניסטיים, לא משנה עד כמה הבחירה של האלמנטים של האחרונים הייתה זהירה.

אין לחשוב שמדגמים הסתברותיים הם תמיד מייצגים יותר מאלה דטרמיניסטיים. למעשה, מדגם דטרמיניסטי עשוי להיות גם מייצג יותר. היתרון של מדגמי הסתברות הוא שהם מאפשרים אומדן של טעות הדגימה הפוטנציאלית. אם החוקר עובד עם מדגם דטרמיניסטי, אין לו שיטה אובייקטיבית להערכת התאמתו למטרות המחקר.

דגימה אקראית פשוטה

רוב האנשים נתקלים בדגימות אקראיות פשוטות בדרך זו או אחרת, בין אם במסגרת קורס סטטיסטיקה במכון, או בקריאה על תוצאות מחקרים רלוונטיים בעיתונים או במגזינים. במדגם אקראי פשוט, לכל אלמנט שנכלל במדגם יש אותה הסתברות נתונה להיות בין המרכיבים הנבדקים, וכל שילוב של אלמנטים באוכלוסיה המקורית יכול להפוך למדגם. לדוגמה, אם אנחנו רוצים לצייר מדגם אקראי פשוט של כל הסטודנטים הרשומים למכללה מסוימת, אנחנו רק צריכים לעשות רשימה של כל הסטודנטים, להקצות מספר לכל שם שבו, ולהשתמש במחשב כדי לבחור באקראי נתון. מספר אלמנטים.

אוּכְלוֹסִיָה

אוּכְלוֹסִיָה
קבוצה של אלמנטים העומדים בתנאים מסוימים שצוינו; נקראת גם אוכלוסיית המחקר (המטרה).
פָּרָמֶטֶר
מאפיין או אינדיקטור מסוים של האוכלוסייה הכללית או הנחקרת.

כללי, או למד, סטהוא האוסף שממנו מתבצעת הבחירה. ניתן לתאר אוכלוסייה (אוכלוסיה) זו על ידי מספר פרמטרים ספציפיים שהם מאפיינים של האוכלוסייה הכללית, שכל אחד מהם מהווה מדד כמותי מסוים המבדיל אוכלוסייה אחת לאחרת.

תארו לעצמכם שהאוכלוסייה הנחקרת היא כל האוכלוסייה הבוגרת של סינסינטי. לתיאור אוכלוסייה זו ניתן להשתמש במספר פרמטרים: גיל ממוצע, שיעור האוכלוסייה עם השכלה גבוהה, רמת הכנסה וכו' שימו לב שלכל האינדיקטורים הללו יש ערך קבוע מסוים. כמובן, נוכל לחשב אותם על ידי ביצוע מפקד אוכלוסין שלם של האוכלוסייה הנחקרת. עם זאת, בדרך כלל אנו לא מסתמכים על ההסמכה, אלא על המדגם אנו בוחרים ומשתמשים בערכים שהתקבלו במהלך תצפית סלקטיבית כדי לקבוע את הפרמטרים הנדרשים של האוכלוסייה.

אנו מדגים את מה שנאמר בטבלה. 15.1 דוגמה לאוכלוסייה היפותטית של 20 אנשים. לעבודה עם אוכלוסייה היפותטית קטנה כמו זו יש מספר יתרונות. ראשית, גודל המדגם הקטן מקל על חישוב פרמטרי האוכלוסייה שניתן להשתמש בהם כדי לתאר אותו. שנית, נפח זה מאפשר לך להבין מה יכול לקרות כאשר מאמצים תוכנית דגימה מסוימת. שתי התכונות הללו מקלות על השוואה בין תוצאות המדגם ל"אמת" ובמקרה זה ערך ידועסט, שלא ניתן לומר על מצב טיפוסי בו הערך האמיתי של הסט אינו ידוע. השוואת השומה עם הערך "האמיתי" במקרה זה מקבלת בהירות מיוחדת.

נניח שאנו רוצים להעריך, מתוך שני פריטים שנבחרו באקראי, את ההכנסה הממוצעת של פרטים באוכלוסייה המקורית. ההכנסה הממוצעת תהיה הפרמטר שלו. כדי להעריך את הערך הממוצע הזה, אותו אנו מייעדים כ-μ, עלינו לחלק את סכום כל הערכים במספרם:

ממוצע אוכלוסיה μ = סכום רכיבי אוכלוסייה / מספר אלמנטים.

במקרה שלנו, החישובים נותנים:

אוכלוסיה נגזרת

אוכלוסיה נגזרתמורכב מכל המדגמים האפשריים שניתן לבחור מהאוכלוסייה הכללית לפי תכנית דגימה נתונה (תכנית דגימה). סטָטִיסטִיקָההוא מאפיין, או אינדיקטור, של המדגם. הערך הסטטיסטי המדגם משמש להערכת פרמטר אוכלוסייה מסוים. מדגמים שונים מספקים נתונים סטטיסטיים או הערכות שונות עבור אותו פרמטר אוכלוסייה.

אוכלוסיה נגזרת
מערך כל המדגמים האפשריים להבחנה שניתן לבחור מהאוכלוסייה הכללית על פי תוכנית דגימה נתונה. סטטיסטיקה מאפיין או מדד של מדגם.

שקול את הסט הנגזר של כל המדגמים האפשריים שניתן לבחור מתוך האוכלוסייה ההיפותטית שלנו של 20 פרטים על ידי תוכנית דגימה שמניחה שגודל המדגם הוא n=2ניתן להשיג על ידי בחירה אקראית שאינה חוזרת על עצמה.

נניח לרגע שהנתונים של כל יחידת אוכלוסייה - במקרה שלנו, שמו והכנסתו של אדם - כתובים על עיגולים, ולאחר מכן מורידים אותם לקנקן ומערבבים אותם. החוקר מסיר עיגול אחד מהכד, מוחק ממנו מידע ומניח אותו בצד. הוא עושה את אותו הדבר עם הספל השני שנלקח מהכד. לאחר מכן מחזיר החוקר את שני הספלים לקנקן, מערבב את תוכנו וחוזר על אותו רצף של פעולות. בשולחן. 15.2 מציג את התוצאות האפשריות של ההליך הנקוב. עבור 20 מעגלים, 190 שילובי זוגות כאלה אפשריים.

עבור כל שילוב, אתה יכול לחשב את ההכנסה הממוצעת. נניח לדגימה AB (k= 1)

ק-e Sample Mean = סכום הדגימות / מספר הדגימות =

על איור. 15.4 מציג את אומדן ההכנסה הממוצעת לכלל האוכלוסייה ואת כמות הטעות עבור כל אומדן עבור המדגמים k = 25, 62,108,147ו 189 .

לפני שנמשיך לשקול את הקשר בין ההכנסה הממוצעת של המדגם (סטטיסטיקה) לממוצע ההכנסה של האוכלוסייה (פרמטר שצריך להעריך), נגיד כמה מילים על האוכלוסייה הנגזרת. ראשית, בפועל אנחנו לא מרכיבים אגרגטים מהסוג הזה. זה ידרוש יותר מדי זמן ומאמץ. המתרגל מוגבל להרכבת מדגם אחד בלבד בגודל הנדרש. החוקר משתמש מוּשָׂגאוכלוסייה נגזרת והתפיסה הקשורה בהתפלגות הדגימה בעת גיבוש מסקנות סופיות.

כיצד יוצג להלן. שנית, יש לזכור שאוכלוסיה נגזרת מוגדרת כמכלול כל המדגמים השונים האפשריים שניתן לבחור מתוך האוכלוסייה הכללית לפי תכנית דגימה נתונה. כאשר חלק כלשהו בתוכנית הדגימה משתנה, האוכלוסייה הנגזרת משתנה גם היא. לכן, אם, בעת בחירת עיגולים, החוקר מחזיר את הראשון מהדיסקים שהוסרו לקנקן לפני הסרת השני, הסט הנגזר יכלול.

דגימות AA, BB וכו'. אם מספר הדגימות שאינן חוזרות הוא 3 במקום 2, יהיו דגימות מסוג ABC, ויהיו 1140 מהן, לא 190, כפי שהיה במקרה הקודם. כאשר בחירה אקראית פשוטה משתנה לכל שיטה אחרת לקביעת מרכיבי המדגם, גם האוכלוסייה הנגזרת משתנה.

יש לזכור גם שהבחירה של מדגם בגודל נתון מהאוכלוסייה הכללית שווה ערך לבחירה של מרכיב אחד (1 מתוך 190) מהאוכלוסייה הנגזרת. עובדה זו מאפשרת לנו להסיק מסקנות סטטיסטיות רבות.

ממוצע מדגם וממוצע כללי

האם נוכל להשוות את ממוצע המדגם לממוצע האוכלוסייה האמיתי? בכל מקרה, אנחנו יוצאים מהעובדה שהם קשורים זה בזה. עם זאת, אנו גם מאמינים שתהיה טעות. כך למשל, ניתן להניח שהמידע שיתקבל ממשתמשי האינטרנט יהיה שונה באופן משמעותי מתוצאות סקר של האוכלוסייה ה"רגילה". במקרים אחרים, אנו יכולים להניח התאמה מדויקת למדי, אחרת לא נוכל להשתמש בערך המדגם כדי להעריך את הערך של הערך הכללי. אבל כמה גדולה יכולה להיות הטעות שאנו עושים בכך?

בואו נחבר את כל האמצעים לדוגמה הכלולים בטבלה. 15.2, ונחלק את הסכום המתקבל במספר הדגימות, כלומר, בוא נעשה ממוצע של הממוצעים.
נקבל את התוצאה הבאה:

זה עולה בקנה אחד עם הערך הממוצע של האוכלוסייה הכללית. אומרים שבמקרה הזה אנחנו עוסקים סטטיסטיקה חסרת פניות.

סטטיסטיקה נקראת לא מוטה אם הממוצע שלו על פני כל המדגמים האפשריים שווה לפרמטר האוכלוסייה המשוער. שימו לב שאנחנו לא מדברים כאן על ערך מסוים.האומדן החלקי יכול להיות רחוק מאוד מהערך האמיתי - קח, למשל, את הדגימות AB או ST. במקרים מסוימים, הערך האמיתי של האוכלוסייה עשוי שלא להיות בר השגה כאשר בוחנים כל מדגם אפשרי, גם אם הנתונים הסטטיסטיים אינם מוטים. במקרה שלנו זה לא המקרה: מספר מדגמים אפשריים - למשל AT - נותן ממוצע מדגם השווה לממוצע האוכלוסייה האמיתי.

הגיוני לשקול את התפלגותם של אומדני מדגם אלה, ובפרט את הקשר בין פיזור האומדנים הזה לבין השונות ברמת ההכנסה באוכלוסייה. השונות של האוכלוסייה הכללית משמשת כמדד לשונות. כדי לקבוע את השונות של האוכלוסייה הכללית, עלינו לחשב את הסטייה של כל ערך מהממוצע, להוסיף את הריבועים של כל הסטיות ולחלק את הסכום המתקבל במספר האיברים. סמן ב-a^ את השונות של האוכלוסייה הכללית. לאחר מכן:

שונות אוכלוסייה σ 2 = סכום ההבדלים בריבוע של כל אלמנט
אוכלוסיה וממוצע אוכלוסיה / מספר מרכיבי אוכלוסיה =

פְּזִירָה ערך ממוצעניתן להגדיר את רמת ההכנסה באותו אופן. כלומר, נוכל למצוא אותו על ידי קביעת הסטיות של כל ממוצע מהממוצע הכולל שלו, סיכום ריבועי הסטיות וחלוקת הסכום המתקבל במספר האיברים.

ניתן גם להגדיר את השונות של רמת ההכנסה הממוצעת בדרך אחרת, תוך שימוש בשונות רמות ההכנסה באוכלוסייה הכללית, שכן יש קשר ישיר בין שני הכמויות הללו. ליתר דיוק, במקרים בהם המדגם מייצג רק חלק קטן מהאוכלוסייה, השונות של ממוצע המדגם שווה לשונות האוכלוסייה חלקי גודל המדגם:

כאשר σ x 2 היא השונות של ערך המדגם הממוצע של רמת ההכנסה, σ 2 היא השונות של רמת ההכנסה באוכלוסייה הכללית, נ- גודל המדגם.

כעת נשווה את התפלגות התוצאות עם התפלגות תכונה כמותית באוכלוסייה הכללית. איור 15.5 מראה שהתפלגות תכונת האוכלוסייה המוצגת בתיבה A היא רב-קודקודית (כל אחד מ-20 הערכים מופיע פעם אחת בלבד) והיא סימטרית לגבי ממוצע האוכלוסייה האמיתי של 9400.

התפלגות דגימה
התפלגות הערכים של נתון מסוים המחושב עבור כל המדגמים הניתנים להבחין שניתן לחלץ מהאוכלוסייה במסגרת תוכנית דגימה נתונה.

התפלגות הציונים המוצגת בשדה ב' מבוססת על הנתונים בטבלה. 15.3, אשר, בתורו, הורכב על ידי הקצאת ערכים מטבלה. 15.2 לקבוצה כזו או אחרת, בהתאם לגודלם, עם חישוב לאחר מכן של מספרם בקבוצה. שדה ב' הוא היסטוגרמה מסורתית, הנחשבת ממש בתחילת הקורס של לימוד סטטיסטיקה, המייצגת התפלגות דגימהסטָטִיסטִיקָה. נציין בשגגה את הדברים הבאים: מושג התפלגות הדגימה הוא המושג החשוב ביותר בסטטיסטיקה, הוא אבן היסוד של בניית מסקנות סטטיסטיות. על פי התפלגות המדגם הידועה של הסטטיסטיקה הנחקרה, אנו יכולים להסיק לגבי הפרמטר המקביל של האוכלוסייה הכללית. אם, לעומת זאת, ידוע רק שאומדן המדגם משתנה ממדגם למדגם, אך אופיו של שינוי זה אינו ידוע, הופך להיות בלתי אפשרי לקבוע את טעות הדגימה הקשורה לאומדן זה. מאחר שהתפלגות הדגימה של אומדן מתארת ​​כיצד היא משתנה ממדגם למדגם, היא מהווה בסיס לקביעת תקפותה של אומדן מדגם. מסיבה זו עיצוב דגימת הסתברות חשוב כל כך להסקה סטטיסטית.

בהתחשב בהסתברויות הידועות לכלול כל אחד מבני האוכלוסייה במדגם, מראיינים יכולים למצוא את התפלגות המדגם של סטטיסטיקות שונות. על התפלגויות אלה מסתמכים החוקרים - בין אם זה ממוצע המדגם, שיעור המדגם, שונות המדגם או סטטיסטיקה אחרת - כשהם מרחיבים את התוצאה של תצפית מדגם לכלל האוכלוסייה. שימו לב גם שעבור דגימות בגודל 2, התפלגות אמצעי המדגם היא לא-מודאלית וסימטרית לגבי הממוצע האמיתי.

אז הראינו ש:

  1. הממוצע של כל אמצעי המדגם האפשריים שווה לממוצע הכללי.
  2. השונות של אמצעי המדגם קשורה בדרך כלשהי לשונות הכללית.
  3. התפלגות האמצעים המדגם היא לא-מודאלית, בעוד שהתפלגות הערכים של תכונה כמותית באוכלוסייה הכללית היא רב-מודאלית.

משפט הגבול המרכזי

משפט שאומר שעבור דגימות אקראיות פשוטות של גודל נ, מבודד מהאוכלוסייה הכללית עם הממוצע הכללי μ והשונות σ 2 , באופן כללי נההתפלגות של ממוצע המדגם x מתקרבת לנורמלית עם מרכז שווה ל- μ ושונות σ 2 . הדיוק של קירוב זה עולה עם העלייה נ.

משפט הגבול המרכזי. ההתפלגות האומדלית של אומדנים יכולה להיחשב כביטוי של משפט הגבול המרכזי, הקובע כי עבור דגימות אקראיות פשוטות של נפח נ, נבחר מהאוכלוסייה הכללית עם הממוצע האמיתי μ והשונות σ 2 , עבור גדול נההתפלגות של ממוצעי המדגם מתקרבת לנורמלית עם מרכז שווה לממוצע האמיתי ושונות שווה ליחס בין שונות האוכלוסייה לגודל המדגם, כלומר:

קירוב זה הופך יותר ויותר מדויק כמו נ. תזכור את זה. ללא קשר לסוג האוכלוסייה, התפלגות אמצעי המדגם תהיה נורמלית עבור מדגמים בגודל גדול מספיק. מה הכוונה בנפח גדול מספיק? אם התפלגות הערכים של תכונה כמותית של האוכלוסייה הכללית היא נורמלית, אז התפלגות ממוצעי המדגם עבור מדגמים בנפח של נ=1. אם ההתפלגות של משתנה (תכונה כמותית) באוכלוסייה היא סימטרית אך לא נורמלית, מדגמים בגודל קטן מאוד יתנו התפלגות נורמלית של אמצעי המדגם. אם להתפלגות של תכונה כמותית של האוכלוסייה הכללית יש אסימטריה בולטת, יש צורך במדגמים גדולים יותר. ועדיין, ניתן לקחת את התפלגות ממוצע המדגם כנורמלי רק אם עסקינן במדגם בגודל מספיק.

על מנת להסיק מסקנות באמצעות עקומה נורמלית, אין צורך כלל לצאת ממצב הנורמליות של התפלגות הערכים של תכונה כמותית של האוכלוסייה הכללית. במקום זאת, אנו מסתמכים על משפט הגבול המרכזי ובהתאם להתפלגות האוכלוסייה, קובעים גודל מדגם כזה שיאפשר לנו לעבוד עם עקומה נורמלית. למרבה המזל, ההתפלגות הנורמלית של הסטטיסטיקה מסופקת על ידי מדגמים בגודל קטן יחסית - איור. 15.6 מדגים בבירור נסיבות אלו. הערכות רווחי סמך. האם האמור לעיל יכול לעזור לנו להסיק מסקנות מסוימות לגבי הממוצע הכללי? ואכן, בפועל, אנו בוחרים רק מדגם אחד, ולא את כל המדגם האפשרי בגודל נתון, ועל בסיס הנתונים המתקבלים אנו מסיקים מסקנות מסוימות לגבי קבוצת היעד.

איך זה קרה? כידוע, בהתפלגות נורמלית, לאחוז מסוים מכל התצפיות יש סטיית תקן מסוימת; נגיד 95% מהתצפיות נכנסות ל-±1.96 סטיות תקן מהממוצע. התפלגות נורמליתאמצעי מדגם, עליהם ניתן ליישם את משפט הגבול המרכזי, אינו יוצא מן הכלל במובן זה. הממוצע של התפלגות מדגם כזו שווה לממוצע הכללי μ, וסטיית התקן שלו נקראת שגיאת התקן של הממוצע:

מסתבר ש:

  • 68.26% מממוצעי המדגם חורגים מהממוצע הכללי בלא יותר מ-± σ x ;
  • 95.45% מממוצעי המדגם חורגים מהממוצע הכללי בלא יותר מ-±σ x ;
  • 99.73% מממוצעי המדגם חורגים מהממוצע הכללי בלא יותר מ-± σ x ,

כלומר שיעור מסוים של אמצעי מדגם בהתאם לערך הנבחר זיהיה מוקף במרווח שנקבע על ידי הערך ז. ניתן לשכתב את הביטוי הזה כאי שוויון:

ממוצע כללי - ז < Среднее по выборке < Генеральное среднее + ז(שגיאה סטנדרטית של הממוצע)

לפיכך, ממוצע המדגם עם הסתברות מסוימת נמצא במרווח, שגבולותיו הם הסכום וההפרש של הערך הממוצע של ההתפלגות ומספר מסוים של סטיות תקן. ניתן להמיר את אי השוויון הזה לצורה:

ממוצע לדוגמה - ז(שגיאה סטנדרטית של הממוצע)< Генеральное среднее < Среднее по выборке + ז(שגיאה סטנדרטית של הממוצע)

אם היחס 15.1 נצפה, למשל, ב-95% מהמקרים ( ז= 1.96), אז ב-95% מהמקרים נצפה גם היחס 15.2. במקרים בהם המסקנה מבוססת על ממוצע מדגם בודד, אנו משתמשים בביטוי 15.2.

חשוב לזכור כי ביטוי 15.2 לא אומר שהמרווח המקביל למדגם נתון חייב לכלול בהכרח את הממוצע הכללי. המרווח קשור יותר להליך הבחירה.המרווח שנבנה סביב ממוצע זה עשוי לכלול או לא לכלול את ממוצע האוכלוסייה האמיתי. בטחוננו בנכונות המסקנות שהתקבלו מבוסס על העובדה ש-95% מכל המרווחים שנבנו על פי תכנית הדגימה שנבחרה יכילו את הממוצע האמיתי. אנו מאמינים שהמדגם שלנו שייך ל-95%.

כדי להמחיש נקודה חשובה זו, דמיינו לרגע שחלוקת המדגם פירושה עבור מדגמים של גודל נ= 2 בדוגמה ההיפותטית שלנו הוא נורמלי. טבלה 15.4 ממחישה באופן גרפי את התוצאה עבור 10 הדגימות הראשונות מתוך 190 הדגימות האפשריות שניתן לבחור בהתאם לעיצוב הנתון. שימו לב שרק 7 מתוך 10 מרווחים כוללים ממוצע כללי או אמיתי. האמון בנכונות המסקנה אינו נובע מהערכה פרטית כלשהי, אלא בדייקנות תהליךהערכות. הליך זה הוא כזה שעבור 100 דגימות שעבורן יחושבו ממוצע המדגם ורווח הסמך, ב-95 מקרים מרווח זה יכלול את הערך הכללי האמיתי. הדיוק של מדגם זה נקבע על ידי ההליך שבו נוצרה המדגם. עיצוב דגימה מייצג אינו מבטיח את הייצוגיות של כל הדגימות. נהלי הסקה סטטיסטיים מבוססים על הייצוגיות של תוכנית הדגימה, וזו הסיבה שהליך זה כל כך קריטי עבור מדגמי הסתברות.

דגימה הסתברותית מאפשרת לנו להעריך את דיוק התוצאות כקרבה של ההערכות שהופקו לערך האמיתי. ככל שטעות התקן של הסטטיסטיקה גדולה יותר, כך מידת פיזור ההערכות גבוהה יותר ודיוק ההליך נמוך יותר.

חלקם עשויים להתבלבל מהעובדה שרמת הביטחון קשורה לנוהל, ולא לערך מדגם מסוים, עם זאת, יש לזכור שניתן להתאים את ערך רמת הביטחון של אומדן הערך הכללי על ידי חוֹקֵר. אם אינך רוצה לקחת סיכונים וחושש שאולי תיתקל באחד מחמשת מרווחי המדגם שאינם כוללים את ממוצע האוכלוסייה, תוכל לבחור רווח סמך של 99% שבו רק אחד ממאה מרווחי המדגם אינו כולל האוכלוסייה מתכוונת. יתרה מכך, אם תוכל להגדיל את גודל המדגם, תגדיל את מידת האמון בתוצאה, ותספק את הדיוק הרצוי של אומדן ערך האוכלוסייה. נדבר על כך ביתר פירוט בפרק. 17.

להליך שאנו מתארים יש עוד מרכיב אחד, שיכול לגרום למבוכה מסוימת. בעת אומדן רווח הסמך, נעשה שימוש בשלוש כמויות: x , זו- σ x . ממוצע המדגם x מחושב מנתוני המדגם, זנבחר על פי רמת הביטחון הרצויה. אבל מה לגבי השגיאה הריבועית הממוצעת של הממוצע σ x ? זה שווה ל:

ולכן, כדי לקבוע זאת, עלינו לשאול את סטיית התקן של התכונה הכמותית של האוכלוסייה הכללית, כלומר 5. מה לעשות במקרים בהם סטיית התקן סלא ידוע? בעיה זו אינה מתעוררת משתי סיבות. ראשית, בדרך כלל עבור רוב המאפיינים הכמותיים המשמשים במחקר שיווקי, השונות משתנה הרבה יותר לאט מהרמה של רוב המשתנים המעניינים את המשווק. בהתאם לכך, אם המחקר חוזר על עצמו, נוכל להשתמש בערך הקודם, שהושג קודם לכן, של s בחישובים. שנית, לאחר בחירת המדגם והשגת הנתונים, נוכל להעריך את שונות האוכלוסייה על ידי קביעת שונות המדגם. שונות המדגם הבלתי מוטה מוגדרת כ:

שונה במדגם ŝ 2 = סכום הסטיות בריבוע מממוצע המדגם / (מספר הפריטים שנדגמו -1). כדי לקבוע את שונות המדגם, ראשית עלינו למצוא את ממוצע המדגם. לאחר מכן מוצאים ההבדלים בין כל אחד מערכי המדגם לממוצע המדגם; ההבדלים הללו מחולקים בריבוע, מסוכמים ומחלקים במספר השווה למספר התצפיות לדוגמה פחות אחת. השונות המדגם לא רק מספקת אומדן של השונות הכוללת, אלא יכולה לשמש גם כדי להעריך את טעות התקן של הממוצע. כאשר השונות הכללית σ 2 ידועה, ידועה גם השגיאה הריבועית של השורש σ x, כי:

כאשר השונות הכללית אינה ידועה, ניתן להעריך רק את טעות התקן של הממוצע. הערכה זו ניתנת ŝ x , השווה לסטיית התקן של המדגם חלקי שורש ריבועימגודל המדגם, כלומר. האומדן נקבע באותו אופן שבו נקבע אומדן הערך האמיתי, אך במקום סטיית התקן הכללית, סטיית התקן של המדגם מוחלפת בנוסחת החישוב. אז, נניח עבור מדגם AB עם ממוצע מדגם של 5800:

בהתאם לכך, ŝ = 283, ו

ו-95% מרווח הוא כעת

שהוא פחות מהערך הקודם.

בשולחן. 15.5 מסכם את נוסחאות החישוב של ממוצעים ופיזורים שונים, שנדונו בפרק זה. יצירת מדגם אקראי פשוט. בדוגמה שלנו, בחירת רכיבי הדגימה בוצעה באמצעות כד, שהכיל את כל מרכיבי האוכלוסייה המקורית. זה אפשר לנו לדמיין את המושגים של אוכלוסייה נגזרת והתפלגות דגימה. אנו לא ממליצים להשתמש בשיטה כזו בפועל, כי זה מגדיל את הסבירות לטעות. ספלים יכולים להיות שונים גם בגודל וגם במרקם, מה שבמקרים מסוימים עלול להוביל להעדפה של אחד על פני השני. בחירת המשתתפים בקמפיין הווייטנאמי, המתבצעת באמצעות הגרלה, יכולה לשמש דוגמה לטעות מסוג זה.

הבחירה בוצעה על ידי משיכת דיסקים עם תאריכי לידה מהתוף הגדול. הטלוויזיה שידרה נוהל זה בכל הארץ. למרבה הצער, הדיסקים נטענו לתוף בצורה שיטתית, כאשר תאריכי ינואר מגיעים ראשון ותאריכי דצמבר אחרונים. למרות שהתוף היה נתון לסחרור אינטנסיבי, התאריכים בדצמבר נפלו הרבה יותר מאשר ינואר. לאחר מכן, נוהל זה תוקן באופן שההסתברות לטעויות שיטתיות כאלה הופחתה באופן משמעותי. השיטה המועדפת להפקת מדגם אקראי פשוט מבוססת על שימוש בטבלה של מספרים אקראיים.

שימוש בטבלה כזו כרוך ברצף השלבים הבא. ראשית, יש להקצות למרכיבי האוכלוסייה מספרים עוקבים מ-1 עד נ; באוכלוסיה ההיפותטית שלנו לאלמנט אמספר 1 יוקצה לאלמנט ב- מספר 2 וכו'. שנית, מספר הספרות בטבלת המספרים האקראיים חייב להיות זהה לזה של המספר נ. ל נ= 20 מספרים דו ספרתיים ישמשו; ל נבין 100 ל-999 - מספרים תלת ספרתיים וכו'. שלישית, יש לקבוע את מיקום ההתחלה באופן אקראי. אנחנו יכולים לפתוח את הטבלה המתאימה של המספרים האקראיים, ולעצום את עינינו, כמו שאומרים, לתקוע בה אצבע. מכיוון שהמספרים בטבלת המספרים האקראיים הם בסדר אקראי, מיקום ההתחלה לא ממש משנה.

ולבסוף, אנחנו יכולים לנוע בכל כיוון שנבחר באופן שרירותי - למעלה, למטה או לרוחב, לבחור את אותם אלמנטים שמספריהם יתאימו למספרים אקראיים מהטבלה. על מנת להמחיש את הנאמר, שקול את הטבלה המקוצרת של המספרים האקראיים (טבלה 15.6). בגלל ה נ= 20, עלינו לעבוד רק עם מספרים דו ספרתיים. במובן זה, Tab. 15.6 מתאים לנו בצורה מושלמת. נניח שהחלטנו מראש לנוע למטה בעמודה, המיקום ההתחלתי הוא במפגש בין השורה האחת עשרה והעמודה הרביעית, שם נמצא המספר 77. המספר הזה גדול מדי, ולכן יש לזרוק אותו. גם שני המספרים הבאים יימחקו, בעוד שהערך הרביעי 02 ישמש שכן 2 הוא מספר האלמנט IN.

חמשת המספרים הבאים יוסרו גם הם כגדולים מדי, בעוד שהמספר 05 יציין את האלמנט ה. אז האלמנטים INו היהפוך למדגם שני האלמנטים שלנו, לפיו נשפוט את רמת ההכנסה של אוכלוסייה זו. אפשרית גם אסטרטגיה חלופית, שבה תוכנת מחשב המפיקה מספרים אקראיים תשמש כבסיס לבחירה. פרסומים אחרונים מצביעים על כך שהמספרים שנוצרו על ידי תוכניות כאלה אינם אקראיים לחלוטין, מה שיכול להתבטא בצורה מסוימת בעת בניית מודלים מתמטיים מורכבים, אבל הם יכולים לשמש עבור רוב המחקר השיווקי היישומי. שים לב שוב כי מדגם אקראי פשוט מצריך הידור של רשימה ממוספרת רציפה של אלמנטים של האוכלוסייה הכללית.

במילים אחרות, יש לזהות כל אחד מבני האוכלוסייה המקורית. עבור חלק מהאוכלוסיות, זה לא קשה לעשות זאת, למשל, במחקר על 500 התאגידים האמריקאים הגדולים, שרשימתם ניתנת במגזין Fortune. רשימה זו כבר הורכבה, כך שהיווצרות מדגם אקראי פשוט במקרה זה לא תהיה קשה. עבור אוכלוסיות ראשוניות אחרות (לדוגמה, עבור כל המשפחות המתגוררות בעיר מסוימת), עריכת רשימה כללית היא קשה ביותר, מה שמאלץ את החוקרים לפנות לתוכניות אחרות של סקר מדגם.

סיכום

יעד למידה 1
הבחנה ברורה בין המושגים של מפקד (הסמכה) ודגימה

נקרא מפקד שלם של האוכלוסייה (אוכלוסיה). מוסמך. לִטעוֹםקבוצה, שנוצרה מהאלמנטים שנבחרו.

יעד למידה 2
דע את המהות והרצף של ששת השלבים המיושמים על ידי חוקרים כדי להשיג אוכלוסיית מדגם

תהליך הדגימה מחולק לשישה שלבים:

  1. ייעוד אוכלוסין;
  2. קביעת מסגרת הדגימה;
  3. בחירת הליך הבחירה;
  4. קביעת גודל המדגם;
  5. בחירת אלמנטים לדוגמה;
  6. בחינה של האלמנטים שנבחרו.

יעד למידה 3
הגדר את המושג "מסגרת דגימה"

מסגרת הדגימה היא רשימת הפריטים שמהם תילקח הדגימה.

יעד למידה 4
הסבר את ההבדל בין דגימה הסתברותית לדטרמיניסטית

במדגם הסתברותי, כל אחד מבני האוכלוסייה יכול להיכלל עם מסוים נתון שאינו אפסהִסתַבְּרוּת. ההסתברויות לכלול בני אוכלוסייה מסוימים במדגם עשויות להיות שונות זו מזו, אך ההסתברות לכלול כל מרכיב בו ידועה. עבור מדגמים דטרמיניסטיים, הערכת ההסתברות לכלול אלמנט כלשהו במדגם הופכת לבלתי אפשרית. לא ניתן להבטיח ייצוגיות של מדגם כזה. כל הבחירות הדטרמיניסטיות מבוססות, במקום זאת, על עמדה אישית, שיפוט או העדפה. העדפות כאלה יכולות לעתים לתת אומדן טוב של מאפייני האוכלוסייה, אך אין דרך לקבוע באופן אובייקטיבי את התאמת המדגם למשימה.

יעד למידה 5
הבחנה בין דגימה בגודל קבוע לבין דגימה רב-שלבית (רצופה).

בעבודה עם מדגמים בגודל קבוע, גודל המדגם נקבע לפני תחילת הסקר ולניתוח התוצאות מקדימה איסוף כל הנתונים הנדרשים. במדגם עוקב, מספר האלמנטים שנבחרו אינו ידוע מראש, הוא נקבע על סמך סדרה של החלטות עוקבות.

יעד למידה 6
הסבירו מהי דגימה מכוונת ותאר את נקודות החוזק והחולשות שלה

פריטי דגימה מכוונת נבחרים ידנית ומוצגים לחוקר בהתאם למטרות הסקר. ההנחה היא שהאלמנטים שנבחרו יכולים לתת תמונה מלאה של האוכלוסייה הנחקרת. כל עוד החוקר נמצא בשלבים מוקדמים של פתרון בעיות, כאשר נקבעים הסיכויים והמגבלות האפשריות של הסקר המתוכנן, השימוש בדגימה מכוונת יכול להיות יעיל מאוד. אך בשום מקרה אסור לשכוח את החולשות של מדגם מסוג זה, שכן הוא יכול לשמש גם את החוקר במחקרים תיאוריים או סיבתיים, שלא יאטו להשפיע על איכות התוצאות שלהם.

יעד למידה 7
הגדירו את המושג דגימת מכסות

דגימה פרופורציונלית נבחרה כך ששיעור מרכיבי המדגם בעלי מאפיינים מסוימים מתאים בקירוב לשיעורם של אותם מרכיבים באוכלוסייה הנחקרת; לשם כך, לכל מונה מוקצה מכסה הקובעת את מאפייני האוכלוסייה עמה עליו ליצור קשר.

יעד למידה 8
הסבר מהו פרמטר בהליך בחירה

פרמטר - מאפיין או אינדיקטור מסוים של האוכלוסייה הכללית או הנחקרת; אינדיקטור כמותי מסוים שמבדיל קבוצה אחת לאחרת.

יעד למידה 9
הסבר מהי קבוצה נגזרת

האוכלוסייה הנגזרת מורכבת מכל המדגמים האפשריים שניתן לבחור מהאוכלוסייה הכללית לפי תוכנית דגימה נתונה.

יעד למידה 10
הסבירו מדוע מושג התפלגות הדגימה הוא המושג החשוב ביותר בסטטיסטיקה.

מושג התפלגות הדגימה הוא אבן היסוד של מסקנות סטטיסטיות. על פי התפלגות המדגם הידועה של הסטטיסטיקה הנחקרה, אנו יכולים להסיק לגבי הפרמטר המקביל של האוכלוסייה הכללית. אם, לעומת זאת, ידוע רק שאומדן המדגם משתנה ממדגם למדגם, אך אופיו של שינוי זה אינו ידוע, הופך להיות בלתי אפשרי לקבוע את טעות הדגימה הקשורה לאומדן זה. מאחר שהתפלגות הדגימה של אומדן מתארת ​​כיצד היא משתנה ממדגם למדגם, היא מהווה בסיס לקביעת תקפותה של אומדן מדגם.

מחקרים סטטיסטיים מאוד גוזלים זמן ויקרים, ולכן עלה הרעיון להחליף את התצפית הרציפה בסלקטיבית.

המטרה העיקרית של תצפית לא רציפה היא להשיג את המאפיינים של האוכלוסייה הסטטיסטית הנחקרת עבור החלק הנבדק שלה.

התבוננות סלקטיבית- זוהי שיטת מחקר סטטיסטית, שבה נקבעים אינדיקטורים כלליים של האוכלוסייה רק ​​עבור חלק בודד, בהתבסס על הוראות הבחירה האקראית.

בשיטת הדגימה נחקר רק חלק מסוים מהאוכלוסייה הנחקרת, בעוד שהאוכלוסייה הסטטיסטית שתיבדק נקראת האוכלוסייה הכללית.

מדגם או פשוט מדגם יכול להיקרא חלק מהיחידות שנבחרו מהאוכלוסייה הכללית, שיועברו למחקר סטטיסטי.

ערכה של שיטת הדגימה: עם מספר מינימלי של יחידות במחקר, מחקר סטטיסטי יתבצע בפרקי זמן קצרים יותר ובעלות הכספים והעבודה הנמוכה ביותר.

באוכלוסייה הכללית, שיעור היחידות בעלות התכונה הנחקרת נקרא הפרופורציה הכללית (מסומן R),והערך הממוצע של התכונה המשתנה הנחקרת הוא הממוצע הכללי (מסומן איקס).

באוכלוסיית המדגם, חלקה של התכונה הנחקרת נקרא נתח המדגם, או חלק (מסומן ב-w), הערך הממוצע במדגם הוא ממוצע מדגם.

אם במהלך תקופת הסקר נשמרים כל הכללים של הארגון המדעי שלה, אזי שיטת הדגימה תיתן תוצאות מדויקות למדי, ולכן השיטה הזאתכדאי לפנות כדי לבדוק את נתוני התצפית הרציפה.

שיטה זו הפכה לנפוצה בסטטיסטיקה ממלכתית ולא מחלקה, מכיוון שכאשר בוחנים את המספר המינימלי של יחידות לימוד, היא מאפשרת לימוד יסודי ומדויק.

האוכלוסייה הסטטיסטית הנחקרת מורכבת מיחידות בעלות מאפיינים משתנים. הרכב המדגם עשוי להיות שונה מהרכב האוכלוסייה הכללית, אי התאמה זו בין מאפייני המדגם לאוכלוסייה הכללית מהווה את טעות הדגימה.

טעויות הגלומות בתצפית סלקטיבית מאפיינות את גודל הפער בין נתוני התצפית הסלקטיבית לבין כלל האוכלוסייה. שגיאות המתרחשות במהלך הדגימה נקראות שגיאות ייצוגיות ומחולקות לאקראיות ושיטתיות.

אם אוכלוסיית המדגם אינה משחזרת במדויק את כל האוכלוסייה בשל האופי הלא רציף של התצפית, אזי זה נקרא טעויות אקראיות, והגדלים שלהן נקבעים בדיוק מספיק על סמך חוק המספרים הגדולים ותורת ההסתברות.

טעויות שיטתיות נוצרות כתוצאה מהפרה של עקרון הבחירה האקראית של יחידות אוכלוסייה לתצפית.

2. סוגי וסכימות של בחירה

גודל שגיאת הדגימה והשיטות לקביעתה תלויים בסוג ובסכמת הבחירה.

ישנם ארבעה סוגי בחירה של קבוצה של יחידות תצפית:

1) אקראי;

2) מכני;

3) טיפוסי;

4) סדרתי (מקוננת).

בחירה אקראית- שיטת הבחירה הנפוצה ביותר במדגם אקראי, היא נקראת גם שיטת ההגרלה, שבה מכינים כרטיס עם מספר סידורי לכל יחידה באוכלוסייה הסטטיסטית.

לאחר מכן, מספר היחידות הנדרש של האוכלוסייה הסטטיסטית נבחר באקראי. בתנאים אלה, לכל אחד מהם יש אותה הסתברות להיכנס למדגם, למשל הגרלות של זכיות, כאשר חלק מסוים מהמספרים המהווים זכייה נבחר באקראי מתוך המספר הכולל של הכרטיסים שהונפקו. במקרה זה, כל המספרים מקבלים הזדמנות שווה להיכנס למדגם.

בחירה מכנית- זוהי שיטה כאשר כל האוכלוסייה מחולקת לקבוצות בגודל הומוגני לפי קריטריון אקראי, אז נלקחת רק יחידה אחת מכל קבוצה. כל היחידות של האוכלוסייה הסטטיסטית הנחקרת מסודרות מראש בסדר מסוים, אך בהתאם על גודל המדגם, המספר הנדרש של יחידות נבחר באופן מכאני במרווח מסוים.

בחירה אופיינית -זוהי שיטה שבה האוכלוסייה הסטטיסטית הנחקרת מחולקת לפי מאפיין חיוני אופייני לקבוצות דומות איכותית הומוגנית, ואז מספר מסוים של יחידות נבחר באקראי מכל אחת מקבוצה זו, פרופורציונלי לחלקה של הקבוצה ב כל האוכלוסייה.

בחירה טיפוסית נותנת תוצאות מדויקות יותר, שכן היא כוללת נציגים של כל הקבוצות האופייניות במדגם.

בחירה סדרתית (מקוננת).קבוצות שלמות (סדרות, קנים), שנבחרו באופן אקראי או מכני, כפופות לבחירה. עבור כל קבוצה כזו, סדרה, מתבצעת תצפית רציפה, והתוצאות מועברות לכלל האוכלוסייה.

דיוק הדגימה תלוי גם בסכימת הבחירה. ניתן לבצע דגימה על פי תכנית הבחירה החוזרת והלא חוזרת.

בחירה מחדש.כל יחידה או סדרה שנבחרה מוחזרת לכלל האוכלוסיה וניתנת לדגימה מחדש.זוהי מה שנקרא סכימת כדור חוזר.

בחירה חוזרת ונשנית.כל יחידה שנסקרת נסוגה ולא מוחזרת לאוכלוסיה, ולכן היא לא נבדקת מחדש. סכימה זו נקראת הכדור שלא הוחזר.

בחירה לא חוזרת נותנת תוצאות מדויקות יותר, מכיוון שעם אותו גודל מדגם, התצפית מכסה יותר יחידות מהאוכלוסייה הנחקרת.

בחירה משולבתעשוי לעבור שלב אחד או יותר. מדגם נקרא חד-שלבי אם יחידות האוכלוסייה שנבחרו פעם אחת נתונות למחקר.

מדגם נקרא רב-שלבי אם הבחירה של האוכלוסייה עוברת דרך שלבים, שלבים עוקבים, ולכל שלב, שלב של בחירה יש יחידת בחירה משלו.

דגימה רב-שלבית - בכל שלבי הדגימה נשמרת אותה יחידת דגימה, אך מבוצעים מספר שלבים, שלבים של סקרי מדגם, הנבדלים זה מזה ברוחב תכנית הסקר ובגודל המדגם.

מאפיינים של הפרמטרים של האוכלוסיות הכלליות והמדגמיות מסומנים בסמלים הבאים:

נ- נפח האוכלוסייה הכללית;

נ- גודל המדגם;

איקס- ממוצע כללי;

איקסהוא ממוצע המדגם;

ר- מניה כללית;

w -נתח מדגם;

2 - שונות כללית (פיזור של תכונה באוכלוסייה הכללית);

2 - שונות לדוגמה של אותה תכונה;

- סטיית תקן באוכלוסייה הכללית;

? היא סטיית התקן במדגם.

3. טעויות דגימה

לכל יחידה בתצפית מדגם צריכה להיות הזדמנות שווה להיבחר עם האחרות - זה הבסיס של מדגם אקראי.

דגימה אקראית עצמית - מדובר בבחירת יחידות מכל האוכלוסייה בהגרלה או בדרך דומה אחרת.

עקרון האקראיות הוא שלא ניתן להשפיע על הכללה או הדרה של אובייקט מהמדגם מכל גורם מלבד מקרה.

שיתוף לדוגמההוא היחס בין מספר היחידות במדגם למספר היחידות באוכלוסייה הכללית:


בחירה אקראית עצמית בצורתה הטהורה היא הבחירה הראשונית מבין כל סוגי הבחירה האחרים; היא מכילה ומיישמת את העקרונות הבסיסיים של תצפית סטטיסטית סלקטיבית.

שני הסוגים העיקריים של אינדיקטורים הכללה המשמשים בשיטת הדגימה הם הערך הממוצע של תכונה כמותית והערך היחסי של תכונה חלופית.

נתח המדגם (w), או הפרטיקולריות, נקבע על ידי היחס בין מספר היחידות שיש להן את התכונה הנבדקת M,למספר הכולל של יחידות הדגימה (n):


כדי לאפיין את מהימנות האינדיקטורים של המדגם, מבדילים בין השגיאות הממוצעות והשוליות של המדגם.

טעות הדגימה, המכונה גם טעות הייצוגיות, היא ההבדל בין המדגם המקביל למאפיינים הכלליים:

?x = | x - x |;

?w =|х – p|.

רק בתצפיות שנדגמו יש טעות דגימה

ממוצע מדגם ושיעור מדגם- זה משתנים אקראייםאירוח משמעויות שונותבהתאם ליחידות האוכלוסייה הסטטיסטית הנחקרת שנכללו במדגם. בהתאם לכך, טעויות דגימה הן גם משתנים אקראיים ויכולות לקבל גם ערכים שונים. לכן נקבע ממוצע הטעויות האפשריות - טעות הדגימה הממוצעת.

טעות הדגימה הממוצעת נקבעת על פי גודל המדגם: ככל שהאוכלוסיה גדולה יותר, כל שאר הדברים שווים, כך קטנה טעות הדגימה הממוצעת. מכסה סקר מדגם עם מספר הולך וגדל של יחידות של האוכלוסייה הכללית, אנו מאפיינים יותר ויותר את כל האוכלוסייה.

טעות הדגימה הממוצעת תלויה במידת השונות של התכונה הנחקרת, בתורה, מידת השונות מאופיינת בשונות? 2 או w(l - w)- לשלט חלופי. ככל שהוריאציה והשונות של התכונה קטנים יותר, כך שגיאת הדגימה הממוצעת קטנה יותר, ולהיפך.

עבור דגימה מחדש אקראית, השגיאות הממוצעות מחושבות באופן תיאורטי באמצעות הנוסחאות הבאות:

1) עבור התכונה הכמותית הממוצעת:


איפה? 2 - הערך הממוצע של פיזור תכונה כמותית.

2) עבור מניה (סימן חלופי):


אז איך השונות של התכונה באוכלוסייה? 2 אינו ידוע בדיוק, בפועל משתמשים בערך השונות S 2 המחושבת עבור אוכלוסיית המדגם על פי חוק המספרים הגדולים, לפיו אוכלוסיית המדגם עם גודל המדגם גדול מספיק משחזרת במדויק את מאפייני האוכלוסייה הכללית. .

הנוסחאות לשגיאת הדגימה הממוצעת עבור דגימה חוזרת אקראית הן כדלקמן. עבור הערך הממוצע של תכונה כמותית: השונות הכללית באה לידי ביטוי דרך הבחירה על ידי היחס הבא:


כאשר S 2 הוא ערך הפיזור.

דגימה מכנית- זוהי בחירת היחידות במערך מדגם מהכלל, המחולקת לקבוצות שוות על פי קריטריון ניטרלי; נעשה באופן שרק יחידה אחת נבחרה מכל קבוצה כזו במדגם.

עם בחירה מכנית, יחידות האוכלוסייה הסטטיסטית הנחקרת מסודרות מראש בסדר מסוים, ולאחר מכן מספר נתון של יחידות נבחר באופן מכאני במרווח מסוים. במקרה זה, גודל המרווח באוכלוסייה הכללית שווה להדדיות של נתח המדגם.

עם אוכלוסייה גדולה מספיק, הבחירה המכנית מבחינת דיוק התוצאות קרובה לאקראי ולכן, כדי לקבוע את השגיאה הממוצעת של הדגימה המכנית, נעשה שימוש בנוסחאות של הדגימה האקראית שאינה חוזרת על עצמה.

כדי לבחור יחידות מאוכלוסיה הטרוגנית, נעשה שימוש במדגם טיפוסי כביכול, הוא משמש כאשר ניתן לחלק את כל היחידות של האוכלוסייה הכללית למספר קבוצות הומוגניות איכותיות דומות בהתאם למאפיינים שבהם תלויים האינדיקטורים הנחקרים.

לאחר מכן, מכל קבוצה טיפוסית, מתבצעת בחירה פרטנית של יחידות לתוך המדגם על ידי מדגם אקראי או מכני.

דגימה אופיינית משמשת בדרך כלל במחקר של אוכלוסיות סטטיסטיות מורכבות.

דגימה אופיינית נותנת תוצאות מדויקות יותר. אפיון האוכלוסייה הכללית מבטיחה את הייצוגיות של מדגם כזה, את הייצוג של כל קבוצה טיפולוגית בו, מה שמאפשר לשלול את השפעת השונות הבין-קבוצתית על טעות המדגם הממוצעת. לכן, בעת קביעת השגיאה הממוצעת של מדגם טיפוסי, הממוצע של השונות התוך-קבוצתית משמש כאינדיקטור לשונות.

דגימה סדרתית כוללת בחירה אקראית מאוכלוסיה כללית של קבוצות שוות בגודלן על מנת להכפיף את כל היחידות ללא יוצא מן הכלל לתצפית בקבוצות כאלה.

מכיוון שכל היחידות ללא יוצא מן הכלל נבדקות בתוך קבוצות (סדרות), טעות הדגימה הממוצעת (בבחירת סדרות שוות) תלויה רק ​​בשונות הבין-קבוצתית (בין-סדרתית).

4. דרכים להרחבת תוצאות המדגם לאוכלוסייה

אפיון האוכלוסייה הכללית על בסיס תוצאות מדגם הוא המטרה הסופית של תצפית מדגם.

שיטת הדגימה משמשת כדי לקבל את המאפיינים של האוכלוסייה הכללית עבור אינדיקטורים מסוימים של המדגם. בהתאם למטרות המחקר, הדבר מתבצע על ידי חישוב ישיר מחדש של מדדי המדגם לאוכלוסייה הכללית או על ידי שיטת חישוב מקדמי תיקון.

שיטת החישוב הישיר מחדש היא שאיתה המדדים של נתח המדגם wאו בינוני איקסמורחבים לכלל האוכלוסייה, תוך התחשבות בטעות הדגימה.

שיטת מקדמי התיקון משמשת כאשר מטרת שיטת הדגימה היא חידוד תוצאות החשבונאות השלמה. שיטה זו משמשת לחידוד הנתונים של מפקדי בעלי חיים שנתיים של האוכלוסייה.

לִטעוֹם - זה:

1) מכלול אותם מרכיבים של מושא הלימוד, שיילמדו ישירות;

2) שיטות ונהלים לבחירת אלמנטים של מושא הלימוד.

אוּכְלוֹסִיָה - סט שלם של אובייקטים הקשורים לבעיה הנחקרת. במחקרים סוציולוגיים כמו ג.ס. לרוב, פועלים אגרגטים של פרטים - האוכלוסייה (ערים, מדינות וכו'), קבוצה חברתית(נוער, מובטלים, אנשי עסקים וכו'), קהל התקשורת ההמונית (MSK) ועוד. אולם במקרים רבים, ג.ש. עשוי להיות מורכב מאלמנטים (חפצים) גדולים יותר - משפחות (משקי בית), קבוצות אקדמיות, מפעלים, קהילות דתיות, התנחלויות או מדינות בודדות וכו'.

אוכלוסיה לדוגמה - חלק מהאובייקטים מהאוכלוסייה הכללית שנבחרו למחקר על מנת להסיק מסקנה על כלל האוכלוסייה.

על מנת שהמסקנה המתקבלת מלימוד המדגם תתרחב לכלל האוכלוסייה, על המדגם להיות מייצג.

ייצוגיות היא היכולת של המדגם לייצג את האוכלוסייה הנחקרת. ככל שהרכב המדגם מייצג את האוכלוסייה בנושאים הנבדקים בצורה מדויקת יותר, ייצוגיותו גבוהה יותר.

דוגמה: ייצוגיות יכולה להיות מומחשת על ידי הדוגמה הבאה. נניח שהאוכלוסייה היא כל תלמידי בית הספר (600 איש מ-20 כיתות, 30 איש בכל כיתה). נושא הלימוד הוא היחס לעישון. מדגם של 60 תלמידי תיכון מייצג את האוכלוסייה גרוע בהרבה ממדגם של אותם 60 אנשים, שיכלול 3 תלמידים מכל כיתה. הסיבה העיקרית לכך היא התפלגות הגילאים הלא שוויונית בכיתות. לכן במקרה הראשון הייצוגיות של המדגם נמוכה, ובמקרה השני הייצוגיות גבוהה (ceteris paribus).

סוגי דוגמאות

1. דגימה אקראית.

1.1 בחירה אקראית פשוטה.

1.2 שיטת הדגימה השיטתית (או מכנית).

1.3 דגימה סדרתית (מקוננת או אשכול).

1.4 דגימה מרובדת.

2. דגימה לא אקראית (אי הסתברות).

2.2. בחירה אקראית.

2.3. דגימה רב-שלבית וחד-שלבית.

1. דגימה אקראית.

תכונה של דגימה אקראית היא שלכל היחידות של האוכלוסייה הכללית יש הסתברות שווה להיכלל במדגם. לדגימה אקראית, עקרון המקרה. בסיס המדגם יכול להיות רשימות של עובדי המיזם, מדריכי טלפון, רשימות רישום של בעלי רכב, רשימות בוחרים בקלפיות, ספרי בתים וכן רשימות שונות שערך הסוציולוג עצמו בהתאם למטרות המחקר. (רשימת רחובות בהם מתבצעת לאחר מכן בחירת המשיבים).

דגימה אקראית משמשת בדרך כלל בסקרי דעת קהל לפני בחירות, משאלי עם ואירועים ציבוריים אחרים.

ועודבשיטה זו שמירה מלאה על עקרון האקראיות וכתוצאה מכך הימנעות מטעויות שיטתיות.

חסרונות של שיטה זו:

– הצורך ברשימה של מרכיבי אוכלוסייה.

- קושי בביצוע הסקר.

- גודל מדגם גדול יחסית.

מדגם - מכלול מקרים (נבדקים, חפצים, אירועים, מדגמים), תוך שימוש בהליך מסוים, שנבחר מהאוכלוסייה הכללית לצורך השתתפות במחקר.

גודל המדגם

גודל המדגם - מספר המקרים הנכללים במדגם. מסיבות סטטיסטיות, מומלץ שמספר המקרים יהיה לפחות 30-35.

דגימות תלויות ובלתי תלויות

כאשר משווים בין שני מדגמים (או יותר), התלות שלהם היא פרמטר חשוב. אם אפשר לקבוע זוג הומומורפי (כלומר, כאשר מקרה אחד ממדגם X מתאים למקרה אחד ויחיד ממדגם Y ולהיפך) לכל מקרה בשתי מדגמים (ובסיס הקשר הזה חשוב לתכונה נמדד על הדגימות), דגימות כאלה נקראות תלויות. דוגמאות לבחירות תלויות:

  1. זוג תאומים
  2. שתי מדידות של כל תכונה לפני ואחרי חשיפה ניסיונית,
  3. בעלים ונשים
  4. וכולי.

אם אין קשר כזה בין הדגימות, אז דגימות אלו נחשבות עצמאיות, למשל:

  1. גברים ונשים,
  2. פסיכולוגים ומתמטיקאים.
  3. בהתאם לכך, למדגמים התלויים יש תמיד אותו גודל, בעוד שגודלם של המדגמים הבלתי תלויים עשוי להיות שונה.

הדגימות מושוות באמצעות קריטריונים סטטיסטיים שונים:

  • מבחן t של תלמיד
  • מבחן T Wilcoxon
  • מבחן מאן-וויטני U
  • קריטריון של סימנים
  • וכו.

ייצוגיות

המדגם עשוי להיחשב מייצג או לא מייצג.

דוגמה למדגם לא מייצג

בארצות הברית, אחת הדוגמאות ההיסטוריות המפורסמות ביותר לדגימה לא מייצגת היא המקרה שהתרחש במהלך הבחירות לנשיאות ב-1936. The Literary Digest, שניבא בהצלחה את אירועי כמה בחירות קודמות, לא העריך נכון את תחזיותיו בכך ששלח עשרה מיליון פתקי מבחן למנויים שלו, אנשים שנבחרו מספרי טלפונים ברחבי הארץ ואנשים מרשימות רישום מכוניות. ב-25% מהקלפיות שהוחזרו (קרוב ל-2.5 מיליון) התחלקו הקולות באופן הבא:

57% העדיפו את המועמד הרפובליקני אלף לנדון

40% בחרו בנשיא הדמוקרטי דאז פרנקלין רוזוולט

כידוע, רוזוולט ניצח בבחירות בפועל עם יותר מ-60% מהקולות. הטעות של The Literary Digest הייתה כזו: ברצונם להגדיל את הייצוגיות של המדגם - מכיוון שהם ידעו שרוב המנויים שלהם רואים עצמם רפובליקנים - הם הרחיבו את המדגם עם אנשים שנבחרו מספרי טלפונים ורשימות רישום. עם זאת, הם לא לקחו בחשבון את המציאות של זמנם ולמעשה גייסו עוד יותר רפובליקנים: בתקופת השפל הגדול, היה זה בעיקר המעמד הבינוני והגבוה (כלומר, רוב הרפובליקנים, לא הדמוקרטים) שיכולים להרשות לעצמם טלפונים ומכוניות משלו.

סוגי תכניות לבניית קבוצות מדגימות

ישנם מספר סוגים עיקריים של תוכנית בנייה קבוצתית:

  • לימוד עם קבוצות ניסוי ובקרה, הממוקמות בתנאים שונים.
  • למד עם קבוצות ניסוי ובקרה באמצעות אסטרטגיית בחירה זוגית
  • לימוד באמצעות קבוצה אחת בלבד - ניסיוני.
  • מחקר באמצעות תכנית מעורבת (פקטוריאלית) - כל הקבוצות ממוקמות בתנאים שונים.

אסטרטגיות לבניית קבוצות

בחירת הקבוצות להשתתפותן בניסוי פסיכולוגי מתבצעת תוך שימוש באסטרטגיות שונות הדרושות על מנת להבטיח את מירב הכבוד לתוקף הפנימי והחיצוני.

  • אקראי (בחירה אקראית)
  • קבוצות ריאליות מעורבות

אקראית

אקראית, או בחירה אקראית, משמש ליצירת דגימות אקראיות פשוטות. השימוש במדגם כזה מבוסס על ההנחה שלכל אחד מבני האוכלוסייה יש סיכוי שווה להיכלל במדגם. לדוגמה, כדי לעשות מדגם אקראי של 100 סטודנטים, אתה יכול לשים מסמכים עם שמות כל הסטודנטים בכובע, ואז להוציא ממנו 100 פיסות נייר - זו תהיה בחירה אקראית (Goodwin J., p. 147).

בחירה זוגית

בחירה זוגית- אסטרטגיה לבניית קבוצות מדגם, שבה קבוצות נבדקים מורכבות מנבדקים שווים מבחינת פרמטרים צדדיים משמעותיים לניסוי. אסטרטגיה זו יעילה עבור ניסויים המשתמשים בקבוצות ניסוי ובקרה עם האפשרות הטובה ביותר - גיוס עובדים

מחקר מתחיל בדרך כלל בהנחה כלשהי, הדורש אימות תוך מעורבות של עובדות. הנחה זו – השערה – מנוסחת ביחס לחיבור של תופעות או תכונות במערך מסוים של אובייקטים.

כדי לבדוק הנחות כאלה על העובדות, יש צורך למדוד את המאפיינים התואמים של הנשאים שלהם. אבל אי אפשר למדוד חרדה אצל כל הנשים והגברים, כפי שאי אפשר למדוד אגרסיביות אצל כל המתבגרים. לכן, כאשר עורכים מחקר, הם מוגבלים רק לקבוצה קטנה יחסית של נציגים של האוכלוסיות הרלוונטיות של אנשים.

אוּכְלוֹסִיָה- זהו מכלול האובייקטים שביחס אליהם מנוסחת השערת מחקר.

למשל, כל הגברים; או כל הנשים; או כל יושבי עיר. האוכלוסיות הכלליות שביחס אליהן עומד החוקר להסיק מסקנות על סמך תוצאות המחקר עשויות להיות קטנות יותר במספרן וצנועות יותר, למשל, כל תלמידי כיתות א' של בית ספר נתון.

לפיכך, האוכלוסייה הכללית היא, אמנם לא אינסופית במספר, אבל, ככלל, מספר רב של נושאים פוטנציאליים בלתי נגישים למחקר מתמשך.

מדגם או אוכלוסיה מדגם- זוהי קבוצת חפצים מוגבלת במספר (בפסיכולוגיה - נושאים, משיבים), שנבחרו במיוחד מהאוכלוסייה הכללית כדי לחקור את תכונותיה. בהתאם, חקר המאפיינים של האוכלוסייה הכללית על מדגם נקרא מחקר סלקטיבי. כמעט כל המחקרים הפסיכולוגיים הם סלקטיביים, ומסקנותיהם מתייחסות לאוכלוסיות כלליות.

לפיכך, לאחר גיבוש ההשערה וקביעת האוכלוסיות הכלליות המתאימות, מתמודד החוקר עם בעיית ארגון המדגם. המדגם צריך להיות כזה שהכללת מסקנות מחקר המדגם תהיה מוצדקת - הכללה, התפלגותן לכלל האוכלוסייה. הקריטריונים העיקריים לתקפות מסקנות המחקראלה הייצוגיות של המדגם והתוקף הסטטיסטי של התוצאות (האמפיריות).

ייצוגיות לדוגמא- במילים אחרות, הייצוגיות שלו היא היכולת של המדגם לייצג את התופעות הנחקרות בצורה מלאה למדי - מנקודת המבט של השונות שלהן באוכלוסייה הכללית.

כמובן שרק האוכלוסייה הכללית יכולה לתת תמונה מלאה של התופעה הנחקרת, על כל מגוון וגווני השונות שלה. לכן, הייצוגיות תמיד מוגבלת במידה שהמדגם מוגבל. והייצוגיות של המדגם היא הקריטריון העיקרי בקביעת גבולות הכללת ממצאי המחקר. עם זאת, ישנן טכניקות המאפשרות קבלת מדגם מייצג מספיק עבור החוקר (טכניקות אלו נלמדות בקורס "פסיכולוגיה ניסויית").


הטכניקה הראשונה והעיקרית היא בחירה אקראית (אקראית) פשוטה. זה כרוך להבטיח שלכל אחד מבני האוכלוסייה יש סיכוי שווה להיכלל במדגם. בחירה אקראית מספקת את האפשרות להיכנס למדגם של הנציגים המגוונים ביותר של האוכלוסייה הכללית. במקביל, ננקטים אמצעים מיוחדים כדי למנוע הופעה של סדירות כלשהי בבחירה. וזה מאפשר לנו לקוות שבסופו של דבר, במדגם, הנכס הנלמד יוצג, אם לא כולו, אז במגוון המקסימלי האפשרי שלו.

הדרך השנייה להבטיח ייצוגיות היא בחירה רנדומלית מרובדת, או בחירה לפי מאפייני האוכלוסייה הכללית. זה כרוך בקביעה ראשונית של אותן תכונות שעשויות להשפיע על השונות של הנכס הנלמד (זה עשוי להיות מגדר, רמת הכנסה או השכלה וכו'). לאחר מכן נקבע היחס באחוזים של מספר הקבוצות (שכבות) השונות באיכויות אלו באוכלוסיה הכללית ומספק יחס אחוז זהה של הקבוצות המקבילות במדגם. יתרה מכך, בכל תת-קבוצה של המדגם נבחרים הנבדקים על פי עקרון הבחירה האקראית הפשוטה.

תוקף סטטיסטי,או מובהקות סטטיסטית, תוצאות המחקר נקבעות באמצעות שיטות מסקנות סטטיסטיות.

האם אנו מבוטחים מפני טעויות בקבלת החלטות, עם מסקנות מסוימות מתוצאות המחקר? ברור שלא. אחרי הכל, ההחלטות שלנו מבוססות על תוצאות מחקר של אוכלוסיה מדגם, כמו גם על רמת הידע הפסיכולוגי שלנו. אנחנו לא חסינים לחלוטין מטעויות. בסטטיסטיקה, טעויות כאלה נחשבות למקובלות אם הן מתרחשות לא יותר ממקרה אחד מתוך 1000 (הסתברות לשגיאה α = 0.001 או הערך המשויך של הסתברות הביטחון של המסקנה הנכונה p = 0.999); במקרה אחד מתוך 100 (הסתברות השגיאה α = 0.01 או הערך המשויך של הסתברות הביטחון של המסקנה הנכונה p = 0.99) או בחמישה מקרים מתוך 100 (הסתברות השגיאה α = 0.05 או הערך המשויך של הסתברות הביטחון של הפלט הנכון p=0.95). בשתי הרמות האחרונות נהוג לקבל החלטות בפסיכולוגיה.

לפעמים, אם כבר מדברים על מובהקות סטטיסטית, נעשה שימוש במושג "רמת מובהקות" (מסומן כ-α). הערכים המספריים של p ו-α משלימים זה את זה עד 1,000 - סט שלם של אירועים: או שעשינו את המסקנה הנכונה, או שעשינו טעות. רמות אלו אינן מחושבות, הן נקבעות. ניתן להבין את רמת המשמעות כמעין קו "אדום", שצומתו יאפשר לנו לדבר על אירוע זה כלא אקראי. בכל דו"ח או פרסום מדעי מוסמכים, המסקנות המתקבלות חייבות להיות מלוות באינדיקציה של ערכי p או α שלפיהם מתקבלות המסקנות.

שיטות להסקה סטטיסטית נדונות בהרחבה בקורס "סטטיסטיקה מתמטית". לעת עתה, נציין רק שהם מטילים דרישות מסוימות על המספר, או גודל המדגם.

למרבה הצער, אין המלצות קפדניות על קביעה ראשונית של גודל המדגם הנדרש. יתרה מכך, החוקר בדרך כלל מקבל תשובה לשאלה לגבי המספר הדרוש והמספיק ממנה מאוחר מדי - רק לאחר ניתוח הנתונים של המדגם שכבר נבדק. עם זאת, ניתן לנסח את ההמלצות הכלליות ביותר:

1. יש צורך בגודל המדגם הגדול ביותר בעת פיתוח טכניקת אבחון - מ-200 עד 1000-2500 איש.

2. אם יש צורך להשוות בין 2 דגימות, מספרן הכולל חייב להיות לפחות 50 איש; מספר הדגימות המושוואות צריך להיות בערך זהה.

3. אם נחקר הקשר בין נכסים כלשהם, אז גודל המדגם צריך להיות לפחות 30-35 אנשים.

4. כמה שיותר הִשׁתַנוּתמהנכס הנחקר, ככל שגודל המדגם צריך להיות גדול יותר. לכן, ניתן להפחית את השונות על ידי הגדלת ההומוגניות של המדגם, למשל לפי מין, גיל וכו'. זה כמובן מקטין את האפשרות להכליל מסקנות.

דגימות תלויות ובלתי תלויות.מצב מחקר טיפוסי הוא כאשר נכס שמעניין את החוקר נלמד על שתי דגימות או יותר לצורך השוואה נוספת ביניהן. דגימות אלו עשויות להיות בפרופורציות שונות, בהתאם לנוהל הארגון שלהן. דגימות עצמאיות מאופיינים בכך שההסתברות לבחירה של כל נושא ממדגם אחד אינה תלויה בבחירה של אף אחד מהנבדקים של מדגם אחר. מול, דגימות תלויותמאופיינים בכך שלכל נושא ממדגם אחד מתאימים קריטריון מסוים עם נושא ממדגם אחר.

במקרה הכללי, מדגמים תלויים כוללים בחירה זוגית של נבדקים במדגמים המושוואים, ומדגמים בלתי תלויים - בחירה עצמאית של נבדקים.

יצוין כי מקרים של מדגמים "תלויים חלקית" (או "בלתי תלויים חלקית") אינם מותרים: הדבר פוגע בייצוגיות שלהם באופן בלתי צפוי.

לסיכום, נציין שניתן להבחין בשתי פרדיגמות של מחקר פסיכולוגי.

מה שנקרא R-מתודולוגיהכרוך בחקר השונות של נכס מסוים (פסיכולוגי) בהשפעת השפעה כלשהי, גורם או נכס אחר. המדגם הוא סט של נושאים.

גישה אחרת מתודולוגיית Q,כולל חקר השונות של הנושא (יחיד) בהשפעת גירויים שונים (מצבים, מצבים וכו'). זה מתאים למצב כאשר המדגם הוא קבוצה של גירויים.