جامعه عمومی و روش نمونه گیری. مبانی نمونه گیری و تشکیل یک نمونه تصادفی ساده نتایج نمونه ارائه شده است

اهداف یادگیری

تمایز بین مفاهیم سرشماری (صلاحیت) و نمونه گیری واضح است.
ماهیت و توالی شش مرحله اجرا شده توسط محققین برای به دست آوردن جامعه نمونه را بشناسید.
مفهوم "قاب نمونه گیری" را تعریف کنید.
تفاوت بین نمونه گیری احتمالی و قطعی را توضیح دهید.
بین نمونه گیری با اندازه ثابت و نمونه گیری چند مرحله ای (متوالی) تمایز قائل شوید.
نمونه گیری عمدی چیست و نقاط قوت و ضعف آن را توضیح دهید.
مفهوم نمونه گیری سهمیه ای را تعریف کنید.
توضیح دهید که یک پارامتر در یک روش انتخاب چیست.
مجموعه مشتق شده را توضیح دهید.
توضیح دهید که چرا مفهوم توزیع نمونه مهمترین مفهوم آمار است.

بنابراین محقق مسئله را به طور دقیق تعریف کرده و طرح تحقیق و ابزار گردآوری اطلاعات مناسب را برای حل آن تامین کرده است. گام بعدی در فرآیند تحقیق باید انتخاب عناصر مورد بررسی باشد. بررسی هر عنصر از یک جمعیت معین با سرشماری کامل این جمعیت امکان پذیر است. به بررسی کامل جمعیت، سرشماری (صلاحیت) می گویند. احتمال دیگری نیز وجود دارد. بخش خاصی از جامعه، نمونه ای از عناصر یک گروه بزرگ، مورد بررسی آماری قرار می گیرند و با توجه به داده های به دست آمده از این زیر مجموعه، نتایج خاصی در مورد کل گروه به دست می آید. توانایی تعمیم نتایج به‌دست‌آمده از داده‌های نمونه به یک گروه بزرگ بستگی به روشی دارد که از آن نمونه گرفته شده است. بخش اعظم این فصل به نحوه ترسیم نمونه و چرایی آن اختصاص داده خواهد شد.

سرشماری (صلاحیت)
سرشماری کامل نفوس (جمعیت).
نمونه
مجموعه ای از عناصر زیر مجموعه ای از یک گروه بزرگتر از اشیاء.

مفهوم «جمعیت» یا «مجموعه» می‌تواند نه تنها به افراد، بلکه به شرکت‌های فعال در صنعت تولید، خرده‌فروشان یا عمده‌فروشان، یا حتی به اشیاء کاملاً بی‌جان، مانند قطعات تولید شده توسط شرکت اشاره داشته باشد. این مفهوم به عنوان کل مجموعه ای از عناصر تعریف می شود که شرایط معین خاصی را برآورده می کند. این شرایط به طور منحصربه‌فردی هم عناصری را که به گروه هدف تعلق دارند و هم عناصری را که باید از بررسی حذف شوند، تعریف می‌کنند.

مطالعه‌ای که با هدف تعیین مشخصات جمعیتی مصرف‌کنندگان پیتزا منجمد انجام می‌شود، باید با شناسایی افرادی که باید و نباید به عنوان آن دسته‌بندی شوند، آغاز شود. آیا افرادی که حداقل یک بار چنین پیتزایی را امتحان کرده اند جزو این دسته هستند؟ افرادی که حداقل یک پیتزا در ماه می خرند؟ در هفته؟ افرادی که در یک ماه بیش از حداقل مقدار مشخصی پیتزا می خورند؟ محقق باید در تعیین گروه هدف بسیار دقیق باشد. همچنین باید دقت شود که نمونه از جامعه هدف گرفته شود نه از جمعیت «بعضی»، که در مواردی که چارچوب نمونه گیری ناکافی یا ناقص باشد، صدق می کند. مورد دوم فهرستی از عناصری است که از آنها یک نمونه واقعی تشکیل می شود.

یک محقق ممکن است به چند دلیل رویکرد نمونه گیری را به نظرسنجی از کل جمعیت ترجیح دهد. اولاً، بررسی کامل یک جمعیت، حتی با اندازه نسبتاً کوچک، مستلزم هزینه های بسیار زیاد مواد و زمان است. اغلب، زمانی که سرشماری تکمیل می‌شود و داده‌ها پردازش می‌شوند، اطلاعات قبلاً قدیمی شده‌اند. در برخی موارد، صلاحیت به سادگی غیرممکن است. فرض کنید که محققان تصمیم گرفتند انطباق عمر واقعی لامپ های رشته ای الکتریکی را با عمر محاسبه شده بررسی کنند، که برای این کار باید آنها را تا زمانی که از کار بیفتند روشن نگه دارند. اگر کل عرضه لامپ ها را از این طریق بررسی کنید، داده های قابل اعتمادی به دست می آید، اما چیزی برای معامله وجود نخواهد داشت.

در نهایت، در کمال شگفتی مبتدیان، محقق ممکن است نمونه گیری را به سرشماری ترجیح دهد و برای صحت نتایج تلاش کند. سرشماری ها به کارکنان زیادی نیاز دارند که احتمال خطاهای سوگیری (غیر نمونه برداری) را افزایش می دهد. این شرایط یکی از دلایلی است که اداره سرشماری ایالات متحده از بررسی های نمونه برای آزمایش صحت انواع مختلف سرشماری استفاده می کند. درست خواندید: بررسی های نمونه را می توان برای آزمایش صحت داده های صلاحیت انجام داد.

نمونه مراحل طراحی

روی انجیر شکل 15.1 یک توالی شش مرحله ای را نشان می دهد که محقق می تواند هنگام طراحی یک نمونه دنبال کند. ابتدا باید جامعه هدف یا مجموعه عناصری را که محقق می خواهد درباره آنها بداند، مشخص شود.

به عنوان مثال، هنگام مطالعه ترجیحات کودکان، محققان باید تصمیم بگیرند که آیا جمعیت هدف شامل تنها فرزندان، فقط والدین یا هر دو خواهد بود.

جمع (جمعیت)
مجموعه ای از عناصر که شرایط مشخصی را برآورده می کنند.
قاب نمونه برداری (پایه)
فهرست عناصری که انتخاب از آنها انجام خواهد شد؛ ممکن است از واحدهای سرزمینی، سازمان ها، افراد و سایر عناصر تشکیل شود.

یک شرکت خاص "مسابقه" الکتریکی خود را فقط روی کودکان آزمایش کرد. بچه ها کاملا مجذوب شدند. والدین به این تازگی واکنش متفاوتی نشان دادند. مادران این واقعیت را دوست نداشتند که جاذبه به بچه‌ها یاد نمی‌داد که ماشین‌پسند باشند، و پدرها از این که محصول مانند یک اسباب‌بازی ساخته شده بود، خوششان نیامد.
وضعیت معکوس نیز ممکن است. یک شرکت یک محصول غذایی جدید راه اندازی کرد و یک کمپین تبلیغاتی سراسری را راه اندازی کرد که بر روی کودک نابالغ متمرکز بود. این شرکت اثربخشی آگهی های تبلیغاتی را فقط بر روی مادرانی که هیجان زده بودند آزمایش کرد. از طرف دیگر، بچه ها این "شتاب" و همراه با آن خود محصول تبلیغ شده را منزجر کننده می دانستند. محصول به پایان رسید 1 .

محقق باید تصمیم بگیرد که جمعیت مربوطه شامل چه کسانی یا چه کسانی خواهد بود: افراد، خانواده ها، شرکت ها، سازمان های دیگر، تراکنش های کارت اعتباری و غیره. ارجاع زمانی و جغرافیایی عناصر باید انجام شود که در برخی موارد ممکن است مشمول شرایط یا محدودیت های اضافی باشد. به عنوان مثال، اگر در مورد افراد صحبت می کنیم، جمعیت مورد نظر ممکن است فقط شامل افراد بالای 18 سال یا فقط زنان یا فقط افراد دارای حداقل تحصیلات متوسطه باشد.

وظیفه تعیین مرزهای جغرافیایی برای جمعیت هدف در تحقیقات بازاریابی بین المللی می تواند یک مشکل خاص باشد، زیرا این امر ناهمگونی سیستم مورد بررسی را افزایش می دهد. به عنوان مثال، نسبت نسبی مناطق شهری و روستایی می تواند به طور قابل توجهی از کشوری به کشور دیگر متفاوت باشد. بعد سرزمینی تأثیر جدی بر ترکیب جمعیت و در داخل همان کشور دارد. به عنوان مثال، در شمال شیلی، جمعیتی عمدتاً هندی به طور فشرده زندگی می کنند، در حالی که در مناطق جنوبی کشور، عمدتاً نوادگان اروپایی ها زندگی می کنند.

پوشش (حادثه)
درصد اعضای یک جامعه یا گروهی که شرایط ورود به نمونه را دارند.

به طور کلی، هرچه جامعه هدف ساده‌تر تعریف شود، پوشش (بروز) آن بیشتر و روش نمونه‌گیری آسان‌تر و ارزان‌تر است. پوشش (حادثه)مربوط به نسبت عناصر یک جمعیت یا گروه است که به صورت درصد بیان می شود که شرایط گنجاندن در نمونه را برآورده می کند. پوشش مستقیماً بر زمان و هزینه های مواد مورد نیاز برای انجام یک نظرسنجی تأثیر می گذارد. اگر پوشش وسیع باشد (یعنی اکثر عناصر جمعیت دارای یک یا چند معیار ساده مورد استفاده برای شناسایی پاسخ دهندگان بالقوه باشند)، زمان و هزینه مورد نیاز برای جمع آوری داده ها به حداقل می رسد. برعکس، با افزایش تعداد معیارهایی که پاسخ دهندگان بالقوه باید رعایت کنند، هزینه های مادی و زمانی افزایش می یابد.

روی انجیر 15.2 نسبت جمعیت بزرگسال درگیر در ورزش های خاص را نشان می دهد. داده های شکل نشان می دهد که بررسی افرادی که به موتورسواری می روند (فقط 3.6٪ از کل بزرگسالان) بسیار دشوارتر و پرهزینه تر از بررسی افرادی است که به طور منظم پیاده روی تفریحی انجام می دهند (27.4٪ از تعداد کل افراد). بزرگسالان). نکته اصلی این است که محقق در تعیین اینکه چه عناصری باید در جامعه مورد مطالعه قرار گیرند و چه عناصری باید از آن حذف شوند، دقیق باشد. بیان واضح هدف مطالعه تا حد زیادی حل این مشکل را تسهیل می کند. مرحله دوم در فرآیند نمونه برداری، تعیین چارچوب نمونه برداری است، که همانطور که می دانید، فهرست عناصری است که نمونه از آنها گرفته می شود. بگذارید جمعیت هدف یک مطالعه خاص همه خانواده‌های ساکن در منطقه دالاس باشد. در نگاه اول، فهرست تلفن دالاس ممکن است یک قاب نمونه خوب و به راحتی قابل دسترسی باشد. با این وجود، با بررسی دقیق تر، مشخص می شود که فهرست خانواده های مندرج در فهرست کاملاً صحیح نیست، زیرا شماره برخی از خانواده ها در آن حذف شده است (البته شامل خانواده های فاقد تلفن نمی شود). برخی از خانواده ها چندین شماره تلفن دارند. افرادی که اخیراً محل سکونت و بر این اساس شماره تلفن خود را تغییر داده اند نیز در فهرست حضور ندارند.

محققان با تجربه به این نتیجه می رسند که تطابق دقیق بین چارچوب نمونه گیری و جامعه هدف مورد علاقه بسیار نادر است. یکی از خلاقانه ترین مراحل در طراحی نمونه، تعیین چارچوب نمونه گیری مناسب در مواردی است که فهرست بندی اعضای جامعه مشکل است. این ممکن است نیاز به نمونه برداری از بلوک های کاری و پیشوندها داشته باشد، به عنوان مثال زمانی که از شماره گیری تصادفی به دلیل نقص در فهرست های تلفن استفاده می شود. با این حال، افزایش چشمگیر واحدهای کاری طی 10 سال گذشته این کار را دشوارتر کرده است. وضعیت‌های مشابهی نیز در مورد مشاهده انتخابی مناطق یا سازمان‌های سرزمینی و به دنبال آن نمونه‌گیری فرعی، زمانی که مثلاً جمعیت هدف افراد هستند، اما فهرست دقیق و به‌روزی از آنها وجود ندارد، ممکن است رخ دهد.

منبع: بر اساس داده های موجود در SSI- LITE TM: L ow بروز تیهدف قرار گرفته است اس ampling" (Fairfield, Conn.: Survey Sampling, Inc., 1994).

مرحله سوم در روش نمونه گیری ارتباط نزدیکی با تعیین چارچوب نمونه گیری دارد. انتخاب روش یا روش نمونه گیری تا حد زیادی به چارچوب نمونه گیری اتخاذ شده توسط محقق بستگی دارد. انواع مختلف نمونه ها به انواع مختلفی از قاب های نمونه گیری نیاز دارند. این و فصل بعدی مروری بر انواع اصلی نمونه های مورد استفاده در تحقیقات بازاریابی ارائه می دهد. هنگام توصیف آنها، ارتباط بین قاب نمونه برداری و روش تشکیل آن باید آشکار شود.

مرحله چهارم در روش نمونه گیری، تعیین حجم نمونه است. این مشکل در فصل بحث شده است. 17. در مرحله پنجم، محقق باید عناصری را که مورد بررسی قرار می‌گیرند، انتخاب کند. روش مورد استفاده برای این کار با نوع نمونه انتخاب شده تعیین می شود. هنگام بحث در مورد روش های نمونه گیری، در مورد انتخاب عناصر آن نیز صحبت خواهیم کرد. و در نهایت، محقق نیاز به بررسی واقعی پاسخ دهندگان شناسایی شده دارد. در این مرحله احتمال ارتکاب تعدادی خطا زیاد است.
این مشکلات و چند روش برای حل آنها در فصل مورد بحث قرار گرفته است. هجده.

انواع طرح های نمونه گیری (نمونه گیری)

تمام روش های نمونه گیری را می توان به دو دسته مشاهده نمونه های احتمالی و مشاهده نمونه های قطعی تقسیم کرد. در یک نمونه احتمالی، هر یک از اعضای جامعه را می توان با یک احتمال غیر صفر مشخص شده در نظر گرفت. احتمال گنجاندن اعضای خاصی از جامعه در نمونه ممکن است متفاوت باشد، اما احتمال گنجاندن هر عنصر در آن مشخص است. این احتمال با روش مکانیکی خاصی که برای انتخاب اعضای نمونه استفاده می شود، تعیین می شود.

برای نمونه های قطعی، تخمین احتمال گنجاندن هر عنصر در نمونه غیرممکن می شود. نمایندگی چنین نمونه ای را نمی توان تضمین کرد. مثلا، شرکت آل استیتسیستمی برای پردازش داده‌های مربوط به ادعاها توسعه داده است غرامت بیمه 14 میلیون خانوار (مشتریان آنها). این شرکت قصد دارد از این داده ها برای تعیین الگوهای تقاضا برای خدمات خود استفاده کند، مانند این احتمال که خانواده ای که صاحب مرسدس بنز است نیز صاحب خانه تعطیلات شود (که به بیمه نیاز دارد). اگرچه پایگاه داده بسیار بزرگ است، اما شرکت ابزاری برای برآورد احتمال ادعای هر مشتری خاص ندارد. بنابراین، شرکت نمی تواند مطمئن باشد که داده های مشتری که ادعا می کند نماینده همه مشتریان شرکت است. و حتی به میزان کمتر - در رابطه با مشتریان بالقوه.

همه نمونه های قطعی بر اساس موقعیت، قضاوت یا ترجیحات شخصی محقق است، نه بر اساس روش انتخاب مکانیکی برای اعضای نمونه. چنین ترجیحاتی گاهی اوقات می تواند بدهد نمرات خوبویژگی های جامعه، با این حال، هیچ راهی برای تعیین عینی انطباق نمونه با کار وجود ندارد. ارزیابی صحت نتایج نمونه تنها در صورتی می‌تواند انجام شود که احتمال انتخاب عناصر خاص شناخته شده باشد. به همین دلیل، معمولاً کار با نمونه‌گیری احتمالی روش بهتری برای تخمین بزرگی خطای نمونه‌گیری در نظر گرفته می‌شود. نمونه ها را می توان به نمونه های با اندازه ثابت و نمونه های متوالی نیز تقسیم کرد. هنگام کار با نمونه های با اندازه ثابت، اندازه نمونه قبل از شروع نظرسنجی تعیین می شود و تجزیه و تحلیل نتایج با جمع آوری تمام داده های لازم مقدم است. ما عمدتاً به نمونه های با اندازه ثابت علاقه مند خواهیم بود، زیرا این نوع معمولاً در تحقیقات بازاریابی استفاده می شود.

نمونه گیری احتمالی
نمونه ای که هر عنصر از جامعه را می توان با احتمال غیر صفر شناخته شده در آن گنجاند.
نمونه گیری قطعی
نمونه گیری بر اساس برخی ترجیحات یا قضاوت های خاص که انتخاب عناصر خاص را تعیین می کند. در عین حال، برآورد احتمال گنجاندن یک عنصر دلخواه از جامعه در نمونه غیرممکن می شود.

با این حال، نباید فراموش کرد که نمونه‌های متوالی نیز وجود دارند که می‌توانند با هر یک از طرح‌های نمونه‌برداری اولیه مورد بحث در زیر استفاده شوند.

در یک نمونه متوالی، تعداد عناصر انتخاب شده از قبل مشخص نیست، بر اساس یک سری تصمیمات متوالی تعیین می شود. اگر بررسی یک نمونه کوچک به یک نتیجه قابل اعتماد منتهی نشود، دامنه عناصر مورد بررسی گسترش می یابد. اگر بعد از آن نتیجه غیر قطعی باقی بماند، حجم نمونه مجددا افزایش می یابد. در هر مرحله، تصمیم گرفته می شود که آیا نتیجه به دست آمده به اندازه کافی قانع کننده در نظر گرفته شود یا اینکه به جمع آوری داده ها ادامه دهیم. کار با نمونه گیری متوالی امکان ارزیابی روند (روند) داده ها را در حین جمع آوری آنها ممکن می کند، که به شما امکان می دهد در مواردی که مصلحت آنها به نتیجه نمی رسد، هزینه های مربوط به مشاهدات اضافی را کاهش دهید.

هر دو طرح نمونه گیری احتمالی و قطعی به انواع مختلفی تقسیم می شوند. به عنوان مثال، نمونه های قطعی می توانند غیرنماینده (مناسب)، عمدی یا سهمیه ای باشند؛ نمونه های احتمالی به تصادفی ساده، طبقه ای یا گروهی (خوشه ای) تقسیم می شوند، آنها به نوبه خود می توانند به زیرگروه ها تقسیم شوند. روی انجیر شکل 15.3 انواع نمونه هایی را نشان می دهد که در این فصل و فصل بعدی مورد بحث قرار خواهند گرفت.

نمونه ثابت (نمونه ثابت)
نمونه ای که اندازه آن از قبل تعیین می شود. اطلاعات مورد نیاز توسط عناصر انتخاب شده تعیین می شود.
نمونه برداری متوالی
نمونه ای بر اساس یک سری تصمیمات متوالی تشکیل شده است. اگر پس از در نظر گرفتن یک نمونه کوچک، نتیجه قطعی نباشد، نمونه بزرگتری در نظر گرفته می شود. اگر این مرحله منجر به نتیجه نشد، حجم نمونه مجددا افزایش می یابد و غیره. بنابراین در هر مرحله تصمیم گیری می شود که آیا نتیجه به دست آمده را می توان به اندازه کافی قانع کننده در نظر گرفت یا خیر.

باید به خاطر داشت که انواع اولیه نمونه ها را می توان با هم ترکیب کرد تا طرح های نمونه گیری پیچیده تری را تشکیل دهد. اگر انواع اولیه اولیه آنها را یاد بگیرید، مقابله با ترکیب های پیچیده تر برای شما آسان تر خواهد بود.

انتخاب های قطعی

همانطور که قبلا ذکر شد، هنگام انتخاب عناصر یک نمونه قطعی، برآوردها یا تصمیمات خصوصی نقش تعیین کننده ای دارند. گاهی اوقات این ارزیابی ها از سوی محقق انجام می شود، در حالی که در موارد دیگر انتخاب عناصر جمعیتی به کارکنان میدانی داده می شود. از آنجایی که عناصر به صورت مکانیکی انتخاب نمی شوند، تعیین احتمال گنجاندن یک عنصر دلخواه در نمونه و بر این اساس، خطای نمونه گیری غیرممکن می شود. نادیده گرفتن خطا به دلیل روش نمونه گیری انتخاب شده، محققان را از ارزیابی دقت برآوردهای خود باز می دارد.

نمونه های غیر نماینده (راحتی).

نمونه های غیر نماینده (راحتی).گاهی اوقات به عنوان تصادفی نامیده می شود، زیرا انتخاب عناصر نمونه به روش "تصادفی" انجام می شود - آن عناصری که در طول دوره انتخاب در دسترس هستند یا به نظر می رسد در دسترس ترین هستند انتخاب می شوند.

زندگی روزمره ما مملو از نمونه هایی از این گونه انتخاب هاست. با دوستان گفت و گو می کنیم و بر اساس واکنش ها و موضع گیری های آنها، در مورد تمایلات سیاسی حاکم بر جامعه نتیجه می گیریم. یک ایستگاه رادیویی محلی مردم را تشویق می کند که نظر خود را در مورد برخی از موضوعات بحث برانگیز بیان کنند، نظر آنها غالباً تفسیر می شود. ما خواستار همکاری داوطلبان و همکاری با کسانی هستیم که داوطلبانه به ما کمک کنند. مشکل نمونه‌های راحت واضح است - نمی‌توانیم مطمئن باشیم که نمونه‌هایی از این نوع واقعاً جامعه هدف را نشان می‌دهند. که نظر دوستان ما به درستی منعکس کننده است دیدگاه های سیاسیدر جامعه غالب است، ما هنوز می توانیم شک کنیم، اما اغلب می خواهیم باور کنیم که نمونه های بزرگتر، که به طور مشابه انتخاب شده اند، نماینده هستند. اجازه دهید غلط بودن چنین فرضی را با مثالی نشان دهیم.
چند سال پیش یکی از شبکه های تلویزیونی محلی در شهری که نویسنده این کتاب در آن زندگی می کند، هر روز یک نظرسنجی عمومی در مورد موضوعات مورد علاقه جامعه محلی انجام می داد. این نظرسنجی که «نبض مدیسون» نام دارد به شرح زیر انجام شده است. هر روز غروب در جریان اخبار ساعت شش، این شبکه در رابطه با موضوعی جنجالی خاص از بینندگان سوال می کرد که لازم بود به آن پاسخ مثبت یا منفی داده شود.

در صورت پاسخ مثبت، لازم بود با یکی تماس بگیرید، در صورت پاسخ منفی - به شماره تلفن دیگری. تعداد آرای موافق و مخالف به صورت خودکار شمارش شد. خبرگزاری ساعت ده نتایج نظرسنجی تلفنی را گزارش کرد. هر روز عصر بین 500 تا 1000 نفر با استودیو تماس می گرفتند تا موضع خود را در مورد این یا آن موضوع بیان کنند. این مفسر تلویزیون نتایج این نظرسنجی را به عنوان نظر غالب در جامعه تفسیر کرد.

نمونه غیر نماینده (راحتی).
گاهی اوقات تصادفی نامیده می شود، زیرا انتخاب عناصر نمونه به روش "تصادفی" انجام می شود - آن عناصری که در طول دوره انتخاب بیشترین دسترسی را دارند یا به نظر می رسد انتخاب می شوند.

در یکی از قسمت های شش ساعته، از بینندگان این سوال پرسیده شد: "آیا فکر نمی کنید سن نوشیدن در مدیسون باید به 18 کاهش یابد؟" صلاحیت قانونی موجود مربوط به 21 سال بود. حضار با فعالیت فوق العاده ای به این سوال واکنش نشان دادند - تقریباً 4000 نفر در آن شب با استودیو تماس گرفتند که 78٪ از آنها موافق کاهش محدودیت سنی بودند. به نظر واضح است که یک نمونه 4000 نفری "باید نماینده" یک جامعه 180000 نفری باشد. همانطور که ممکن است حدس زده باشید، گروه های سنی خاصی بیشتر از سایرین به یک نتیجه شناخته شده علاقه مند بودند. بر این اساس، جای تعجب نداشت که در بحث این موضوع که چند هفته بعد انجام شد، مشخص شد که در مدت زمانی که برای نظرسنجی در نظر گرفته شده بود، دانشجویان به صورت هماهنگ عمل کردند. آنها به نوبت هر کدام چندین بار با تلویزیون تماس گرفتند. بنابراین، نه حجم نمونه و نه درصد مدافعان آزادسازی قانون چیز شگفت‌انگیزی نبود. نمونه نماینده نبود.

صرفاً افزایش حجم نمونه آن را نماینده نمی کند. نماینده بودن نمونه نه با اندازه، بلکه با روش مناسب برای انتخاب عناصر تضمین می شود. هنگامی که شرکت کنندگان در نظرسنجی به طور داوطلبانه انتخاب می شوند یا موارد نمونه بر اساس در دسترس بودن آنها انتخاب می شوند، طرح نمونه گیری نماینده بودن نمونه را تضمین نمی کند. شواهد تجربی نشان می دهد که نمونه هایی که برای راحتی انتخاب می شوند به ندرت نماینده هستند (صرف نظر از اندازه آنها). نظرسنجی های تلفنی که 800-900 رای را در نظر می گیرند، رایج ترین نمونه های بزرگ اما غیرنماینده هستند.

نمونه گیری عمدی
نمونه گیری قطعی (هدفمند) که عناصر آن به صورت دستی انتخاب می شوند. عناصری انتخاب می شوند که از نظر محقق اهداف نظرسنجی را برآورده می کنند.
نمونه گیری عمدی، بسته به توانایی محقق در تنظیم مجموعه اولیه پاسخ دهندگان با ویژگی های مورد نظر. سپس از این پاسخ دهندگان به عنوان خبرچینی استفاده می شود که انتخاب بیشتر افراد را تعیین می کند.

متأسفانه بسیاری از افراد با اطمینان به نتایج چنین نظرسنجی هایی برخورد می کنند. یکی از بارزترین نمونه‌های استفاده از نمونه‌های غیرنماینده در تحقیقات بازاریابی بین‌المللی، بررسی برخی کشورها بر اساس نمونه‌ای متشکل از خارجی‌های مقیم این لحظهدر قلمرو کشوری که این نظرسنجی را آغاز کرده است (به عنوان مثال، اسکاندیناویایی که در ایالات متحده زندگی می کنند). اگرچه چنین نمونه هایی ممکن است جنبه های خاصی از جمعیت مورد بررسی را روشن کند، اما باید به خاطر داشت که این افراد معمولاً نماینده نخبگان "آمریکایی شده" هستند که ارتباط آنها با کشور خود ممکن است نسبتاً خودسرانه باشد. استفاده از نمونه های غیرنماینده برای بررسی های توصیفی یا علی توصیه نمی شود. آنها فقط در تحقیقات اکتشافی با هدف آزمایش ایده ها یا ایده های خاص قابل قبول هستند، اما حتی در این مورد نیز استفاده از نمونه های عمدی ترجیح داده می شود.

انتخاب های عمدی

نمونه های عمدی گاهی اوقات به عنوان بدون تمرکز; عناصر آنها که به نظر محقق اهداف تحقیق را برآورده می کنند، به صورت دستی انتخاب می شوند. پراکتر اند گمبلاز این روش برای نمایش تبلیغات به افراد 13 تا 17 ساله که در نزدیکی دفتر مرکزی خود در سینسیناتی زندگی می‌کنند، استفاده کرد. تقسیم بندی شرکت محصولات غذاییو نوشیدنی ها این گروه از نوجوانان را استخدام کردند تا به عنوان نمونه ای از مصرف کنندگان عمل کنند. آنها 10 ساعت در هفته در ازای 1000 دلار کار می کردند و به یک کنسرت می رفتند، تبلیغات تلویزیونی را تماشا می کردند، با مدیران شرکت ها از سوپرمارکت ها بازدید می کردند تا نمایش محصولات را مشاهده کنند، محصولات جدید را آزمایش کردند و درباره رفتار خرید صحبت کردند. با انتخاب نمایندگانی برای نمونه از طریق فرآیند «استخدام» به جای تصادفی، یک شرکت می‌تواند روی ویژگی‌هایی که مفید می‌داند، مانند توانایی نوجوان برای بیان واضح خود، با این خطر که دیدگاه‌های آنها نماینده گروه سنی آنها نباشد، تمرکز کند. .

همانطور که قبلا ذکر شد، ویژگی متمایز نمونه گیری عمدی، انتخاب جهت عناصر آن است. در برخی موارد، اقلام نمونه نه به این دلیل انتخاب می شوند که نماینده هستند، بلکه به این دلیل که می توانند اطلاعات مورد علاقه خود را در اختیار محققان قرار دهند. هنگامی که دادگاه با شهادت یک کارشناس هدایت می شود، به نوعی به استفاده از انتخاب عمدی متوسل می شود. موقعیت مشابهی ممکن است در توسعه حاکم باشد پروژه های تحقیقاتی. در طول مطالعه اولیه موضوع، محقق در درجه اول علاقه مند به تعیین چشم انداز مطالعه است که انتخاب عناصر نمونه را تعیین می کند.

نمونه برداری گلوله برفینوعی نمونه‌گیری عمدی است که هنگام برخورد با انواع خاصی از جمعیت استفاده می‌شود. این نمونه به توانایی محقق در تعیین مجموعه اولیه از پاسخ دهندگان با ویژگی های مورد نظر بستگی دارد. سپس از این پاسخ دهندگان به عنوان خبرچین برای تعیین انتخاب بیشتر افراد استفاده می شود.

به عنوان مثال، تصور کنید که یک شرکت می خواهد نیاز به محصولی را ارزیابی کند که به افراد ناشنوا امکان برقراری ارتباط تلفنی را می دهد. محققان می توانند با شناسایی چهره های کلیدی در جامعه ناشنوایان شروع به توسعه این مشکل کنند. دومی می تواند سایر اعضای گروه را که موافق شرکت در نظرسنجی هستند نام ببرند. با این تاکتیک، نمونه مانند گلوله برفی رشد می کند.

در حالی که محقق در مراحل اولیه حل مسئله است، زمانی که چشم اندازها و محدودیت های احتمالی نظرسنجی برنامه ریزی شده مشخص می شود، استفاده از نمونه گیری عمدی می تواند بسیار موثر باشد. اما به هیچ وجه نباید از نقاط ضعف این نوع نمونه غافل شد، زیرا محقق می تواند در مطالعات توصیفی یا علّی نیز از آن استفاده کند که تأثیری بر کیفیت نتایج آنها دیر نخواهد داشت. یک مثال کلاسیک از این فراموشی، شاخص قیمت مصرف کننده ("CPI") است. همانطور که سودمن اشاره می کند ( سودمن): «CPI فقط برای 56 شهر و کلان شهر تعیین شده است که انتخاب آنها نیز تحت تأثیر عامل سیاسی است. در واقع، این شهرها فقط می توانند خود را نشان دهند، در حالی که شاخص نامیده می شود شاخص قیمت مصرف کننده برای شهرنشینانی که دستمزد ساعتی دریافت می کنند*، و کارمندانو برای اکثر مردم به عنوان یک شاخص نشان دهنده سطح قیمت در هر منطقه ای از ایالات متحده ظاهر می شود. انتخاب فروشگاه های خرده فروشی نیز به صورت غیر تصادفی انجام می شود که در نتیجه آن تخمین خطای نمونه گیری احتمالی غیرممکن می شود» (مورب ما) 2 .

* یعنی کارگران. - توجه داشته باشید. مطابق.

نمونه های سهمیه ای

نوع سوم نمونه گیری قطعی - نمونه های سهمیه ای; نمایندگی شناخته شده آن با گنجاندن همان نسبت عناصر با ویژگی های خاص در جمعیت مورد بررسی به دست می آید (به "پنجره تحقیق 15.1" مراجعه کنید). به عنوان مثال، تلاش برای ایجاد یک نمونه نماینده از دانشجویان ساکن در محوطه دانشگاه را در نظر بگیرید. اگر در یک نمونه معین 500 نفری، حتی یک دانشجوی ارشد وجود نداشته باشد، ما حق خواهیم داشت در معرف بودن آن و اعتبار اعمال نتایج به دست آمده از این نمونه در جامعه مورد مطالعه تردید کنیم. هنگام کار با نمونه گیری متناسب، محقق می تواند اطمینان حاصل کند که نسبت دانشجویان کارشناسی در نمونه با نسبت آنها در تعداد کل دانشجویان مطابقت دارد.

فرض کنید که یک محقق یک مطالعه انتخابی از دانشجویان دانشگاه انجام می دهد، در حالی که او علاقه مند به این واقعیت است که نمونه نه تنها تعلق آنها به یک یا جنس دیگر را نشان می دهد، بلکه توزیع آنها را بر اساس دوره ها نیز نشان می دهد. تعداد کل دانش‌آموزان 10000 نفر باشد: 3200 دانشجوی سال اول، 2600 دانش‌آموز سال دوم، 2200 دانش‌آموز سال سوم و 2000 دانشجوی سال چهارم. که 7000 پسر و 3000 دختر. برای حجم نمونه 1000 نفری، طرح نمونه گیری متناسب به 320 دانشجوی سال اول، 260 دانشجوی سال دوم، 220 نفر سال سوم و 200 فارغ التحصیل، 700 پسر و 300 دختر نیاز دارد. محقق می تواند با دادن یک سهمیه به هر مصاحبه کننده، این طرح را اجرا کند که مشخص می کند با چه دانشجویانی باید تماس بگیرد.

نمونه گیری سهمیه اییک نمونه قطعی، انتخاب شده به گونه ای که نسبت عناصر نمونه با ویژگی های معین تقریباً با نسبت همان عناصر در جامعه مورد مطالعه مطابقت داشته باشد. به هر کارگر میدانی سهمیه ای اختصاص می یابد که ویژگی های جمعیتی را که باید با آنها تماس بگیرد مشخص می کند.

ممکن است به مصاحبه کننده ای که قرار است 20 مصاحبه انجام دهد دستور داده شود که بپرسد:

شش دانش آموز سال اول - پنج پسر و یک دختر.
شش دانش آموز دوم - چهار پسر و دو دختر.
چهار دانش آموز سال سوم - سه پسر و یک دختر.
چهار دانش آموز سال چهارم - دو پسر و دو دختر.

توجه داشته باشید که انتخاب عناصر نمونه خاص توسط طرح تحقیق تعیین نمی شود، بلکه با انتخاب مصاحبه کننده که از وی خواسته می شود فقط شرایطی را که سهمیه تعیین شده است رعایت کند: مصاحبه با پنج دانشجوی سال اول، یک دانشجوی سال اول و غیره.

همچنین توجه داشته باشید که این سهمیه به طور دقیق توزیع جنسیتی جمعیت دانش‌آموزی را منعکس می‌کند، اما تا حدودی توزیع دانش‌آموزان را در بین دوره‌ها مخدوش می‌کند. 70 درصد (14 از 20) مصاحبه با پسران است، اما تنها 30 درصد (6 از 20) با دانش آموزان سال اول است، در حالی که 32 درصد از کل دانش آموزان را تشکیل می دهند. سهمیه ای که به هر مصاحبه کننده اختصاص داده می شود، ممکن است منعکس کننده توزیع ویژگی های کنترل در جامعه نباشد، و معمولاً منعکس کننده نیست - فقط نمونه نهایی باید متناسب باشد.

باید به خاطر داشت که نمونه گیری متناسب بیشتر به نگرش ها یا قضاوت های شخصی، ذهنی بستگی دارد تا به روش نمونه گیری عینی. علاوه بر این، بر خلاف نمونه‌گیری عمدی، قضاوت شخصی در اینجا متعلق به توسعه‌دهنده پروژه نیست، بلکه به مصاحبه‌گر تعلق دارد. این سوال مطرح می‌شود که آیا نمونه‌های متناسب را می‌توان نماینده در نظر گرفت، حتی اگر نسبت اجزای ذاتی در جمعیت را که دارای ویژگی‌های کنترلی خاصی هستند، بازتولید کنند. در این زمینه باید سه نکته را بیان کرد.

اولاً، نمونه ممکن است از نظر برخی ویژگی های مهم دیگر به طور قابل توجهی با جامعه متفاوت باشد که می تواند تأثیر جدی بر نتیجه داشته باشد. برای مثال، اگر مطالعه به مشکل تعصب نژادی در میان دانش‌آموزان اختصاص داشته باشد، ممکن است شرایط بی‌تفاوتی نباشد که پاسخ‌دهندگان از کجا آمده‌اند: از شهر یا روستا. از آنجایی که سهمیه مشخصه "از شهر/روستایی" تعیین نشده است، ارائه دقیق این ویژگی بعید می شود. البته، چنین جایگزینی وجود دارد: تعیین سهمیه برای همه ویژگی های بالقوه مهم. با این حال، افزایش تعداد مشخصه های کنترل منجر به پیچیدگی مشخصات می شود. این به نوبه خود انتخاب عناصر نمونه را پیچیده - و حتی گاهی اوقات غیرممکن می کند - و در هر صورت منجر به افزایش قیمت آن می شود. اگر، برای مثال، وابستگی شهری یا روستایی و وضعیت اجتماعی-اقتصادی نیز با مطالعه مرتبط باشد، در این صورت مصاحبه‌کننده ممکن است مجبور باشد به دنبال دانش‌آموز سال اول شهری و طبقه متوسط یا بالا باشد. موافقم که پیدا کردن یک دانشجوی سال اول مرد بسیار ساده تر است.

ثانیاً، اطمینان از اینکه این نمونه واقعا معرف است، بسیار دشوار است. البته، می توانید نمونه را بررسی کنید تا ببینید آیا توزیع ویژگی هایی که در کنترل گنجانده نشده است، توزیع آنها در جامعه است یا خیر. با این حال، چنین آزمایشی تنها می تواند به نتایج منفی منجر شود. می توان فقط واگرایی توزیع ها را آشکار کرد. اگر توزیع‌های نمونه و جامعه برای هر یک از این ویژگی‌ها یکدیگر را تکرار کنند، این احتمال وجود دارد که نمونه در برخی ویژگی‌های دیگر که به صراحت مشخص نشده است، متفاوت باشد.

و در نهایت، سوم. مصاحبه‌کنندگان که به حال خود رها شده‌اند، مستعد اعمال خاصی هستند. آنها اغلب به سؤال از دوستان خود متوسل می شوند. از آنجایی که آنها اغلب شبیه خود مصاحبه کنندگان هستند، خطر خطا وجود دارد. شواهد از انگلستان نشان می دهد که نمونه های سهمیه ای تمایل دارند:

اغراق در نقش در دسترس ترین عناصر؛
کم اهمیت جلوه دادن نقش خانواده های کوچک؛
اغراق در نقش خانواده ها با فرزندان؛
کم اهمیت جلوه دادن نقش کارگران صنعتی؛
کم اهمیت جلوه دادن نقش کسانی که بالاترین و کمترین درآمد را دارند.
کم اهمیت جلوه دادن نقش شهروندان با تحصیلات ضعیف؛
کم اهمیت جلوه دادن نقش افرادی که موقعیت اجتماعی پایینی دارند.

مصاحبه‌کنندگانی که سهمیه‌های از پیش تعیین‌شده را با متوقف کردن رهگذران تصادفی انتخاب می‌کنند، احتمالاً روی مناطقی با تعداد زیادی پاسخ‌دهندگان بالقوه تمرکز می‌کنند، مانند مراکز خرید، ایستگاه راه آهنو فرودگاه ها، ورودی های سوپرمارکت های بزرگ و مانند آن. این عمل منجر به حضور بیش از حد آن دسته از افراد می شود که اغلب از چنین مکان هایی بازدید می کنند. هنگامی که نیاز به بازدید از خانه است، مصاحبه‌کنندگان اغلب بر اساس راحتی انجام می‌شوند.
به عنوان مثال، آنها ممکن است فقط در طول روز نظرسنجی انجام دهند که منجر به دست کم گرفتن نظر کارگران می شود. از جمله اینکه وارد ساختمان های فرسوده نمی شوند و قاعدتا به طبقات بالای ساختمان هایی که آسانسور ندارند بالا نمی روند.

بسته به ویژگی های مسئله مورد مطالعه، این تمایلات می تواند منجر به انواع مختلفی از خطاها شود، در حالی که اصلاح آنها در مرحله تجزیه و تحلیل داده ها بسیار بسیار دشوار به نظر می رسد. از سوی دیگر، با انتخاب عینی عناصر نمونه، محققان ابزارهای خاصی را در اختیار دارند که امکان ساده‌سازی روش ارزیابی نمایندگی یک نمونه معین را فراهم می‌کند. محقق هنگام تجزیه و تحلیل مسئله نمایندگی چنین نمونه هایی، نه به اندازه ترکیب نمونه، بلکه روش انتخاب عناصر آن را در نظر می گیرد.

پنجره تحقیق: عالی! اما چه کسی آن را خواهد خواند؟

هر سال، تبلیغ‌کنندگان میلیون‌ها دلار را صرف تبلیغاتی می‌کنند که در صفحات نشریات بی‌شماری از عصر تبلیغات تا یانکی ظاهر می‌شود. ارزیابی خاصی از متن و تصویر را می توان قبل از انتشار آن، همانطور که می گویند، در خانه، در یک آژانس تبلیغاتی انجام داد. این آگهی واقعاً آزمایش و قضاوت نمی شود تا زمانی که آگهی منتشر شود، که توسط ده ها آگهی به همان اندازه با دقت طراحی شده احاطه شده است که برای جلب توجه خواننده رقابت می کنند.

شرکت Roper Starch در سراسر جهانخوانایی آگهی های درج شده در مجلات و روزنامه های مصرف کننده، تجاری، تجاری و حرفه ای را ارزیابی می کند. نتایج تحقیق به اطلاع تبلیغ کنندگان و آژانس ها می رسد - البته با پرداخت هزینه مناسب. زیرا تبلیغ‌کنندگان هر روز برای رساندن تبلیغات خود به مصرف‌کننده، شرکت، تلاش زیادی می‌کنند نشاستهتصمیم گرفت نمونه ای ایجاد کند که اطلاعات به موقع و دقیق در مورد اثربخشی تبلیغات به مشترکین بدهد. هر سال شرکت نشاستهبا بیش از 50000 نفر مصاحبه کرد، در حالی که حدود 20000 آگهی را در نظر گرفت. سالانه حدود 500 نشریه فردی مورد مطالعه قرار گرفت.

نشاسته از نمونه گیری متناسب با حداقل 100 خواننده از یک جنسیت و 100 خواننده از جنس دیگر استفاده کرد. نشاسته به این نتیجه رسید که با این حجم نمونه، انحرافات اصلی در سطح خوانایی تثبیت شد. با خوانندگان بالای 18 سال به صورت حضوری مصاحبه شد و همه نشریات به جز مواردی که برای جمعیت های خاص در نظر گرفته شده بودند در نظر گرفته شدند (مثلاً با دختران در سن مناسب برای ارزیابی نشریات مجله هفده مصاحبه شد).

هنگام انجام نظرسنجی ها، منطقه توزیع یک نشریه خاص در نظر گرفته شد. فرض کنید مطالعه مجله لس آنجلس به خوانندگانی که در جنوب کالیفرنیا زندگی می کردند نگاه کرد. "زمان" در سراسر کشور مورد مطالعه قرار گرفت. این نظرسنجی به شماره های جداگانه مجله اختصاص داشت و در 20-30 شهر به طور همزمان انجام شد.

به هر مصاحبه کننده سهمیه کوچکی از مصاحبه داده شد که هدف آن به حداقل رساندن واریانس نتایج نظرسنجی بود. پرسشنامه ها بین افراد حرفه ها و سنین مختلف با درآمدهای متفاوت توزیع شد. هر مطالعه ای این امکان را فراهم می کند که مواضع خود را به خوانندگان نسبتاً گسترده ای ارائه دهد. هنگام در نظر گرفتن تعدادی از نشریات حرفه ای، تجاری و صنعتی، ویژگی های اشتراک و توزیع آنها نیز در نظر گرفته شد. فهرست های اشتراک اختصاص داده شده به نشریات با تیراژ نسبتاً محدود، انتخاب پاسخ دهندگان قابل قبول را ممکن می سازد.

در هر نظرسنجی، مصاحبه‌کنندگان از پاسخ‌دهندگان می‌خواستند تا از طریق نشریه مرور کنند و از آنها می‌پرسیدند که آیا متوجه تبلیغاتی شده‌اند یا خیر. اگر پاسخ مثبت بود، مسئول ثبت یک سری سوالات برای ارزیابی میزان پذیرش آگهی مطرح می کرد.

این ارزیابی می تواند سه گونه باشد:

توجه کنید: کسانی که قبلاً به واقعیت ظاهر چنین اطلاعیه ای توجه کرده اند.
آشنا: کسانی که هر قسمتی از آگهی را که مربوط به علامت تجاری یا آگهی‌دهنده آگهی شده است، به خاطر می‌آورند.
بخوانید: افرادی که حداقل نیمی از آگهی را می خوانند.

پس از بررسی همه آگهی‌ها، مصاحبه‌کنندگان اطلاعات طبقه‌بندی کلیدی را ثبت کردند: جنسیت، سن، شغل، وضعیت تأهل، ملیت، درآمد، اندازه خانواده و ترکیب خانواده، که امکان جدول‌بندی متقابل میزان علاقه خواننده را فراهم می‌کرد.

هنگامی که به درستی از داده های شرکت استفاده می شود نشاستهبه تبلیغ‌کنندگان و آژانس‌ها اجازه می‌دهد تا انواع ناموفق و موفق طرح‌های تبلیغاتی را که توجه خواننده را به خود جلب کرده و جلب می‌کنند، شناسایی کنند. اطلاعاتی از این دست برای تبلیغ کنندگانی که در درجه اول به اثربخشی کمپین تبلیغاتی خود علاقه مند هستند، بسیار ارزشمند است.

منبع: Roper Starch Worldwide, Mamaronek, NY 10543.

نمونه های احتمالی

محقق می تواند احتمال گنجاندن هر یک از عناصر جامعه را در نمونه احتمالی تعیین کند، زیرا انتخاب عناصر آن بر اساس فرآیندی عینی انجام می شود و به هوس ها و تمایلات محقق یا کارگر میدانی بستگی ندارد. از آنجایی که روش انتخاب عنصر عینی است، محقق می‌تواند پایایی نتایج به‌دست‌آمده را ارزیابی کند که در مورد نمونه‌های قطعی غیرممکن بود، صرف نظر از اینکه چقدر در انتخاب عناصر دومی دقت شده بود.

نباید تصور کرد که نمونه های احتمالی همیشه بیش از نمونه های قطعی نماینده هستند. در واقع، یک نمونه قطعی نیز ممکن است نماینده تر باشد. مزیت نمونه‌های احتمالی این است که امکان تخمین خطای بالقوه نمونه‌گیری را فراهم می‌کنند. اگر محقق با نمونه قطعی کار کند، روش عینی برای سنجش کفایت آن با اهداف تحقیق ندارد.

نمونه گیری تصادفی ساده

اکثر مردم به روشی یا به روشی دیگر با نمونه های تصادفی ساده مواجه می شوند، یا به عنوان بخشی از یک دوره آمار در موسسه یا با مطالعه نتایج مطالعات مربوطه در روزنامه ها یا مجلات. در یک نمونه تصادفی ساده، هر عنصر موجود در نمونه دارای احتمال یکسانی برای قرار گرفتن در بین عناصر مورد مطالعه است و هر ترکیبی از عناصر در جامعه اصلی به طور بالقوه می تواند به یک نمونه تبدیل شود. به عنوان مثال، اگر بخواهیم یک نمونه تصادفی ساده از همه دانشجویانی که در یک کالج خاص ثبت نام کرده‌اند تهیه کنیم، فقط باید فهرستی از همه دانش‌آموزان تهیه کنیم، به هر نام در آن شماره اختصاص دهیم، و از رایانه برای انتخاب تصادفی یک کالج استفاده کنیم. تعداد عناصر

جمعیت

جمعیت
مجموعه ای از عناصری که شرایط مشخص مشخصی را برآورده می کنند. جمعیت مورد مطالعه (هدف) نیز نامیده می شود.
پارامتر
مشخصه یا شاخص معینی از جمعیت عمومی یا مورد مطالعه.

عمومی، یا مطالعه شده، مجموعهمجموعه ای است که انتخاب از آن انجام می شود. این جمعیت (جمعیت) را می توان با تعدادی پارامتر خاص توصیف کرد که از ویژگی های جمعیت عمومی است، که هر کدام یک شاخص کمی خاص است که یک جمعیت را از جمعیت دیگر متمایز می کند.

تصور کنید که جمعیت مورد مطالعه کل جمعیت بزرگسال سینسیناتی باشد. برای توصیف این جمعیت، می توان از تعدادی پارامتر استفاده کرد: میانگین سن، نسبت جمعیت با آموزش عالی، سطح درآمد و غیره لطفا توجه داشته باشید که همه این شاخص ها دارای یک مقدار ثابت مشخص هستند. البته می توان با سرشماری کامل جمعیت مورد مطالعه آنها را محاسبه کرد. معمولاً ما به صلاحیت تکیه نمی کنیم، بلکه به نمونه ای که انتخاب می کنیم و از مقادیر به دست آمده در هنگام مشاهده انتخابی برای تعیین پارامترهای مورد نظر جامعه استفاده می کنیم.

ما آنچه را که در جدول آورده شده است نشان می دهیم. 15.1 نمونه ای از جمعیت فرضی 20 نفر. کار با یک جمعیت فرضی کوچک مانند این دارای تعدادی مزیت است. اول، حجم نمونه کوچک محاسبه پارامترهای جامعه را که می توان برای توصیف آن استفاده کرد، آسان می کند. ثانیاً، این حجم به شما امکان می دهد بفهمید وقتی یک طرح نمونه برداری خاص اتخاذ می شود چه اتفاقی می افتد. هر دوی این ویژگی ها، مقایسه نتایج نمونه را با "درست" و در این مورد آسان می کند ارزش شناخته شدهمجموعه، که نمی توان در مورد یک موقعیت معمولی که در آن ارزش واقعی مجموعه ناشناخته است، گفت. مقایسه ارزیابی با ارزش "واقعی" در این مورد وضوح خاصی پیدا می کند.

فرض کنید می خواهیم از بین دو آیتم که به طور تصادفی انتخاب شده اند، میانگین درآمد افراد در جمعیت اصلی را تخمین بزنیم. میانگین درآمد پارامتر آن خواهد بود. برای تخمین این مقدار متوسط که به عنوان μ تعیین می کنیم، باید مجموع همه مقادیر را بر تعداد آنها تقسیم کنیم:

میانگین جمعیت μ = مجموع عناصر جمعیت / تعداد عناصر.

در مورد ما، محاسبات نشان می دهد:

جمعیت مشتق شده

جمعیت مشتق شدهشامل تمام نمونه‌های ممکنی است که می‌توان از جمعیت عمومی طبق یک طرح نمونه‌گیری معین (طرح نمونه‌گیری) انتخاب کرد. آماریک مشخصه یا شاخص نمونه است. مقدار آماری نمونه برای تخمین یک پارامتر جامعه خاص استفاده می شود. نمونه های مختلف آمار یا تخمین های متفاوتی را برای پارامتر جمعیت یکسان ارائه می دهند.

جمعیت مشتق شده
مجموعه‌ای از تمام نمونه‌های قابل تشخیص ممکن که می‌توان از جمعیت عمومی طبق یک طرح نمونه‌گیری معین انتخاب کرد. آمار مشخصه یا معیار یک نمونه.

مجموعه مشتق شده از تمام نمونه های ممکن را در نظر بگیرید که می توان از جمعیت فرضی ما 20 نفری با یک طرح نمونه گیری انتخاب کرد که حجم نمونه را فرض می کند. n=2را می توان با انتخاب تصادفی و غیر تکراری به دست آورد.

برای لحظه ای فرض کنید که داده های هر واحد جمعیت - در مورد ما، نام و درآمد یک فرد - روی دایره ها نوشته شده است، پس از آن آنها را در یک کوزه پایین آورده و مخلوط می کنند. محقق یک دایره را از کوزه برمی دارد، اطلاعات را از آن می نویسد و کنار می گذارد. او همین کار را با لیوان دومی که از کوزه برداشته می کند. سپس محقق هر دو لیوان را به کوزه برمی گرداند، محتویات آن را مخلوط می کند و دنباله ای از اقدامات مشابه را تکرار می کند. روی میز. 15.2 نتایج احتمالی رویه نام برده را نشان می دهد. برای 20 دایره، 190 ترکیب این جفت ممکن است.

برای هر ترکیب می توانید میانگین درآمد را محاسبه کنید. برای نمونه گیری بگوییم AB (k= 1)

ک-e میانگین نمونه = مجموع نمونه ها / تعداد نمونه =

روی انجیر 15.4 تخمین میانگین درآمد را برای کل جمعیت و میزان خطای هر برآورد را برای نمونه ها نشان می دهد. k = 25, 62,108,147و 189 .

قبل از بررسی رابطه بین درآمد متوسط نمونه (آمار) و میانگین درآمد جامعه (پارامتری که نیاز به تخمین دارد)، اجازه دهید چند کلمه در مورد جامعه مشتق شده بگوییم. اولاً، در عمل ما مجموعه هایی از این نوع را جمع آوری نمی کنیم. به زمان و تلاش بیش از حد نیاز دارد. پزشک محدود به جمع آوری یک نمونه از اندازه مورد نیاز است. محقق استفاده می کند مفهومجامعه مشتق شده و مفهوم مرتبط توزیع نمونه در هنگام تدوین نتیجه گیری نهایی.

چگونه در زیر نشان داده خواهد شد. ثانیاً، باید به خاطر داشت که یک جامعه مشتق شده به عنوان مجموع همه نمونه‌های مختلف ممکن که می‌توانند از جامعه عمومی بر اساس یک طرح نمونه‌گیری معین انتخاب شوند، تعریف می‌شود. هنگامی که هر بخشی از طرح نمونه‌گیری تغییر می‌کند، جمعیت مشتق‌شده نیز تغییر می‌کند. بنابراین، اگر در هنگام انتخاب دایره ها، محقق اولین دیسک حذف شده را قبل از برداشتن دومی به کوزه برگرداند، مجموعه مشتق شده شامل خواهد شد.

نمونه های AA و BB و ... اگر تعداد نمونه های تکرار نشده به جای 2 عدد 3 عدد باشد نمونه هایی از نوع ABC وجود خواهد داشت و 1140 عدد خواهد بود نه 190 مورد که در مورد قبلی وجود داشت. هنگامی که انتخاب تصادفی ساده به هر روش دیگری برای تعیین عناصر نمونه تغییر می کند، جامعه مشتق شده نیز تغییر می کند.

همچنین باید به خاطر داشت که انتخاب یک نمونه با اندازه معین از جمعیت عمومی معادل انتخاب یک عنصر (1 از 190) از جامعه مشتق شده است. این واقعیت به ما امکان می دهد تا نتایج آماری زیادی را بدست آوریم.

میانگین نمونه و میانگین کلی

آیا می توانیم میانگین نمونه را با میانگین جامعه واقعی برابر کنیم؟ در هر صورت، ما از این واقعیت که آنها به هم مرتبط هستند، اقتباس می کنیم. با این حال، ما همچنین معتقدیم که یک خطا وجود خواهد داشت. به عنوان مثال، می توان فرض کرد که اطلاعات دریافتی از کاربران اینترنت به طور قابل توجهی با نتایج یک نظرسنجی از جمعیت "معمولی" متفاوت است. در موارد دیگر، می‌توانیم تطابق نسبتاً دقیقی را فرض کنیم، در غیر این صورت نمی‌توانیم از مقدار نمونه برای تخمین مقدار کلی استفاده کنیم. اما اشتباهی که در انجام این کار مرتکب می شویم چقدر می تواند بزرگ باشد؟

بیایید تمام میانگین های نمونه موجود در جدول را با هم جمع کنیم. 15.2، و مجموع حاصل را بر تعداد نمونه ها تقسیم کنید، یعنی میانگین ها را میانگین کنیم.
نتیجه زیر را خواهیم گرفت:

منطبق بر میانگین ارزش جمعیت عمومی است. می گویند در این مورد با آن کار داریم آمار بی طرفانه.

یک آمار بدون تعصب نامیده می شود که میانگین آن در تمام نمونه های ممکن برابر با پارامتر جمعیت برآورد شده باشد. توجه داشته باشید که ما در اینجا در مورد یک ارزش خاص صحبت نمی کنیم.تخمین جزئی می تواند بسیار دور از مقدار واقعی باشد - به عنوان مثال، نمونه های AB یا ST را در نظر بگیرید. در برخی موارد، ارزش واقعی جامعه ممکن است هنگام در نظر گرفتن هر نمونه ممکن قابل دستیابی نباشد، حتی اگر آمار بی طرفانه باشد. در مورد ما، این مورد نیست: تعدادی از نمونه های ممکن - به عنوان مثال، AT - یک میانگین نمونه برابر با میانگین جمعیت واقعی می دهد.

منطقی است که توزیع این تخمین های نمونه و به ویژه رابطه بین این پراکندگی برآوردها و تغییر در سطح درآمد در جامعه را در نظر بگیریم. واریانس جمعیت عمومی به عنوان معیار تغییرات استفاده می شود. برای تعیین واریانس جمعیت عمومی، باید انحراف هر مقدار را از میانگین محاسبه کنیم، مجذور همه انحرافات را جمع کنیم و مجموع حاصل را بر تعداد عبارت ها تقسیم کنیم. با a^ واریانس جمعیت عمومی را نشان دهید. سپس:

واریانس جمعیت σ 2 = مجموع مجذور اختلافات هر عنصر
جمعیت و میانگین جمعیت / تعداد عناصر جمعیت =

پراکندگی مقدار میانگینسطح درآمد را می توان به همین ترتیب تعریف کرد. یعنی با تعیین انحراف هر میانگین از میانگین کل آنها، جمع مجذور انحرافات و تقسیم مجموع حاصل بر تعداد عبارت ها می توانیم آن را پیدا کنیم.

همچنین می‌توان با استفاده از واریانس سطح درآمد در جمعیت عمومی، واریانس سطح متوسط درآمد را به روش دیگری تعریف کرد، زیرا بین این دو رابطه مستقیم وجود دارد. به طور دقیق، در مواردی که نمونه تنها بخش کوچکی از جامعه را نشان می دهد، واریانس میانگین نمونه برابر است با واریانس جامعه تقسیم بر حجم نمونه:

که در آن σ x 2 واریانس میانگین مقدار نمونه سطح درآمد است، σ 2 واریانس سطح درآمد در جمعیت عمومی است، n- اندازهی نمونه.

حال بیایید توزیع نتایج را با توزیع یک صفت کمی در جمعیت عمومی مقایسه کنیم. شکل 15.5 نشان می دهد که توزیع صفت جمعیت نشان داده شده در کادر A چند رأس است (هر یک از 20 مقدار فقط یک بار ظاهر می شود) و با میانگین جمعیت واقعی 9400 متقارن است.

توزیع نمونه برداری
توزیع مقادیر یک آمار معین برای تمام نمونه‌های قابل تشخیص ممکن که می‌توانند از جامعه تحت یک طرح نمونه‌گیری معین استخراج شوند، محاسبه می‌شود.

توزیع نمرات نشان داده شده در فیلد B بر اساس داده های جدول است. 15.3 که به نوبه خود با تخصیص مقادیر از جدول کامپایل شده است. 15.2 به یک یا گروه دیگر، بسته به اندازه آنها، با محاسبه بعدی تعداد آنها در گروه. فیلد B یک هیستوگرام سنتی است که در همان ابتدای مطالعه درس آمار در نظر گرفته شده است که نشان دهنده آن است توزیع نمونهآمار. گذراً به موارد زیر اشاره می کنیم: مفهوم توزیع نمونه مهمترین مفهوم آمار است، سنگ بنای ساخت استنباط های آماری است. با توجه به توزیع نمونه شناخته شده آمار مورد مطالعه، می توان در مورد پارامتر متناظر جمعیت عمومی نتیجه گرفت. اگر فقط مشخص شود که تخمین نمونه از نمونه ای به نمونه دیگر تغییر می کند، اما ماهیت این تغییر نامعلوم است، تعیین خطای نمونه گیری مرتبط با این برآورد غیرممکن می شود. از آنجایی که توزیع نمونه‌گیری یک برآورد چگونگی تغییر آن از نمونه‌ای به نمونه دیگر را توصیف می‌کند، مبنایی برای تعیین اعتبار تخمین نمونه فراهم می‌کند. به همین دلیل است که طرح نمونه گیری احتمالی برای استنتاج آماری بسیار مهم است.

با توجه به احتمالات شناخته شده گنجاندن هر یک از اعضای جامعه در نمونه، مصاحبه کنندگان می توانند توزیع نمونه آمارهای مختلف را بیابند. این توزیع‌ها هستند که محققین به هنگام گسترش نتایج یک مشاهده نمونه به جامعه عمومی - اعم از میانگین نمونه، کسر نمونه، واریانس نمونه یا برخی آمارهای دیگر به آن تکیه می‌کنند. همچنین توجه داشته باشید که برای نمونه‌های سایز 2، توزیع میانگین نمونه یک‌وجهی و متقارن با میانگین واقعی است.

پس نشان دادیم که:

میانگین تمام میانگین های نمونه ممکن برابر با میانگین کلی است.
واریانس میانگین نمونه به نوعی با واریانس عمومی مرتبط است.
توزیع میانگین های نمونه یک وجهی است، در حالی که توزیع مقادیر یک ویژگی کمی در جمعیت عمومی چندوجهی است.

تئوری حد مرکزی

قضیه ای که می گوید برای نمونه های تصادفی ساده از اندازه n، از جمعیت عمومی با میانگین کلی μ و واریانس σ 2 جدا شده است nتوزیع میانگین نمونه x با مرکز مساوی μ و واریانس σ2 به نرمال نزدیک می شود. دقت این تقریب با افزایش افزایش می یابد n.

تئوری حد مرکزی. توزیع یک‌وجهی تخمین‌ها را می‌توان به عنوان تجلی قضیه حد مرکزی در نظر گرفت، که بیان می‌کند برای نمونه‌های تصادفی ساده حجم n، از جمعیت عمومی با میانگین واقعی μ و واریانس σ 2 برای بزرگ انتخاب شده است nتوزیع میانگین نمونه با یک مرکز برابر با میانگین واقعی و یک واریانس برابر با نسبت واریانس جامعه به حجم نمونه به نرمال نزدیک می شود، یعنی:

این تقریب دقیق تر و دقیق تر می شود n. این را به یاد داشته باش. صرف نظر از نوع جامعه، توزیع میانگین نمونه برای نمونه هایی با اندازه کافی بزرگ عادی خواهد بود. منظور از حجم به اندازه کافی بزرگ چیست؟ اگر توزیع مقادیر یک ویژگی کمی از جمعیت عمومی نرمال باشد، توزیع میانگین نمونه برای نمونه هایی با حجم n=1. اگر توزیع یک متغیر (ویژگی کمی) در جامعه متقارن باشد اما نرمال نباشد، نمونه هایی با اندازه بسیار کوچک توزیع نرمال میانگین نمونه را به دست می دهند. اگر توزیع یک ویژگی کمی از جمعیت عمومی دارای عدم تقارن بارز باشد، نیاز به نمونه های بزرگتر وجود دارد. و با این حال، توزیع میانگین نمونه تنها در صورتی می‌تواند طبیعی باشد که با نمونه‌ای با اندازه کافی سروکار داشته باشیم.

برای نتیجه گیری با استفاده از یک منحنی نرمال، به هیچ وجه لازم نیست که از شرط نرمال بودن توزیع مقادیر یک ویژگی کمی از جمعیت عمومی استفاده کنیم. در عوض، ما بر قضیه حد مرکزی تکیه می کنیم و بسته به توزیع جامعه، چنین حجم نمونه ای را تعیین می کنیم که به ما امکان می دهد با یک منحنی نرمال کار کنیم. خوشبختانه، توزیع نرمال آمار توسط نمونه هایی با اندازه نسبتا کوچک ارائه شده است - شکل. 15.6 به وضوح این شرایط را نشان می دهد. تخمین فاصله اطمینان آیا موارد فوق می تواند به ما در نتیجه گیری معینی در مورد میانگین کلی کمک کند؟ در واقع، ما در عمل فقط یک نمونه را انتخاب می‌کنیم و نه همه نمونه‌های ممکن را با یک اندازه معین، و بر اساس داده‌های به‌دست‌آمده، نتایج خاصی در مورد گروه هدف می‌گیریم.

چگونه اتفاق می افتد؟ همانطور که می دانید، با توزیع نرمال، درصد معینی از تمام مشاهدات دارای انحراف معیار مشخصی هستند. می گویند 95٪ از مشاهدات در 1.96 ± انحراف استاندارد از میانگین قرار می گیرند. توزیع نرمال میانگین های نمونه، که قضیه حد مرکزی را می توان برای آن اعمال کرد، از این نظر مستثنی نیست. میانگین چنین توزیع نمونه ای برابر با میانگین کلی μ است و انحراف معیار آن را خطای استاندارد میانگین می نامند:

معلوم می شود که:

68.26 درصد از میانگین نمونه از میانگین کلی بیش از ± σ x انحراف ندارد.
95.45 درصد از نمونه به معنای انحراف از میانگین عمومی بیش از ±σ x .
99.73 درصد از نمونه به معنای انحراف از میانگین کلی بیش از ± σ x نیست،

یعنی نسبت معینی از میانگین های نمونه بسته به مقدار انتخاب شده zدر بازه تعیین شده توسط مقدار محصور خواهد شد z. این عبارت را می توان به عنوان یک نابرابری بازنویسی کرد:

میانگین عمومی - z < Среднее по выборке < Генеральное среднее + z(خطای استاندارد میانگین)

بنابراین میانگین نمونه با احتمال معین در بازه‌ای است که مرزهای آن مجموع و اختلاف مقدار میانگین توزیع و تعداد معینی انحراف معیار است. این نابرابری را می توان به شکل زیر تبدیل کرد:

میانگین نمونه - z(خطای استاندارد میانگین)< Генеральное среднее < Среднее по выборке + z(خطای استاندارد میانگین)

اگر نسبت 15.1 مشاهده شود، برای مثال، در 95٪ موارد ( z= 1.96)، سپس در 95٪ موارد نسبت 15.2 نیز مشاهده می شود. در مواردی که نتیجه گیری بر اساس یک میانگین نمونه است، از عبارت 15.2 استفاده می کنیم.

مهم است که عبارت 15.2 را به خاطر بسپارید به این معنا نیست که فاصله مربوط به یک نمونه معین لزوماً شامل میانگین کلی باشد. این فاصله بیشتر به روش انتخاب مربوط می شود.فاصله ایجاد شده حول این میانگین ممکن است شامل میانگین جمعیت واقعی باشد یا نباشد. اطمینان ما به صحت نتیجه گیری های انجام شده بر این واقعیت استوار است که 95٪ از تمام بازه های ساخته شده بر اساس طرح نمونه گیری انتخاب شده حاوی میانگین واقعی است. ما معتقدیم که نمونه ما متعلق به این 95٪ است.

برای نشان دادن این نکته مهم، برای لحظه ای تصور کنید که توزیع نمونه به معنای اندازه نمونه است n= 2 در مثال فرضی ما طبیعی است. جدول 15.4 به صورت گرافیکی نتیجه 10 نمونه اول از 190 نمونه ممکن را که می توانند بر اساس طرح داده شده انتخاب شوند، نشان می دهد. توجه داشته باشید که تنها 7 بازه از 10 بازه شامل میانگین کلی یا واقعی است. اطمینان به صحت نتیجه گیری نه به دلیل ارزیابی خصوصی، بلکه دقیقاً روشبرآوردها این روش به این صورت است که برای 100 نمونه که میانگین نمونه و فاصله اطمینان آنها محاسبه خواهد شد، در 95 مورد این فاصله شامل مقدار کلی واقعی خواهد بود. دقت این نمونه با روشی که نمونه تشکیل شده است مشخص می شود. طرح نمونه گیری نماینده، نماینده بودن همه نمونه ها را تضمین نمی کند. روش‌های استنتاج آماری مبتنی بر بازنمایی طرح نمونه‌گیری است، به همین دلیل است که این روش برای نمونه‌های احتمالی بسیار حیاتی است.

نمونه گیری احتمالی به ما امکان می دهد دقت نتایج را به عنوان نزدیکی تخمین های تولید شده به مقدار واقعی ارزیابی کنیم. هر چه خطای استاندارد آمار بزرگتر باشد، درجه پراکندگی تخمین ها بیشتر و دقت رویه کمتر می شود.

ممکن است برخی از این واقعیت که سطح اطمینان مربوط به روش است و نه به یک مقدار نمونه خاص، سردرگم شوند، اما باید به خاطر داشت که مقدار سطح اطمینان تخمین مقدار کلی توسط محقق قابل تنظیم است. اگر نمی خواهید ریسک کنید و می ترسید که ممکن است با یکی از پنج بازه نمونه انتخاب شده مواجه شوید که میانگین جامعه را در بر نمی گیرد، می توانید یک بازه اطمینان 99٪ را انتخاب کنید که در آن از صد فاصله نمونه فقط یکی از آنها وجود ندارد. میانگین جمعیت را شامل شود. علاوه بر این، اگر بتوانید حجم نمونه را افزایش دهید، درجه اطمینان به نتیجه را افزایش خواهید داد و دقت مورد نظر را برای برآورد ارزش جامعه فراهم می‌کند. در فصل با جزئیات بیشتر در مورد این موضوع صحبت خواهیم کرد. 17.

روشی که ما توضیح می دهیم یک جزء دیگر دارد که می تواند باعث شرمندگی خاصی شود. هنگام تخمین فاصله اطمینان، از سه کمیت استفاده می شود: x , zو σ x . میانگین x از داده های نمونه محاسبه می شود، zبر اساس سطح اطمینان مورد نظر انتخاب می شود. اما در مورد ریشه میانگین مربعات خطای میانگین σ x چطور؟ برابر است با:

و بنابراین، برای تعیین آن، باید انحراف معیار ویژگی کمی جمعیت عمومی را بپرسیم، یعنی 5. در مواردی که انحراف معیار چه باید کرد. سناشناس؟ این مشکل به دو دلیل ایجاد نمی شود. اولاً، برای اکثر ویژگی‌های کمی مورد استفاده در تحقیقات بازاریابی، تغییرات معمولاً بسیار کندتر از سطح اکثر متغیرهای مورد علاقه بازاریاب تغییر می‌کند. بر این اساس، در صورت تکرار مطالعه، می توانیم از مقدار s قبلی که قبلاً به دست آمده بود، در محاسبات استفاده کنیم. دوم، پس از انتخاب نمونه و به دست آمدن داده ها، می توانیم واریانس جامعه را با تعیین واریانس نمونه تخمین بزنیم. واریانس نمونه بی طرفانه به صورت زیر تعریف می شود:

واریانس نمونه ŝ 2 = مجموع مجذور انحرافات از میانگین نمونه / (تعداد اقلام نمونه -1). برای تعیین واریانس نمونه، ابتدا باید میانگین نمونه را پیدا کنیم. سپس تفاوت بین هر یک از مقادیر نمونه و میانگین نمونه پیدا می شود. این تفاوت ها مجذور، جمع و بر عددی برابر با تعداد مشاهدات نمونه منهای یک تقسیم می شوند. واریانس نمونه نه تنها تخمینی از واریانس کل ارائه می دهد، بلکه می تواند برای تخمین خطای استاندارد میانگین نیز استفاده شود. هنگامی که واریانس کلی σ 2 شناخته می شود، ریشه میانگین مربعات خطای σ x نیز شناخته می شود، زیرا:

زمانی که واریانس عمومی ناشناخته باشد، خطای استاندارد میانگین را فقط می توان تخمین زد. این برآورد داده شده است ŝ x، که برابر است با انحراف معیار نمونه تقسیم بر ریشه دوماز حجم نمونه، یعنی . تخمین به همان روشی تعیین می شود که تخمین مقدار واقعی تعیین شد، اما به جای انحراف استاندارد عمومی، انحراف استاندارد نمونه در فرمول محاسبه جایگزین می شود. بنابراین، بیایید برای نمونه AB با میانگین نمونه 5800 بگوییم:

بر این اساس، ŝ = 283، و

و 95٪ فاصله در حال حاضر است

که کمتر از مقدار قبلی است.

روی میز. 15.5 فرمول های محاسبه میانگین ها و پراکندگی های مختلف را که در این فصل مورد بحث قرار گرفت، خلاصه می کند. تشکیل یک نمونه تصادفی ساده در مثال ما، انتخاب عناصر نمونه با استفاده از یک کوزه انجام شد که شامل تمام عناصر جمعیت اصلی بود. این به ما اجازه داد تا مفاهیم جامعه مشتق شده و توزیع نمونه را تجسم کنیم. ما استفاده از چنین روشی را در عمل توصیه نمی کنیم، زیرا این احتمال خطا را افزایش می دهد. لیوان ها می توانند هم از نظر اندازه و هم از نظر بافت متفاوت باشند، که در موارد خاص ممکن است منجر به ترجیح یکی بر دیگری شود. انتخاب شرکت کنندگان در کمپین ویتنامی، که از طریق قرعه کشی انجام می شود، می تواند به عنوان نمونه ای از این نوع اشتباه باشد.

انتخاب با کشیدن دیسک هایی با تاریخ تولد از درام بزرگ انجام شد. تلویزیون این رویه را در سراسر کشور پخش کرد. متأسفانه، دیسک‌ها به روشی سیستماتیک در درام بارگذاری شدند، به طوری که تاریخ ژانویه اول و آخرین تاریخ دسامبر بود. اگرچه طبل در معرض چرخش شدید قرار گرفت، تاریخ های دسامبر بسیار بیشتر از ژانویه سقوط کرد. متعاقباً این رویه به گونه ای بازنگری شد که احتمال چنین خطاهای سیستماتیک به میزان قابل توجهی کاهش یافت. روش ارجح برای تولید یک نمونه تصادفی ساده مبتنی بر استفاده از جدول اعداد تصادفی است.

استفاده از چنین جدولی شامل مراحل زیر است. ابتدا به عناصر جمعیت باید اعداد متوالی از 1 تا اختصاص داده شود ن; در جمعیت فرضی ما به عنصر ولیشماره 1 به عنصر اختصاص داده می شود ب- شماره 2 و غیره. ثانیاً تعداد ارقام جدول اعداد تصادفی باید با رقم یکسان باشد. ن. برای ن= 20 عدد دو رقمی استفاده خواهد شد. برای نبین 100 تا 999 - اعداد سه رقمی و غیره. ثالثاً موقعیت شروع باید به صورت تصادفی تعیین شود. می‌توانیم جدول مربوط به اعداد تصادفی را باز کنیم و همانطور که می‌گویند، چشمانمان را ببندیم، انگشت خود را به آن بزنیم. از آنجایی که اعداد در جدول اعداد تصادفی به ترتیب تصادفی هستند، موقعیت شروع واقعا مهم نیست.

و در نهایت، ما می‌توانیم در هر جهتی که به‌طور دلخواه انتخاب شده حرکت کنیم - بالا، پایین یا در عرض، با انتخاب عناصری که اعداد آنها با اعداد تصادفی از جدول مطابقت دارد. برای تشریح آنچه گفته شد، جدول اختصاری اعداد تصادفی را در نظر بگیرید (جدول 15.6). از آنجا که ن= 20، فقط باید با اعداد دو رقمی کار کنیم. از این نظر، Tab. 15.6 کاملاً برای ما مناسب است. فرض کنید از قبل تصمیم گرفته ایم که ستون را به سمت پایین حرکت کنیم، موقعیت اولیه در محل تلاقی ردیف یازدهم و ستون چهارم است که عدد 77 در آن قرار دارد، این عدد خیلی بزرگ است و بنابراین باید کنار گذاشته شود. دو عدد بعدی نیز نادیده گرفته می شوند، در حالی که از مقدار چهارم 02 استفاده می شود زیرا 2 شماره عنصر است. AT.

پنج عدد بعدی نیز به عنوان خیلی بزرگ کنار گذاشته می شوند، در حالی که عدد 05 عنصر را نشان می دهد E. بنابراین عناصر ATو Eنمونه دو عنصری ما خواهد شد که بر اساس آن سطح درآمد این جمعیت را قضاوت خواهیم کرد. یک استراتژی جایگزین نیز ممکن است، که در آن یک برنامه کامپیوتری که اعداد تصادفی را تولید می کند، به عنوان مبنایی برای انتخاب استفاده می شود. انتشارات اخیر نشان می‌دهد که اعداد تولید شده توسط چنین برنامه‌هایی کاملاً تصادفی نیستند، که می‌توانند در هنگام ساختن مدل‌های پیچیده ریاضی خود را به شیوه‌ای مشخص نشان دهند، اما می‌توان از آنها برای اکثر تحقیقات بازاریابی کاربردی استفاده کرد. مجدداً توجه داشته باشید که یک نمونه تصادفی ساده مستلزم تهیه فهرستی با شماره متوالی از عناصر جامعه عمومی است.

به عبارت دیگر، هر یک از اعضای جمعیت اصلی باید شناسایی شوند. برای برخی از جمعیت ها، انجام این کار دشوار نیست، به عنوان مثال، در مطالعه 500 شرکت بزرگ آمریکایی، که فهرستی از آنها در مجله فورچون آورده شده است. این لیست قبلاً تهیه شده است، بنابراین تشکیل یک نمونه تصادفی ساده در این مورد دشوار نخواهد بود. برای سایر جمعیت های اولیه (مثلاً برای همه خانواده هایی که در یک شهر خاص زندگی می کنند)، تهیه یک فهرست کلی بسیار دشوار است، که محققان را مجبور می کند به سایر طرح های بررسی نمونه متوسل شوند.

خلاصه

هدف یادگیری 1
به وضوح بین مفاهیم سرشماری (صلاحیت) و نمونه گیری تمایز قائل شوید

سرشماری کامل نفوس (جمعیت) نامیده می شود واجد شرایط. نمونهمجموعه ای که از عناصر انتخاب شده تشکیل شده است.

هدف یادگیری 2
ماهیت و توالی شش مرحله اجرا شده توسط محققین برای به دست آوردن جامعه نمونه را بشناسید

فرآیند نمونه گیری به شش مرحله تقسیم می شود:

تخصیص جمعیت؛
تعیین چارچوب نمونه برداری؛
انتخاب روش انتخاب؛
تعیین حجم نمونه؛
انتخاب عناصر نمونه؛
بررسی عناصر انتخاب شده

هدف یادگیری 3
تعریف "قاب نمونه گیری"

چارچوب نمونه‌برداری، فهرست اقلامی است که نمونه از آن‌ها گرفته می‌شود.

هدف آموزشی 4
تفاوت بین نمونه گیری احتمالی و قطعی را توضیح دهید

در یک نمونه احتمالی، هر یک از اعضای جامعه را می توان با تعداد معینی در نظر گرفت غیر صفر داده شده استاحتمال احتمال گنجاندن اعضای خاصی از جامعه در نمونه ممکن است با یکدیگر متفاوت باشد، اما احتمال گنجاندن هر عنصر در آن مشخص است. برای نمونه های قطعی، تخمین احتمال گنجاندن هر عنصر در نمونه غیرممکن می شود. نمایندگی چنین نمونه ای را نمی توان تضمین کرد. همه انتخاب‌های قطعی بر یک موقعیت، قضاوت یا ترجیح شخصی مبتنی است. چنین ترجیحاتی گاهی اوقات می تواند تخمین های خوبی از ویژگی های جامعه ارائه دهد، اما هیچ راهی برای تعیین عینی مناسب بودن نمونه برای کار وجود ندارد.

هدف آموزشی 5
بین نمونه گیری با اندازه ثابت و نمونه گیری چند مرحله ای (متوالی) تمایز قائل شوید

هنگام کار با نمونه های با اندازه ثابت، حجم نمونه قبل از شروع نظرسنجی تعیین می شود و تجزیه و تحلیل نتایج با جمع آوری تمام داده های مورد نیاز انجام می شود. در یک نمونه متوالی، تعداد عناصر انتخاب شده از قبل مشخص نیست، بر اساس یک سری تصمیمات متوالی تعیین می شود.

هدف آموزشی 6
نمونه گیری عمدی چیست و نقاط قوت و ضعف آن را توضیح دهید

آیتم های نمونه گیری عمدی به صورت دستی انتخاب شده و به عنوان مناسب برای اهداف پیمایش به محقق ارائه می شود. فرض بر این است که عناصر انتخاب شده می توانند تصویر کاملی از جامعه مورد مطالعه ارائه دهند. تا زمانی که محقق در مراحل اولیه حل مسئله است، زمانی که چشم اندازها و محدودیت های احتمالی نظرسنجی برنامه ریزی شده مشخص می شود، استفاده از نمونه گیری عمدی می تواند بسیار موثر باشد. اما به هیچ وجه نباید از نقاط ضعف این نوع نمونه غافل شد، زیرا محقق می تواند در مطالعات توصیفی یا علّی نیز از آن استفاده کند که تأثیری بر کیفیت نتایج آنها دیر نخواهد داشت.

هدف یادگیری 7
مفهوم نمونه گیری سهمیه ای را تعریف کنید

نمونه گیری متناسب به گونه ای انتخاب می شود که نسبت عناصر نمونه با ویژگی های معین تقریباً با نسبت همان عناصر در جامعه مورد مطالعه مطابقت داشته باشد. برای انجام این کار، به هر شمارنده سهمیه‌ای اختصاص می‌یابد که ویژگی‌های جمعیتی را که باید با آن تماس بگیرد مشخص می‌کند.

هدف یادگیری 8
توضیح دهید که یک پارامتر در یک روش انتخاب چیست

پارامتر - مشخصه یا شاخص خاصی از جمعیت عمومی یا مورد مطالعه. یک شاخص کمی خاص که یک مجموعه را از مجموعه دیگر متمایز می کند.

هدف یادگیری 9
مجموعه مشتق شده را توضیح دهید

جامعه مشتق‌شده شامل تمام نمونه‌های ممکن است که می‌توان از جامعه عمومی با توجه به یک طرح نمونه‌گیری معین انتخاب کرد.

هدف یادگیری 10
توضیح دهید که چرا مفهوم توزیع نمونه مهمترین مفهوم آمار است.

مفهوم توزیع نمونه سنگ بنای استنتاج آماری است. با توجه به توزیع نمونه شناخته شده آمار مورد مطالعه، می توان در مورد پارامتر متناظر جمعیت عمومی نتیجه گرفت. اگر فقط مشخص شود که تخمین نمونه از نمونه ای به نمونه دیگر تغییر می کند، اما ماهیت این تغییر نامعلوم است، تعیین خطای نمونه گیری مرتبط با این برآورد غیرممکن می شود. از آنجایی که توزیع نمونه‌گیری یک برآورد چگونگی تغییر آن از نمونه‌ای به نمونه دیگر را توصیف می‌کند، مبنایی برای تعیین اعتبار تخمین نمونه فراهم می‌کند.

مطالعات آماری بسیار زمان بر و پرهزینه هستند، بنابراین این ایده مطرح شد که مشاهده مستمر را با مشاهده انتخابی جایگزین کنیم.

هدف اصلی از مشاهده غیرمستمر به دست آوردن ویژگی های جامعه آماری مورد مطالعه برای قسمت مورد بررسی آن است.

مشاهده انتخابی- این یک روش تحقیق آماری است که در آن شاخص های تعمیم جامعه تنها برای یک بخش واحد بر اساس مفاد انتخاب تصادفی ایجاد می شود.

در روش نمونه گیری، تنها بخش معینی از جامعه مورد مطالعه مورد مطالعه قرار می گیرد، در حالی که جامعه آماری مورد مطالعه، جامعه عمومی نامیده می شود.

نمونه یا صرفاً نمونه را می توان بخشی از واحدهای انتخاب شده از جامعه عمومی نامید که مورد تحقیق آماری قرار می گیرد.

ارزش روش نمونه‌گیری: با حداقل تعداد واحدهای مورد مطالعه، تحقیقات آماری در بازه‌های زمانی کوتاه‌تر و با کمترین هزینه بودجه و نیروی کار انجام می‌شود.

در جمعیت عمومی، نسبت واحدهایی که دارای صفت مورد مطالعه هستند، نسبت عمومی نامیده می شود ر)و مقدار متوسط صفت متغیر مورد مطالعه میانگین کلی است (نشان داده شده است ایکس).

در جامعه نمونه، سهم صفت مورد مطالعه را سهم نمونه یا جزء (که با w نشان داده می شود) می گویند، مقدار متوسط در نمونه برابر است. میانگین نمونه

اگر در طول دوره نظرسنجی تمام قوانین سازمان علمی آن رعایت شود، روش نمونه گیری نتایج نسبتاً دقیقی به دست می دهد و بنابراین این روشبه مصلحت است که برای بررسی داده های مشاهده مداوم اعمال شود.

این روش در آمارهای دولتی و غیردستگاهی فراگیر شده است، زیرا هنگام مطالعه حداقل واحدهای مورد مطالعه، امکان مطالعه دقیق و دقیق را فراهم می کند.

جامعه آماری مورد مطالعه شامل واحدهایی با ویژگی های متفاوت است. ترکیب نمونه ممکن است با ترکیب جمعیت عمومی متفاوت باشد، این اختلاف بین ویژگی های نمونه و جمعیت عمومی خطای نمونه گیری را تشکیل می دهد.

خطاهای ذاتی در مشاهده انتخابی، اندازه اختلاف بین داده های مشاهده انتخابی و کل جمعیت را مشخص می کند. خطاهایی که در هنگام نمونه گیری رخ می دهد، خطاهای نمایندگی نامیده می شوند و به تصادفی و سیستماتیک تقسیم می شوند.

اگر جامعه نمونه به دلیل ماهیت غیر مستمر مشاهده، کل جامعه را به طور دقیق بازتولید نکند، به این خطاهای تصادفی گفته می شود و اندازه آنها با دقت کافی بر اساس قانون اعداد بزرگ و نظریه احتمال تعیین می شود.

خطاهای سیستماتیک در نتیجه نقض اصل انتخاب تصادفی واحدهای جمعیت برای مشاهده به وجود می آیند.

2. انواع و طرح های انتخاب

اندازه خطای نمونه گیری و روش های تعیین آن به نوع و طرح انتخاب بستگی دارد.

چهار نوع انتخاب مجموعه ای از واحدهای مشاهده وجود دارد:

1) تصادفی؛

2) مکانیکی؛

3) معمولی؛

4) سریال (تودرتو).

انتخاب تصادفی- متداول ترین روش انتخاب در یک نمونه تصادفی، روش قرعه کشی نیز نامیده می شود که در آن برای هر واحد از جامعه آماری یک بلیت با شماره سریال تهیه می شود.

سپس تعداد واحدهای مورد نیاز جامعه آماری به صورت تصادفی انتخاب می شود. در این شرایط، هر یک از آنها احتمال یکسانی برای ورود به نمونه دارند، به عنوان مثال، قرعه کشی برنده ها، زمانی که بخش خاصی از اعدادی که برنده شده اند به طور تصادفی از تعداد کل بلیط های صادر شده انتخاب می شود. در این حالت، همه اعداد با یک فرصت برابر برای ورود به نمونه ارائه می شوند.

انتخاب مکانیکی- این روشی است که کل جامعه به صورت تصادفی به گروه هایی با اندازه همگن تقسیم می شود، سپس از هر گروه تنها یک واحد گرفته می شود.کلیه واحدهای جامعه آماری مورد مطالعه به ترتیب خاصی از قبل تنظیم شده اند، اما بسته به اندازه نمونه، تعداد واحدهای مورد نیاز به صورت مکانیکی در یک بازه زمانی مشخص انتخاب می شود.

انتخاب معمولی -این روشی است که در آن جامعه آماری مورد مطالعه بر اساس یک ویژگی اساسی و معمولی به گروه‌های کیفی همگن و مشابه تقسیم می‌شود، سپس تعداد معینی از واحدها به‌طور تصادفی از هر یک از این گروه‌ها، متناسب با سهم گروه انتخاب می‌شود. کل جمعیت

انتخاب معمولی نتایج دقیق تری می دهد، زیرا شامل نمایندگان همه گروه های معمولی در نمونه است.

انتخاب سریال (تودرتو).کل گروه ها (سری، لانه)، که به صورت تصادفی یا مکانیکی انتخاب شده اند، در معرض انتخاب هستند. برای هر یک از این گروه ها، سری، مشاهده مداوم انجام می شود و نتایج به کل جمعیت منتقل می شود.

دقت نمونه گیری نیز به طرح انتخاب بستگی دارد. نمونه برداری را می توان بر اساس طرح انتخاب مکرر و غیر تکراری انجام داد.

انتخاب مجددهر واحد یا سری انتخاب شده به کل جمعیت برگردانده می شود و می توان مجددا نمونه برداری کرد.این به اصطلاح طرح توپ برگشتی است.

انتخاب تکراریهر واحد بررسی شده پس گرفته می شود و به جمعیت بازگردانده نمی شود، بنابراین دوباره بررسی نمی شود. این طرح را توپ برگشت ناپذیر می نامند.

انتخاب غیر تکراری نتایج دقیق تری می دهد، زیرا با حجم نمونه یکسان، مشاهده واحدهای بیشتری از جامعه مورد مطالعه را پوشش می دهد.

انتخاب ترکیبیممکن است یک یا چند مرحله را طی کند. نمونه ای تک مرحله ای نامیده می شود که واحدهای جامعه یک بار انتخاب شده مورد مطالعه قرار گیرند.

نمونه ای چند مرحله ای نامیده می شود که انتخاب جامعه از مراحل، مراحل متوالی عبور کند و هر مرحله، مرحله انتخاب واحد گزینش خاص خود را داشته باشد.

نمونه گیری چند مرحله ای - در تمام مراحل نمونه گیری، واحد نمونه گیری یکسان حفظ می شود، اما چندین مرحله، مراحل بررسی نمونه انجام می شود که از نظر گستردگی برنامه نظرسنجی و حجم نمونه با یکدیگر تفاوت دارند.

ویژگی های پارامترهای جمعیت عمومی و نمونه با نمادهای زیر نشان داده می شود:

ن- حجم جمعیت عمومی؛

n- اندازهی نمونه؛

ایکس- میانگین عمومی؛

ایکسمیانگین نمونه است.

آر- سهم عمومی؛

w -سهم نمونه؛

2 - واریانس عمومی (پراکندگی یک ویژگی در جمعیت عمومی).

2 - واریانس نمونه از همان ویژگی;

- انحراف معیار در جمعیت عمومی.

? انحراف معیار در نمونه است.

3. خطاهای نمونه گیری

هر واحد در یک مشاهده نمونه باید فرصتی برابر برای انتخاب شدن با بقیه داشته باشد - این اساس یک نمونه تصادفی است.

نمونه گیری خود تصادفی - این انتخاب واحدها از کل جمعیت عمومی به صورت قرعه کشی یا به روش مشابه دیگری است.

اصل تصادفی بودن این است که گنجاندن یا حذف یک شی از نمونه نمی تواند تحت تأثیر هیچ عامل دیگری غیر از شانس باشد.

اشتراک نمونهنسبت تعداد واحدهای نمونه به تعداد واحدهای جامعه عمومی است:

انتخاب خودتصادفی در شکل خالص خود، انتخاب اولیه در میان سایر انواع انتخاب است؛ این انتخاب شامل اصول اساسی مشاهده آماری انتخابی است و اجرا می کند.

دو نوع اصلی از شاخص‌های تعمیم‌دهنده که در روش نمونه‌گیری استفاده می‌شوند عبارتند از میانگین مقدار یک ویژگی کمی و مقدار نسبی یک ویژگی جایگزین.

سهم نمونه (w) یا ویژگی، با نسبت تعداد واحدهایی که دارای ویژگی مورد مطالعه هستند تعیین می شود. متربه تعداد کل واحدهای نمونه برداری (n):

برای مشخص کردن قابلیت اطمینان شاخص های نمونه، میانگین و خطاهای حاشیه ای نمونه متمایز می شوند.

خطای نمونه گیری که خطای نمایندگی نیز نامیده می شود، تفاوت بین نمونه مربوطه و ویژگی های کلی است:

?x = | x - x |;

?w =|х – p|.

فقط مشاهدات نمونه برداری شده دارای خطای نمونه گیری هستند

میانگین نمونه و نسبت نمونهمتغیرهای تصادفی هستند که می گیرند معانی مختلفبسته به واحدهای جامعه آماری مورد مطالعه که در نمونه قرار گرفتند. بر این اساس، خطاهای نمونه گیری نیز متغیرهای تصادفی هستند و می توانند مقادیر متفاوتی نیز به خود بگیرند. بنابراین، میانگین خطاهای احتمالی تعیین می شود - میانگین خطای نمونه گیری.

میانگین خطای نمونه گیری با حجم نمونه تعیین می شود: هر چه جامعه بزرگتر باشد، همه چیزهای دیگر برابر باشند، میانگین خطای نمونه گیری کوچکتر است. با پوشش یک نظرسنجی نمونه با تعداد فزاینده ای از واحدهای جمعیت عمومی، ما بیشتر و دقیق تر کل جمعیت را مشخص می کنیم.

میانگین خطای نمونه گیری بستگی به درجه تنوع صفت مورد مطالعه دارد، به نوبه خود درجه تنوع با واریانس مشخص می شود؟ 2 یا w(l - w)- برای علامت جایگزین هر چه تنوع و واریانس ویژگی کوچکتر باشد، میانگین خطای نمونه برداری کوچکتر است و بالعکس.

برای نمونه‌گیری مجدد تصادفی، میانگین خطاها از نظر تئوری با استفاده از فرمول‌های زیر محاسبه می‌شوند:

1) برای صفت کمی متوسط:

جایی که؟ 2 - مقدار متوسط پراکندگی یک صفت کمی.

2) برای سهم (علامت جایگزین):

بنابراین واریانس این صفت در جمعیت چگونه است؟ 2 دقیقاً مشخص نیست، در عمل آنها از مقدار واریانس S 2 محاسبه شده برای جامعه نمونه بر اساس قانون اعداد بزرگ استفاده می کنند، که طبق آن جامعه نمونه با حجم نمونه به اندازه کافی بزرگ به طور دقیق ویژگی های جمعیت عمومی.

فرمول میانگین خطای نمونه گیری برای نمونه گیری مجدد تصادفی به شرح زیر است. برای مقدار متوسط یک ویژگی کمی: واریانس عمومی از طریق انتخابی با نسبت زیر بیان می شود:

که در آن S 2 مقدار پراکندگی است.

نمونه برداری مکانیکی- این انتخاب واحدها در یک مجموعه نمونه از کلی است که طبق یک معیار خنثی به گروه های مساوی تقسیم می شود. به گونه ای انجام می شود که از هر گروه در نمونه فقط یک واحد انتخاب می شود.

با انتخاب مکانیکی، واحدهای جامعه آماری مورد مطالعه ابتدا به ترتیب معینی مرتب می شوند و پس از آن تعداد معینی از واحدها به صورت مکانیکی در یک بازه زمانی مشخص انتخاب می شوند. در این حالت، اندازه فاصله در جامعه عمومی برابر است با متقابل سهم نمونه.

با جمعیت به اندازه کافی بزرگ، انتخاب مکانیکی از نظر دقت نتایج نزدیک به تصادفی است، بنابراین برای تعیین میانگین خطای نمونه گیری مکانیکی، از فرمول های نمونه گیری تصادفی غیر تکراری استفاده می شود.

برای انتخاب واحدها از یک جمعیت ناهمگن، از نمونه به اصطلاح معمولی استفاده می شود، زمانی استفاده می شود که تمام واحدهای جمعیت عمومی را بتوان با توجه به ویژگی هایی که شاخص های مورد مطالعه به آن بستگی دارد، به چندین گروه از نظر کیفی همگن و مشابه تقسیم کرد.

سپس، از هر گروه معمولی، یک انتخاب جداگانه از واحدها در نمونه توسط یک نمونه تصادفی یا مکانیکی انجام می شود.

معمولاً در مطالعه جمعیت های آماری پیچیده از نمونه گیری معمولی استفاده می شود.

نمونه گیری معمولی نتایج دقیق تری می دهد. نوع بندی جمعیت عمومی، نمایندگی چنین نمونه ای را تضمین می کند، نمایش هر گروه گونه شناسی در آن، که امکان حذف تأثیر پراکندگی بین گروهی بر میانگین خطای نمونه را فراهم می کند. بنابراین، هنگام تعیین میانگین خطای یک نمونه معمولی، میانگین واریانس های درون گروهی به عنوان شاخص تغییرات عمل می کند.

نمونه‌گیری سریالی شامل انتخاب تصادفی از یک جمعیت عمومی از گروه‌های هم اندازه است تا همه واحدها بدون استثنا در چنین گروه‌هایی مورد مشاهده قرار گیرند.

از آنجایی که تمام واحدها بدون استثنا در گروه ها (سری ها) بررسی می شوند، میانگین خطای نمونه گیری (هنگام انتخاب سری های مساوی) تنها به واریانس بین گروهی (مجموعه های میانی) بستگی دارد.

4. راه های گسترش نتایج نمونه به جامعه

مشخص کردن جمعیت عمومی بر اساس نتایج نمونه، هدف نهایی مشاهده نمونه است.

روش نمونه گیری برای به دست آوردن ویژگی های جامعه عمومی برای شاخص های خاصی از نمونه استفاده می شود. بسته به اهداف مطالعه، این با محاسبه مجدد مستقیم شاخص های نمونه برای جمعیت عمومی یا با روش محاسبه ضرایب تصحیح انجام می شود.

روش محاسبه مجدد مستقیم این است که با آن شاخص های سهم نمونه wیا متوسط ایکسبا در نظر گرفتن خطای نمونه گیری به جمعیت عمومی تعمیم داده می شوند.

روش ضرایب تصحیح زمانی مورد استفاده قرار می گیرد که هدف از روش نمونه گیری، پالایش نتایج حسابداری کامل باشد. از این روش برای اصلاح داده های سرشماری سالانه دام جمعیت استفاده می شود.

نمونه - این هست:

1) مجموع عناصر مورد مطالعه که مستقیماً مورد مطالعه قرار می گیرد.

2) روش ها و روش های انتخاب عناصر موضوع مطالعه.

جمعیت - مجموعه کاملی از اشیاء مرتبط با مشکل مورد مطالعه. در مطالعات جامعه شناختی به عنوان G.S. اغلب، مجموع افراد عمل می کنند - جمعیت (شهرها، کشورها و غیره)، یک گروه اجتماعی (جوانان، بیکاران، تجار و غیره)، مخاطبان رسانه های جمعی (MSK) و غیره. با این حال، در بسیاری از افراد موارد، G.S. ممکن است از عناصر بزرگتر (اشیاء) - خانواده ها (خانوارها)، گروه های دانشگاهی، شرکت ها، جوامع مذهبی، سکونتگاه ها یا ایالت های فردی و غیره تشکیل شود.

جمعیت نمونه - بخشی از اشیاء از جمعیت عمومی برای مطالعه به منظور نتیجه گیری در مورد کل جمعیت انتخاب شده است.

برای اینکه نتیجه به دست آمده از مطالعه نمونه به کل جامعه تعمیم یابد، نمونه باید دارای خاصیت نماینده بودن باشد.

نماینده بودن توانایی نمونه برای نشان دادن جامعه مورد مطالعه است. هر چه ترکیب نمونه با دقت بیشتری جامعه را در موضوعات مورد مطالعه نشان دهد، بازنمایی آن بیشتر است.

مثال: نماینده بودن را می توان با مثال زیر نشان داد. فرض کنید جمعیت همه دانش آموزان مدرسه باشد (600 نفر از 20 کلاس، 30 نفر در هر کلاس). موضوع مطالعه نگرش به سیگار است. نمونه 60 دانش آموز دبیرستانی جامعه بسیار بدتر از نمونه همان 60 نفر است که از هر کلاس 3 دانش آموز را شامل می شود. دلیل اصلی این امر توزیع نابرابر سنی در طبقات است. بنابراین در حالت اول بازنمایی نمونه کم و در حالت دوم بازنمایی زیاد است (ceteris paribus).

انواع نمونه

1. نمونه گیری تصادفی.

1.1 انتخاب تصادفی ساده.

1.2 روش نمونه گیری سیستماتیک (یا مکانیکی).

1.3 نمونه برداری سریالی (تودرتو یا خوشه ای).

1.4 نمونه گیری طبقه ای.

2. نمونه گیری غیرتصادفی (غیر احتمالی).

2.2. انتخاب تصادفی

2.3. نمونه گیری چند مرحله ای و تک مرحله ای.

1. نمونه گیری تصادفی.

یکی از ویژگی‌های نمونه‌گیری تصادفی این است که همه واحدهای جمعیت عمومی احتمال یکسانی برای قرار گرفتن در نمونه را دارند. برای نمونه گیری تصادفی، اصل شانس. اساس نمونه می تواند لیستی از کارمندان شرکت، دایرکتوری های تلفن، لیست های ثبت نام صاحبان خودرو، لیست های رای دهندگان در شعب اخذ رای، کتاب های خانه و همچنین لیست های مختلفی که توسط خود جامعه شناس تنظیم شده است، بسته به اهداف مطالعه باشد. (لیستی از خیابان هایی که سپس انتخاب پاسخ دهندگان در آنها انجام می شود).

نمونه گیری تصادفی معمولاً در نظرسنجی های عمومی قبل از انتخابات، همه پرسی و سایر رویدادهای عمومی استفاده می شود.

به علاوهاین روش رعایت کامل اصل تصادفی بودن و در نتیجه اجتناب از خطاهای سیستماتیک است.

معایب این روش:

– نیاز به فهرستی از عناصر جمعیت.

- مشکل در انجام نظرسنجی.

- حجم نمونه نسبتاً بزرگ

نمونه - مجموعه ای از موارد (موضوعات، اشیاء، رویدادها، نمونه ها)، با استفاده از یک روش خاص، انتخاب شده از جمعیت عمومی برای شرکت در مطالعه.

اندازهی نمونه

حجم نمونه - تعداد موارد موجود در نمونه. به دلایل آماری توصیه می شود که تعداد موارد حداقل 30-35 باشد.

نمونه های وابسته و مستقل

هنگام مقایسه دو (یا بیشتر) نمونه، وابستگی آنها یک پارامتر مهم است. اگر بتوان یک جفت هممورفیک ایجاد کرد (یعنی زمانی که یک مورد از نمونه X مطابق با یک مورد از نمونه Y و بالعکس) برای هر مورد در دو نمونه (و این اساس رابطه برای ویژگی مهم است. بر روی نمونه ها اندازه گیری می شود)، به این نمونه ها وابسته می گویند. نمونه هایی از انتخاب های وابسته:

جفت دوقلو
دو اندازه گیری از هر ویژگی قبل و بعد از قرار گرفتن در معرض تجربی،
زن و شوهر
و غیره.

اگر چنین رابطه ای بین نمونه ها وجود نداشته باشد، این نمونه ها مستقل در نظر گرفته می شوند، به عنوان مثال:

مردان و زنان،
روانشناسان و ریاضیدانان
بر این اساس، نمونه‌های وابسته همیشه اندازه یکسانی دارند، در حالی که اندازه نمونه‌های مستقل ممکن است متفاوت باشد.

نمونه ها با استفاده از معیارهای مختلف آماری مقایسه می شوند:

آزمون تی دانشجویی
تست ویلکاکسون تی
تست U Mann-Whitney
معیار نشانه ها
و غیره.

نماینده بودن

نمونه ممکن است نماینده یا غیرنماینده در نظر گرفته شود.

نمونه ای از نمونه غیر نماینده

در ایالات متحده، یکی از مشهورترین نمونه های تاریخی نمونه گیری غیرنماینده، موردی است که در جریان انتخابات ریاست جمهوری در سال 1936 رخ داد. Litrery Digest که رویدادهای چندین انتخابات قبلی را با موفقیت پیش‌بینی کرده بود، با ارسال ده میلیون برگه رای آزمایشی برای مشترکان خود، افرادی که از دفترچه تلفن در سراسر کشور انتخاب شده بودند، و افرادی از فهرست‌های ثبت نام خودرو، پیش‌بینی‌های خود را اشتباه ارزیابی کرد. در 25 درصد از برگه های برگشتی (نزدیک به 2.5 میلیون) آرا به شرح زیر توزیع شده است:

57 درصد آلف لاندون نامزد جمهوری خواه را ترجیح دادند

40 درصد، فرانکلین روزولت، رئیس جمهور وقت دموکرات را انتخاب کردند

همانطور که مشخص است روزولت با کسب بیش از 60 درصد آرا در انتخابات واقعی پیروز شد. اشتباه The Litreary Digest این بود: می خواستند نماینده نمونه را افزایش دهند - زیرا می دانستند که اکثر مشترکان خود را جمهوری خواه می دانند - نمونه را با افرادی که از دفترچه تلفن و لیست ثبت نام انتخاب شده بودند گسترش دادند. با این حال، آنها واقعیت های زمان خود را در نظر نگرفتند و در واقع جمهوری خواهان بیشتری را به خدمت گرفتند: در دوران رکود بزرگ، این طبقه متوسط و بالا (یعنی اکثریت جمهوری خواهان، نه دموکرات ها) بودند که می توانستند از عهده این کار برآیند. گوشی و ماشین خود

انواع پلان برای گروه های ساختمانی از نمونه ها

چندین نوع اصلی پلان ساختمان گروهی وجود دارد:

مطالعه با گروه های آزمایش و کنترل که در شرایط مختلف قرار می گیرند.
مطالعه با گروه های آزمایش و کنترل با استفاده از راهبرد انتخاب زوجی
مطالعه فقط با استفاده از یک گروه - تجربی.
یک مطالعه با استفاده از یک طرح ترکیبی (فاکتوری) - همه گروه ها در شرایط مختلف قرار می گیرند.

استراتژی های گروه سازی

انتخاب گروه‌ها برای شرکت در یک آزمایش روان‌شناختی با استفاده از راهبردهای مختلفی انجام می‌شود که به منظور اطمینان از بیشترین احترام ممکن برای اعتبار درونی و بیرونی مورد نیاز است.

تصادفی سازی (انتخاب تصادفی)
تعامل با گروه های واقعی

تصادفی سازی

تصادفی سازی، یا انتخاب تصادفی، برای ایجاد نمونه های تصادفی ساده استفاده می شود. استفاده از چنین نمونه ای بر این فرض استوار است که هر یک از اعضای جامعه به یک اندازه در نمونه گنجانده می شوند. به عنوان مثال، برای ایجاد یک نمونه تصادفی از 100 دانشجو، می توانید مقالاتی را با نام همه دانشجویان دانشگاه در یک کلاه قرار دهید و سپس 100 تکه کاغذ از آن خارج کنید - این انتخاب تصادفی خواهد بود (گودوین جی، ص. 147).

انتخاب دوتایی

انتخاب دوتایی- راهبردی برای ساختن گروه‌های نمونه، که در آن گروه‌هایی از آزمودنی‌ها از آزمودنی‌هایی تشکیل می‌شوند که از نظر پارامترهای جانبی که برای آزمایش مهم هستند، معادل هستند. این استراتژی برای آزمایش با استفاده از گروه های آزمایش و کنترل با بهترین گزینه - استخدام موثر است

مطالعه معمولاً با فرضیاتی آغاز می‌شود که باید با واقعیت‌ها بررسی شوند. این فرض - یک فرضیه - در رابطه با ارتباط پدیده ها یا ویژگی ها در مجموعه خاصی از اشیاء فرموله می شود.

برای آزمایش چنین مفروضاتی بر روی واقعیت ها، لازم است ویژگی های مربوط به حامل های آنها اندازه گیری شود. اما اندازه گیری اضطراب در همه زنان و مردان غیرممکن است، همانطور که اندازه گیری پرخاشگری در همه نوجوانان غیرممکن است. بنابراین، هنگام انجام یک مطالعه، آنها فقط به گروه نسبتاً کوچکی از نمایندگان جمعیت مربوطه افراد محدود می شوند.

جمعیت- این کل مجموعه اشیاء است که در رابطه با آنها یک فرضیه تحقیق فرموله می شود.

به عنوان مثال، همه مردان; یا همه زنان؛ یا همه ساکنان یک شهر. جمعیت های عمومی در رابطه با آنها که محقق قرار است بر اساس نتایج مطالعه نتیجه گیری کند ممکن است از نظر تعداد کمتر و معتدل تر باشند، به عنوان مثال، همه دانش آموزان کلاس اولی یک مدرسه معین.

بنابراین، جمعیت عمومی، اگرچه از نظر تعداد نامتناهی نیست، اما، به عنوان یک قاعده، انبوهی از موضوعات بالقوه برای تحقیقات مداوم غیرقابل دسترس است.

نمونه یا جامعه نمونه- این گروهی از اشیاء محدود به تعداد (در روانشناسی - افراد، پاسخ دهندگان) است که به طور خاص از جمعیت عمومی برای مطالعه ویژگی های آن انتخاب شده است. بر این اساس، مطالعه ویژگی های جمعیت عمومی بر روی یک نمونه نامیده می شود تحقیق انتخابی تقریباً تمام مطالعات روان‌شناختی انتخابی هستند و نتیجه‌گیری‌های آن‌ها برای جمعیت‌های عمومی اعمال می‌شود.

بنابراین، پس از تدوین فرضیه و تعیین جمعیت های کلی متناظر، محقق با مشکل سازماندهی نمونه مواجه می شود. نمونه باید به گونه ای باشد که تعمیم نتایج مطالعه نمونه توجیه شود - تعمیم، توزیع آنها به جامعه عمومی. معیارهای اصلی برای اعتبار نتایج تحقیق— اینها نماینده نمونه و اعتبار آماری نتایج (تجربی) است.

نمایندگی نمونه- به عبارت دیگر، بازنمایی آن توانایی نمونه برای بازنمایی کاملاً کامل پدیده های مورد مطالعه - از نقطه نظر تنوع آنها در جمعیت عمومی است.

البته، تنها جمعیت عمومی می توانند تصویر کاملی از پدیده مورد مطالعه، با همه دامنه و تفاوت های ظریف آن ارائه دهند. بنابراین، بازنمایی همیشه به حدی محدود می شود که نمونه محدود باشد. و این معرف بودن نمونه است که ملاک اصلی در تعیین مرزهای تعمیم یافته های پژوهش است. با این وجود، تکنیک هایی وجود دارد که به دست آوردن یک نمونه نماینده کافی برای محقق را ممکن می سازد (این تکنیک ها در دوره "روانشناسی تجربی" مورد مطالعه قرار می گیرند).

اولین و تکنیک اصلی یک انتخاب تصادفی ساده (تصادفی) است. این شامل حصول اطمینان از اینکه هر یک از اعضای جامعه شانس یکسانی برای گنجاندن در نمونه دارند. انتخاب تصادفی امکان ورود به نمونه متنوع ترین نمایندگان جمعیت عمومی را فراهم می کند. در عین حال، اقدامات ویژه ای برای جلوگیری از ظاهر هر گونه نظم در انتخاب انجام می شود. و این به ما امکان می دهد امیدوار باشیم که در نهایت، در نمونه، ویژگی مورد مطالعه، اگر نه در همه، در حداکثر تنوع ممکن نمایش داده شود.

راه دوم برای اطمینان از نمایندگی، انتخاب تصادفی طبقه بندی شده یا انتخاب بر اساس ویژگی های جمعیت عمومی است. این شامل تعیین اولیه آن دسته از کیفیت هایی است که ممکن است بر تغییرپذیری دارایی مورد مطالعه تأثیر بگذارد (این ممکن است جنسیت، سطح درآمد یا تحصیلات و غیره باشد). سپس نسبت درصدی از تعداد گروه‌ها (قشرها) که در این کیفیت‌ها متفاوت هستند در جمعیت عمومی تعیین می‌شود و نسبت درصدی یکسان از گروه‌های متناظر در نمونه ارائه می‌شود. همچنین در هر زیرگروه از نمونه، آزمودنی ها بر اساس اصل انتخاب تصادفی ساده انتخاب می شوند.

روایی آماری،یا اهمیت آماری، نتایج مطالعه با استفاده از روش های استنتاج آماری تعیین می شود.

آیا با نتیجه گیری های مشخص از نتایج مطالعه، در برابر اشتباه در هنگام تصمیم گیری بیمه شده ایم؟ البته که نه. به هر حال، تصمیمات ما بر اساس نتایج مطالعه یک جامعه نمونه و همچنین بر اساس سطح دانش روانشناختی ما است. ما کاملاً از اشتباه مصون نیستیم. در آمار، چنین خطاهایی در صورتی قابل قبول تلقی می شوند که بیش از یک مورد از 1000 رخ ندهند (احتمال خطا α = 0.001 یا مقدار مربوط به احتمال اطمینان نتیجه گیری صحیح p = 0.999). در یک مورد از 100 (احتمال خطا α = 0.01 یا مقدار مربوط به احتمال اطمینان نتیجه گیری صحیح p = 0.99) یا در پنج مورد از 100 (احتمال خطا α = 0.05 یا مقدار مربوط به احتمال اطمینان از خروجی صحیح p=0.95). تصمیم گیری در روانشناسی در دو سطح اخیر مرسوم است.

گاهی اوقات، هنگام صحبت در مورد معنی‌داری آماری، از مفهوم "سطح معنی‌داری" (به عنوان α) استفاده می‌شود. مقادیر عددی p و α تا 1000 یکدیگر را تکمیل می کنند - مجموعه کاملی از رویدادها: یا نتیجه گیری درستی انجام دادیم یا اشتباه کردیم. این سطوح محاسبه نمی شوند، تنظیم شده اند. سطح اهمیت را می توان به عنوان نوعی خط "قرمز" درک کرد که تقاطع آن به ما امکان می دهد از این رویداد به عنوان غیر تصادفی صحبت کنیم. در هر گزارش یا انتشار علمی معتبر، نتیجه‌گیری باید با نشانه‌ای از مقادیر p یا α که در آن نتیجه‌گیری انجام می‌شود، همراه باشد.

روش های استنتاج آماری به تفصیل در درس «آمار ریاضی» مورد بحث قرار گرفته است. در حال حاضر، ما فقط توجه می کنیم که آنها الزامات خاصی را برای تعداد یا اندازهی نمونه.

متأسفانه، هیچ توصیه دقیقی در مورد تعیین اولیه حجم نمونه مورد نیاز وجود ندارد. علاوه بر این، محقق معمولاً پاسخ به سؤال در مورد تعداد لازم و کافی آن را خیلی دیر دریافت می کند - فقط پس از تجزیه و تحلیل داده های نمونه مورد بررسی قبلاً. با این حال، کلی ترین توصیه ها را می توان فرموله کرد:

1. بیشترین حجم نمونه هنگام توسعه یک روش تشخیصی مورد نیاز است - از 200 تا 1000-2500 نفر.

2. در صورت نیاز به مقایسه 2 نمونه، تعداد کل آنها باید حداقل 50 نفر باشد. تعداد نمونه های مقایسه شده باید تقریباً یکسان باشد.

3. اگر رابطه بین هر یک از خواص در حال مطالعه است، حجم نمونه باید حداقل 30-35 نفر باشد.

4. بیشتر تغییرپذیریاز ویژگی مورد مطالعه، حجم نمونه باید بزرگتر باشد. بنابراین، تنوع را می توان با افزایش همگنی نمونه کاهش داد، مثلاً بر حسب جنس، سن و .... البته این امر امکان تعمیم نتیجه را کاهش می دهد.

نمونه های وابسته و مستقلیک موقعیت تحقیق معمولی زمانی است که یک ویژگی مورد علاقه محقق بر روی دو یا چند نمونه به منظور مقایسه بیشتر آنها مطالعه می شود. این نمونه ها بسته به روش سازماندهی آنها ممکن است در نسبت های متفاوتی باشند. نمونه های مستقل با این واقعیت مشخص می شوند که احتمال انتخاب هر موضوعی از یک نمونه به انتخاب هیچ یک از موضوعات نمونه دیگر بستگی ندارد. در برابر، نمونه های وابستهبا این واقعیت مشخص می شود که هر موضوع از یک نمونه با یک معیار خاص با موضوعی از نمونه دیگر مطابقت دارد.

در حالت کلی، نمونه‌های وابسته شامل انتخاب زوجی از افراد در نمونه‌های مقایسه شده و نمونه‌های مستقل - یک انتخاب مستقل از افراد است.

لازم به ذکر است که موارد نمونه های "جزئی وابسته" (یا "تا حدی مستقل") مجاز نیستند: این امر نماینده آنها را به روشی غیرقابل پیش بینی نقض می کند.

در خاتمه، متذکر می شویم که دو پارادایم تحقیق روانشناختی قابل تفکیک است.

باصطلاح R-روش شناسیشامل مطالعه تغییرپذیری یک خاصیت خاص (روانشناختی) تحت تأثیر تأثیر، عامل یا ویژگی دیگر است. نمونه مجموعه ای از موضوعات است.

رویکرد دیگر کیو روش،شامل مطالعه تغییرپذیری موضوع (تک) تحت تأثیر محرک های مختلف (شرایط، موقعیت ها و غیره) است. مطابق با وضعیتی است که نمونه مجموعه ای از محرک ها است.

جامعه عمومی و روش نمونه گیری. مبانی نمونه گیری و تشکیل یک نمونه تصادفی ساده نتایج نمونه ارائه شده است

نمونه مراحل طراحی

انواع طرح های نمونه گیری (نمونه گیری)

انتخاب های قطعی

نمونه های غیر نماینده (راحتی).

انتخاب های عمدی

نمونه های سهمیه ای

پنجره تحقیق: عالی! اما چه کسی آن را خواهد خواند؟

نمونه های احتمالی

نمونه گیری تصادفی ساده

جمعیت

جمعیت مشتق شده

میانگین نمونه و میانگین کلی

تئوری حد مرکزی

خلاصه

هدف یادگیری 1 به وضوح بین مفاهیم سرشماری (صلاحیت) و نمونه گیری تمایز قائل شوید

هدف یادگیری 2 ماهیت و توالی شش مرحله اجرا شده توسط محققین برای به دست آوردن جامعه نمونه را بشناسید

هدف یادگیری 3 تعریف "قاب نمونه گیری"

هدف آموزشی 4 تفاوت بین نمونه گیری احتمالی و قطعی را توضیح دهید

هدف آموزشی 5 بین نمونه گیری با اندازه ثابت و نمونه گیری چند مرحله ای (متوالی) تمایز قائل شوید

هدف آموزشی 6 نمونه گیری عمدی چیست و نقاط قوت و ضعف آن را توضیح دهید

هدف یادگیری 7 مفهوم نمونه گیری سهمیه ای را تعریف کنید

هدف یادگیری 8 توضیح دهید که یک پارامتر در یک روش انتخاب چیست

هدف یادگیری 9 مجموعه مشتق شده را توضیح دهید

هدف یادگیری 10 توضیح دهید که چرا مفهوم توزیع نمونه مهمترین مفهوم آمار است.

انواع نمونه

1. نمونه گیری تصادفی.

اندازهی نمونه

نمونه های وابسته و مستقل

نماینده بودن

نمونه ای از نمونه غیر نماینده

انواع پلان برای گروه های ساختمانی از نمونه ها

استراتژی های گروه سازی

تصادفی سازی

انتخاب دوتایی

هدف یادگیری 1
به وضوح بین مفاهیم سرشماری (صلاحیت) و نمونه گیری تمایز قائل شوید

هدف یادگیری 2
ماهیت و توالی شش مرحله اجرا شده توسط محققین برای به دست آوردن جامعه نمونه را بشناسید

هدف یادگیری 3
تعریف "قاب نمونه گیری"

هدف آموزشی 4
تفاوت بین نمونه گیری احتمالی و قطعی را توضیح دهید

هدف آموزشی 5
بین نمونه گیری با اندازه ثابت و نمونه گیری چند مرحله ای (متوالی) تمایز قائل شوید

هدف آموزشی 6
نمونه گیری عمدی چیست و نقاط قوت و ضعف آن را توضیح دهید

هدف یادگیری 7
مفهوم نمونه گیری سهمیه ای را تعریف کنید

هدف یادگیری 8
توضیح دهید که یک پارامتر در یک روش انتخاب چیست

هدف یادگیری 9
مجموعه مشتق شده را توضیح دهید

هدف یادگیری 10
توضیح دهید که چرا مفهوم توزیع نمونه مهمترین مفهوم آمار است.