Opća populacija i metoda uzorkovanja. Osnove uzorkovanja i formiranje jednostavnog slučajnog uzorka Prikazani su rezultati uzorkovanja

ciljevi učenja

  1. Jasno je razlikovati pojmove popisa (kvalifikacije) i uzorkovanja.
  2. Poznavati bit i slijed šest faza koje provode istraživači kako bi dobili uzorak populacije.
  3. Definirajte pojam "okvir uzorkovanja".
  4. Objasnite razliku između probabilističkog i determinističkog uzorkovanja.
  5. Razlikujte uzorkovanje fiksne veličine i višestupanjsko (uzastopno) uzorkovanje.
  6. Objasnite što je namjerno uzorkovanje i opišite njegove prednosti i slabosti.
  7. Definirajte pojam kvotnog uzorkovanja.
  8. Objasnite što je parametar u selekcijskom postupku.
  9. Objasnite što je to izvedeni skup.
  10. Objasnite zašto je koncept distribucije uzorka najvažniji koncept statistike.

Dakle, istraživač je precizno definirao problem i osigurao odgovarajući dizajn istraživanja i alate za prikupljanje podataka za njegovo rješavanje. Sljedeći korak u procesu istraživanja trebao bi biti odabir onih elemenata koji će se ispitati. Moguće je ispitati svaki element date populacije izradom potpunog popisa te populacije. Potpuni pregled stanovništva naziva se popisom (kvalifikacijom). Postoji još jedna mogućnost. Određeni dio populacije, uzorak elemenata velike skupine, podvrgava se statističkom ispitivanju, a na temelju podataka dobivenih o tom podskupu donose se određeni zaključci za cijelu skupinu. Mogućnost generalizacije rezultata dobivenih iz podataka uzorka na veliku skupinu ovisi o metodi kojom je uzorak uzet. Velik dio ovog poglavlja bit će posvećen tome kako treba sastaviti uzorak i zašto.

Cenzus (kvalifikacija)
Potpuni popis stanovništva (stanovništva).
Uzorak
Zbirka elemenata podskupa veće grupe objekata.

Koncept "populacije" ili "zbirke" može se odnositi ne samo na ljude, već i na tvrtke koje djeluju u proizvodnoj industriji, na trgovce na malo ili na veliko, ili čak na potpuno nežive predmete, kao što su dijelovi koje proizvodi poduzeće; ovaj se koncept definira kao cijeli skup elemenata koji zadovoljavaju određene zadane uvjete. Ovi uvjeti na jedinstven način definiraju kako elemente koji pripadaju ciljnoj skupini tako i elemente koje treba isključiti iz razmatranja.

Studija čiji je cilj utvrditi demografski profil potrošača smrznute pizze trebala bi započeti utvrđivanjem koga treba, a koga ne treba klasificirati kao takve. Spadaju li u ovu kategoriju ljudi koji su barem jednom probali takvu pizzu? Pojedinci koji kupe barem jednu pizzu mjesečno? U tjednu? Pojedinci koji pojedu više od određene minimalne količine pizze u mjesec dana? Istraživač mora biti vrlo precizan u određivanju ciljne skupine. Također se mora voditi računa da se uzorak izvuče iz ciljne populacije, a ne iz „neke” populacije, što je slučaj kada je okvir uzorkovanja neadekvatan ili nepotpun. Potonji je popis elemenata od kojih će se formirati pravi uzorak.

Istraživač može preferirati pristup uzorkovanja nad istraživanjem cijele populacije iz nekoliko razloga. Prvo, potpuno ispitivanje populacije, čak i relativno male veličine, zahtijeva vrlo velike materijalne i vremenske troškove. Često, u trenutku kada se popis završi i podaci obrade, informacije su već zastarjele. U nekim slučajevima kvalifikacija je jednostavno nemoguća. Recimo, istraživači su krenuli u provjeru usklađenosti stvarnog životnog vijeka električnih žarulja sa žarnom niti s izračunatim, za što ih trebaju držati uključenima dok ne pokvare. Ako na ovaj način ispitate cjelokupnu ponudu svjetiljki, dobit ćete pouzdane podatke, ali neće biti ničega za trgovinu.

Naposljetku, na veliko čuđenje početnika, istraživač može radije birati uzorke od popisa, težeći točnosti rezultata. Popisi zahtijevaju veliki broj osoblja, što povećava vjerojatnost grešaka pristranosti (neuzorkovanja). Ta je okolnost jedan od razloga zašto Ured za popis stanovništva SAD-a koristi uzorke anketa za testiranje točnosti različitih vrsta popisa. Dobro ste pročitali: uzorci istraživanja mogu se provesti kako bi se testirala točnost podataka o kvalifikacijama.

Ogledni koraci dizajna

Na sl. Slika 15.1 prikazuje slijed od šest koraka koje istraživač može slijediti prilikom izrade uzorka. Prije svega, potrebno je odrediti ciljnu populaciju ili skup elemenata o kojima istraživač želi nešto saznati.

Na primjer, kada proučavaju dječje preferencije, istraživači moraju odlučiti hoće li se ciljna populacija sastojati samo od djece, samo roditelja ili oboje.

Agregat (populacija)
Skup elemenata koji zadovoljavaju određene zadane uvjete.
Okvir uzorkovanja (osnova)
Popis elemenata od kojih će se vršiti odabir; može se sastojati od teritorijalnih jedinica, organizacija, osoba i drugih elemenata.

Određena tvrtka testirala je svoje električne "utrke" samo na djeci. Djeca su bila potpuno oduševljena. Roditelji su različito reagirali na novost. Mamama se nije svidjela činjenica da vožnja ne uči djecu da budu prijateljski nastrojena prema automobilu, a očevima se nije svidjela činjenica da je proizvod napravljen poput igračke.
Moguća je i obrnuta situacija. Tvrtka je lansirala novi prehrambeni proizvod i pokrenula nacionalnu reklamnu kampanju koja se fokusirala na prerano sazrelo dijete.Firma je testirala učinkovitost reklama samo na majkama koje su bile oduševljene. Djeci je, pak, ovo “ubrzanje”, a s njim i sam reklamirani proizvod, bilo odvratno. Proizvod je završio 1.

Istraživač mora odlučiti tko će se ili od čega sastojati relevantna populacija: pojedinci, obitelji, tvrtke, druge organizacije, transakcije kreditnim karticama itd. Pri donošenju takvih odluka potrebno je odrediti elemente koje treba isključiti iz populacija. Potrebno je napraviti vremensku i geografsku referencu elemenata, što u nekim slučajevima može podlijegati dodatnim uvjetima ili ograničenjima. Primjerice, ako je riječ o pojedincima, željenu populaciju mogu činiti samo osobe starije od 18 godina, ili samo žene, ili samo osobe s najmanje srednjom stručnom spremom.

Zadatak određivanja zemljopisnih granica za ciljanu populaciju u međunarodnim marketinškim istraživanjima može biti poseban problem, jer se time povećava heterogenost promatranog sustava. Na primjer, relativni omjer urbanih i ruralnih područja može značajno varirati od zemlje do zemlje. Teritorijalni aspekt ima ozbiljan utjecaj na sastav stanovništva i unutar iste zemlje. Na primjer, na sjeveru Čilea kompaktno živi pretežno indijansko stanovništvo, dok u južnim dijelovima zemlje žive uglavnom potomci Europljana.

Pokrivenost (incident)
Postotak pripadnika populacije ili skupine koji ispunjavaju uvjete za uključivanje u uzorak.

Općenito govoreći, što je jednostavnije definirana ciljana populacija, to je veći njen obuhvat (incidencija) te lakši i jeftiniji postupak uzorkovanja. Pokrivenost (incident) odgovara udjelu elemenata populacije ili skupine, izraženih u postocima, koji zadovoljavaju uvjete za uključivanje u uzorak. Pokrivenost izravno utječe na vrijeme i materijalne troškove potrebne za provođenje ankete. Ako je pokrivenost velika (tj. većina elementi populacije zadovoljavaju jedan ili više jednostavnih kriterija koji se koriste za identifikaciju potencijalnih ispitanika), vrijeme i materijalni troškovi potrebni za prikupljanje podataka su minimizirani. Nasuprot tome, povećanjem broja kriterija koje potencijalni ispitanici moraju zadovoljiti rastu i materijalni i vremenski troškovi.

Na sl. 15.2 prikazuje udio odraslog stanovništva koje se bavi pojedinim sportovima. Podaci na slici pokazuju da je puno teže i skuplje pregledati osobe koje se bave motociklizmom (samo 3,6% od ukupnog broja odraslih) nego osobe koje redovito rekreativno šetaju (27,4% od ukupnog broja odrasli). Glavno je da istraživač bude precizan u određivanju koje elemente treba uključiti u ispitivanu populaciju, a koje elemente treba iz nje isključiti. Jasno navođenje svrhe studije uvelike olakšava rješavanje ovog problema. Drugi korak u procesu uzorkovanja je određivanje okvira uzorkovanja, koji je, kao što već znate, popis elemenata iz kojih će se uzeti uzorak. Neka ciljana populacija određene studije budu sve obitelji koje žive na području Dallasa. Na prvi pogled, telefonski imenik Dallasa mogao bi biti dobar i lako dostupan okvir za uzorkovanje. Ipak, pomnijim ispitivanjem postaje očito da popis obitelji koji se nalazi u imeniku nije sasvim točan, jer su u njemu izostavljeni brojevi nekih obitelji (naravno, ne uključuje obitelji koje nemaju telefon), dok neke obitelji imaju nekoliko telefonskih brojeva. U imeniku također nisu prisutne osobe koje su nedavno promijenile mjesto stanovanja, a time i broj telefona.

Iskusni istraživači dolaze do zaključka da je točno podudaranje između okvira uzorkovanja i ciljne populacije od interesa vrlo rijetko. Jedan od najkreativnijih koraka u dizajnu uzorkovanja je određivanje odgovarajućeg okvira uzorkovanja u slučajevima kada je teško navesti članove populacije. Ovo može zahtijevati uzorkovanje iz radnih blokova i prefiksa kada se, na primjer, koristi nasumično biranje zbog nedostataka u telefonskim imenicima. Međutim, značajan porast radnih jedinica u posljednjih 10 godina otežao je ovaj zadatak. Slične situacije mogu nastati i tijekom selektivnog promatranja teritorijalnih zona ili organizacija s naknadnim poduzorkovanjem, kada su, recimo, pojedinci ciljna populacija, ali ne postoji njihov točan ažuran popis.

Izvor: na temelju podataka sadržanih u SSI- LITE TM: L ow Incidencija T ciljano S ampling" (Fairfield, Conn.: Survey Sampling, Inc., 1994.).

Treći korak u postupku uzorkovanja usko je povezan s određivanjem okvira uzorkovanja. Izbor metode ili postupka uzorkovanja uvelike ovisi o okviru uzorkovanja koji je prihvatio istraživač. Različite vrste uzoraka zahtijevaju različite vrste okvira za uzorkovanje. Ovo i sljedeće poglavlje dat će pregled glavnih tipova uzoraka koji se koriste u marketinškom istraživanju. Pri njihovom opisivanju trebala bi postati očita veza između okvira uzorkovanja i načina njegovog formiranja.

Četvrti korak u postupku uzorkovanja je određivanje veličine uzorka. O ovom problemu raspravlja se u pogl. 17. U petoj fazi, istraživač treba zapravo odabrati elemente koji će biti podvrgnuti istraživanju. Metoda koja se za to koristi određena je odabranom vrstom uzorka; kada govorimo o metodama uzorkovanja, govorit ćemo i o izboru njegovih elemenata. I konačno, istraživač treba stvarno ispitati identificirane ispitanike. U ovoj fazi postoji velika vjerojatnost počinjenja niza pogrešaka.
Ovi problemi i neke metode za njihovo rješavanje razmatraju se u Pogl. 18.

Vrste planova uzorkovanja (uzorkovanje)

Sve metode uzorkovanja mogu se podijeliti u dvije kategorije: promatranje vjerojatnosnih uzoraka i promatranje determinističkih uzoraka. U probabilistički uzorak, svaki član populacije može biti uključen s određenom određenom vjerojatnošću različitom od nule. Vjerojatnost uključivanja pojedinih članova populacije u uzorak može biti različita, ali je vjerojatnost uključivanja svakog elementa u uzorak poznata. Ta se vjerojatnost utvrđuje posebnim mehaničkim postupkom koji se koristi za odabir članova uzorka.

Za determinističke uzorke, procjena vjerojatnosti uključivanja bilo kojeg elementa u uzorak postaje nemoguća. Ne može se jamčiti reprezentativnost takvog uzorka. Na primjer, Allstate Corporation razvio sustav za obradu podataka o zahtjevima za naknada osiguranja 14 milijuna kućanstava (njihovih klijenata). Tvrtka planira upotrijebiti te podatke kako bi odredila obrasce potražnje za svojim uslugama, kao što je vjerojatnost da će kućanstvo koje posjeduje Mercedes Benz također posjedovati kuću za odmor (za što će biti potrebno osiguranje). Iako je baza podataka vrlo velika, tvrtka nema sredstva za procjenu vjerojatnosti da će bilo koji klijent podnijeti zahtjev. Tvrtka stoga ne može biti sigurna da su podaci o kupcima koji čine zahtjev reprezentativni za sve klijente tvrtke; a u još manjoj mjeri – u odnosu na potencijalne kupce.

Svi deterministički uzorci temelje se na osobnom stavu, prosudbi ili preferencijama istraživača, a ne na mehaničkom postupku odabira članova uzorka. Takve preferencije ponekad mogu dati dobre ocjene karakteristika populacije, međutim, ne postoji način da se objektivno utvrdi usklađenost uzorka sa zadatkom. Procjena točnosti rezultata uzorka može se napraviti samo ako su poznate vjerojatnosti odabira pojedinih elemenata. Iz tog razloga, rad s vjerojatnosnim uzorkovanjem općenito se smatra boljom metodom za procjenu veličine pogreške uzorkovanja. Uzorci se također mogu podijeliti na uzorke fiksne veličine i sekvencijalne uzorke. U slučaju rada s uzorcima fiksne veličine, veličina uzorka se utvrđuje prije početka istraživanja, a analizi rezultata prethodi prikupljanje svih potrebnih podataka. Uglavnom će nas zanimati uzorci fiksne veličine, jer se ova vrsta obično koristi u marketinškim istraživanjima.

Vjerojatnost uzorkovanja
Uzorak u koji se svaki element populacije može uključiti s nekom poznatom vjerojatnošću različitom od nule.
Determinističko uzorkovanje
Uzorkovanje na temelju nekih posebnih preferencija ili prosudbi koje određuju odabir određenih elemenata; u isto vrijeme postaje nemoguće procijeniti vjerojatnost uključivanja proizvoljnog elementa populacije u uzorak.

Međutim, ne treba zaboraviti da postoje i sekvencijalni uzorci koji se mogu koristiti sa svakim od osnovnih dizajna uzorkovanja o kojima se raspravlja u nastavku.

U sekvencijalnom uzorku broj odabranih elemenata nije unaprijed poznat, on se utvrđuje na temelju niza sekvencijalnih odluka. Ako istraživanje malog uzorka ne dovede do pouzdanog rezultata, proširuje se raspon elemenata koji se ispituju. Ako rezultat nakon toga ostane neuvjerljiv, veličina uzorka se ponovno povećava. U svakoj fazi donosi se odluka hoće li se dobiveni rezultat smatrati dovoljno uvjerljivim ili će se nastaviti s prikupljanjem podataka. Rad sa sekvencijalnim uzorkovanjem omogućuje procjenu trenda (trenda promjene) podataka tijekom njihovog prikupljanja, čime se smanjuju troškovi povezani s dodatnim promatranjima u slučajevima kada njihova svrsishodnost izostane.

I probabilistički i deterministički planovi uzorkovanja mogu se podijeliti u nekoliko vrsta. Na primjer, deterministički uzorci mogu biti nereprezentativni (prikladni), namjerni ili kvotni; probabilistički uzorci podijeljeni su na jednostavne slučajne, stratificirane ili grupne (klastere), a oni se pak mogu podijeliti na podvrste. Na sl. Slika 15.3 prikazuje vrste uzoraka o kojima će biti riječi u ovom i sljedećem poglavlju.

Fiksni uzorak (Fiksni uzorak)
Uzorak čija je veličina unaprijed određena; tražene informacije određuju odabrani elementi.
Sekvencijalno uzorkovanje
Uzorak formiran na temelju niza uzastopnih odluka. Ako, nakon razmatranja malog uzorka, rezultat nije uvjerljiv, razmatra se veći uzorak; ako ovaj korak ne dovede do rezultata, veličina uzorka se ponovno povećava, itd. Dakle, u svakoj fazi se donosi odluka o tome može li se dobiveni rezultat smatrati dovoljno uvjerljivim.

Treba imati na umu da se osnovne vrste uzoraka mogu kombinirati u složenije planove uzorkovanja. Ako naučite njihove osnovne početne tipove, lakše ćete se snalaziti u složenijim kombinacijama.

Deterministički odabiri

Kao što je već spomenuto, pri odabiru elemenata determinističkog uzorka odlučujuću ulogu imaju privatne procjene ili odluke. Ponekad te procjene dolaze od istraživača, dok se u drugim slučajevima odabir elemenata populacije daje osoblju na terenu. Budući da se elementi ne biraju mehanički, postaje nemoguće odrediti vjerojatnost uključivanja proizvoljnog elementa u uzorak i, sukladno tome, pogrešku uzorkovanja. Nepoznavanje pogreške uzrokovane odabranim postupkom uzorkovanja sprječava istraživače u procjeni točnosti svojih procjena.

Nereprezentativni (praktični) uzorci

Nereprezentativni (praktični) uzorci ponekad se naziva slučajnim, budući da se izbor elemenata uzorka provodi na "slučajan" način - odabiru se oni elementi koji su ili se čine najdostupniji tijekom razdoblja odabira.

Naše svakidašnjica prepuna primjera takvih odabira. Razgovaramo s prijateljima i na temelju njihovih reakcija i stavova donosimo zaključke o političkim sklonostima koje vladaju u društvu; lokalna radio postaja potiče ljude da izraze svoje mišljenje o nekom kontroverznom pitanju, njihovo se mišljenje tumači kao prevladavajuće; pozivamo na suradnju volontere i rad s onima koji volontiraju da nam pomognu. Problem s praktičnim uzorcima je očit - ne možemo biti sigurni da uzorci ove vrste zapravo predstavljaju ciljnu populaciju. To mišljenje naših prijatelja ispravno odražava politički pogledi prevladavaju u društvu, još možemo sumnjati, ali često želimo vjerovati da su veći uzorci, na sličan način odabrani, reprezentativni. Pokažimo na primjeru pogrešnost takve pretpostavke.
Prije nekoliko godina jedna od lokalnih televizija u gradu u kojem živi autor ove knjige provodila je svakodnevno istraživanje javnog mnijenja o temama od interesa za lokalnu zajednicu. Ankete pod nazivom "Puls Madison" provedene su na sljedeći način. Svake večeri u vijestima u šest sati postaja je postavljala gledateljima pitanje vezano za određenu kontroverznu temu, na koje je bilo potrebno dati pozitivan ili negativan odgovor.

U slučaju pozitivnog odgovora bilo je potrebno nazvati jedan, u slučaju negativnog odgovora - na drugi telefonski broj. Broj glasova "za" i "protiv" prebrojavan je automatski. Vijesti u deset sati objavile su rezultate telefonske ankete. Svake večeri između 500 i 1000 ljudi zvalo je studio kako bi izrazili svoj stav o ovom ili onom pitanju; televizijski komentator protumačio je rezultate ankete kao prevladavajuće mišljenje u društvu.

Nereprezentativni (prigodni) uzorak
Ponekad se naziva slučajnim, jer se izbor elemenata uzorka provodi na "slučajan" način - odabiru se oni elementi koji su ili se čine najdostupniji tijekom razdoblja odabira.

U jednoj od šestosatnih epizoda gledateljima je postavljeno sljedeće pitanje: "Ne mislite li da bi se dob za konzumaciju alkohola u Madisonu trebala spustiti na 18 godina?" Postojeća pravna kvalifikacija odgovarala je 21 godini. Publika je na ovo pitanje reagirala iznimno aktivno - u studio se te večeri javilo gotovo 4000 ljudi, od kojih je 78 posto bilo za snižavanje dobne granice. Čini se jasnim da bi uzorak od 4 000 "trebao biti reprezentativan" za zajednicu od 180 000. Ništa slično. Kao što možda pretpostavljate, određene dobne skupine bile su više zainteresirane za poznati ishod od drugih. Stoga nije bilo iznenađujuće da se u raspravi o ovom pitanju nekoliko tjedana kasnije pokazalo da su studenti tijekom vremena predviđenog za anketu djelovali složno. Redom su zvali televiziju, svaki po nekoliko puta. Stoga niti veličina uzorka niti postotak zagovornika liberalizacije prava nisu bili ništa iznenađujući. Uzorak nije bio reprezentativan.

Jednostavno povećanje veličine uzorka ne čini ga reprezentativnim. Reprezentativnost uzorka nije osigurana veličinom, već pravilnim postupkom odabira elemenata. Kada su sudionici ankete odabrani dobrovoljno ili su stavke uzorka odabrane na temelju njihove dostupnosti, plan uzorkovanja ne jamči reprezentativnost uzorka. Empirijski dokazi sugeriraju da su uzorci odabrani radi praktičnosti rijetko reprezentativni (bez obzira na njihovu veličinu). Telefonske ankete, koje uzimaju u obzir 800-900 glasova, najčešći su oblik velikih, ali nereprezentativnih uzoraka.

Namjerno uzorkovanje
Determinističko (ciljano) uzorkovanje, čiji se elementi biraju ručno; odabiru se oni elementi koji, po mišljenju istraživača, zadovoljavaju ciljeve istraživanja.
Namjerno uzorkovanje, ovisno o sposobnosti istraživača da postavi početni skup ispitanika sa željenim karakteristikama; tada se ti ispitanici koriste kao informatori koji određuju daljnji odabir pojedinaca.

Nažalost, mnogi se s povjerenjem odnose prema rezultatima takvih anketa. Jedan od najkarakterističnijih primjera korištenja nereprezentativnih uzoraka u međunarodnim marketinškim istraživanjima je istraživanje pojedinih zemalja na uzorku stranaca koji žive u ovaj trenutak na području zemlje koja je pokrenula istraživanje (primjerice, Skandinavci koji žive u SAD-u). Iako takvi uzorci mogu baciti malo svjetla na određene aspekte populacije koja se razmatra, mora se zapamtiti da ti pojedinci obično predstavljaju "amerikaniziranu" elitu, čija veza s vlastitom zemljom može biti prilično proizvoljna. Korištenje nereprezentativnih uzoraka ne preporučuje se za deskriptivna ili kauzalna istraživanja. Oni su dopušteni samo u istraživačkim istraživanjima koja imaju za cilj testiranje određenih ideja ili ideja, ali iu tom slučaju poželjno je koristiti namjerne uzorke.

Namjerne selekcije

Namjerni uzorci ponekad se nazivaju nefokusiran; njihovi elementi, koji po mišljenju istraživača zadovoljavaju ciljeve istraživanja, biraju se ručno. Procter & Gamble koristio je ovu metodu pri prikazivanju oglasa osobama u dobi od 13 do 17 godina koje žive u blizini njezinog sjedišta u Cincinnatiju. Podjela poduzeća prehrambeni proizvodi i beverages angažirali su ovu skupinu tinejdžera da djeluju kao neka vrsta uzorka potrošača. Radeći 10 sati tjedno u zamjenu za 1000 dolara i odlazak na koncert, gledali su televizijske reklame, posjećivali supermarkete s menadžerima tvrtke kako bi pogledali izloške proizvoda, testirali nove proizvode i raspravljali o kupovnom ponašanju. Odabirom predstavnika za uzorak kroz proces "zapošljavanja", a ne nasumično, tvrtka bi se mogla usredotočiti na osobine koje smatra korisnima, kao što je sposobnost tinejdžera da se jasno izrazi, uz rizik da njihovi stavovi možda ne budu reprezentativni za njihovu dob skupina.

Kao što je već spomenuto, značajka razlikovanja namjernog uzorkovanja je usmjereni odabir njegovih elemenata. U nekim slučajevima uzorci se biraju ne zato što su reprezentativni, već zato što istraživačima mogu pružiti informacije koje ih zanimaju. Kada se sud rukovodi iskazom vještaka, on u određenom smislu pribjegava namjernom odabiru. Slična pozicija može prevladati u razvoju istraživački projekti. Tijekom inicijalnog proučavanja pitanja, istraživača prvenstveno zanima određivanje izgleda za istraživanje, što određuje izbor elemenata uzorka.

Uzimanje uzoraka grudve snijega je vrsta namjernog uzorkovanja koja se koristi kada se radi o određenim vrstama populacija. Ovaj uzorak ovisi o sposobnosti istraživača da odredi početni skup ispitanika sa željenim karakteristikama. Ti se ispitanici zatim koriste kao informatori za daljnji odabir pojedinaca.

Zamislite, na primjer, da tvrtka želi procijeniti potrebu za proizvodom koji bi omogućio gluhim osobama da komuniciraju telefonom. Istraživači mogu početi razvijati ovaj problem identificiranjem ključnih osoba u zajednici gluhih; potonji bi mogao imenovati ostale članove grupe koji bi pristali sudjelovati u istraživanju. Ovom taktikom uzorak raste poput grudve snijega.

Dok je istraživač u početnim fazama rješavanja problema, kada se utvrđuju izgledi i moguća ograničenja planiranog istraživanja, korištenje namjernog uzorkovanja može biti vrlo učinkovito. Ali ni u kojem slučaju ne smijemo zaboraviti slabostima uzoraka ove vrste, budući da ga također istraživač može koristiti u deskriptivnim ili kauzalnim studijama, što neće kasno utjecati na kvalitetu njihovih rezultata. Klasičan primjer ove zaboravnosti je indeks potrošačkih cijena ("CPI"). Kao što Südman ističe ( Sudman): “CPI je određen samo za 56 gradova i metropolitanskih područja, na čiji odabir također utječe politički faktor. Zapravo, ti gradovi mogu predstavljati samo sebe, dok se indeks zove indeks potrošačkih cijena za građane koji primaju sat plaće *, I zaposlenici i čini se većini ljudi kao indeks koji odražava razinu cijena u bilo kojem području Sjedinjenih Država. Izbor maloprodajnih mjesta također se vrši nenasumično, uslijed čega procjena moguće pogreške uzorkovanja postaje nemoguća» (kurziv naš) 2 .

* Odnosno radnici. - Bilješka. po.

Kvotni uzorci

Treći tip determinističkog uzorkovanja − kvotni uzorci; njegova poznata reprezentativnost postiže se uključivanjem u njega istog udjela elemenata koji imaju određena obilježja kao u anketiranoj populaciji (vidi "Prozor istraživanja 15.1"). Kao primjer, razmislite o pokušaju stvaranja reprezentativnog uzorka studenata koji žive u kampusu. Ukoliko u određenom uzorku od 500 pojedinaca nema niti jednog apsolventa, imat ćemo pravo sumnjati u njegovu reprezentativnost i valjanost primjene rezultata dobivenih na ovom uzorku na ispitivanu populaciju. Radeći s proporcionalnim uzorkom, istraživač može osigurati da udio dodiplomaca u uzorku odgovara njihovom udjelu u ukupnom broju studenata.

Pretpostavimo da istraživač provodi selektivno istraživanje studenata sveučilišta, dok ga zanima činjenica da uzorak odražava ne samo njihovu pripadnost jednom ili drugom spolu, već i njihovu distribuciju po kolegijima. Neka ukupan broj studenata bude 10.000: 3.200 brucoša, 2.600 studenata druge godine, 2.200 studenata treće godine i 2.000 studenata četvrte godine; od toga 7000 dječaka i 3000 djevojčica. Za uzorak od 1000 ljudi, planom proporcionalnog uzorkovanja potrebno je 320 brucoša, 260 studenata druge godine, 220 studenata treće godine i 200 maturanata, 700 mladića i 300 djevojaka. Istraživač može provesti ovaj plan dajući svakom anketaru određenu kvotu, koja će odrediti koje studente treba kontaktirati.

Kvotno uzorkovanje Deterministički uzorak odabran na način da udio elemenata uzorka s određenim karakteristikama približno odgovara udjelu istih elemenata u populaciji koja se proučava; svakom terenskom radniku dodijeljena je kvota koja određuje karakteristike populacije s kojom mora kontaktirati.

Ispitivač koji treba provesti 20 intervjua može dobiti upute da pita:

            • šest učenika prve godine – pet dječaka i jedna djevojčica;
            • šest učenika druge godine - četiri dječaka i dvije djevojčice;
            • četiri učenika treće godine – tri dječaka i jedna djevojčica;
            • četiri učenika četvrte godine – dva mladića i dvije djevojke.

Napominjemo da izbor pojedinih elemenata uzorka nije određen planom istraživanja, već izborom anketara, koji je dužan pridržavati se samo uvjeta koji su postavljeni kvotom: anketirati pet brucoša, jednog brucoša i sl.

Imajte na umu također da ova kvota točno odražava rodnu distribuciju studentske populacije, ali donekle iskrivljuje distribuciju studenata po kolegijima; 70% (14 od 20) intervjua je s dječacima, ali samo 30% (6 od 20) sa studentima prve godine, dok oni čine 32% od ukupnog broja studenata. Kvota dodijeljena svakom pojedinom anketaru ne mora, i obično ne odražava, distribuciju kontrolnih karakteristika u populaciji - samo konačni uzorak treba biti proporcionalan.

Treba imati na umu da proporcionalno uzorkovanje više ovisi o osobnim, subjektivnim stavovima ili prosudbama nego o objektivnom postupku uzorkovanja. Štoviše, za razliku od namjernog uzorkovanja, ovdje osobna prosudba ne pripada nositelju projekta, već anketaru. Postavlja se pitanje mogu li se proporcionalni uzorci smatrati reprezentativnima, čak i ako reproduciraju omjer komponenti svojstvenih populaciji koje imaju određene kontrolne karakteristike. S tim u vezi potrebno je dati tri napomene.

Prvo, uzorak se može izrazito razlikovati od populacije u nekim drugim važnim karakteristikama, što može imati ozbiljan utjecaj na rezultat. Na primjer, ako je istraživanje posvećeno problemu rasnih predrasuda koje postoje u studentskoj sredini, neravnodušna okolnost može se pokazati odakle su ispitanici došli: iz grada ili iz ladanje. Budući da kvota za karakteristiku "iz grada/sela" nije određena, točan prikaz ove karakteristike postaje malo vjerojatan. Naravno, postoji i takva alternativa: definirati kvote za sve potencijalno značajne karakteristike. Međutim, povećanje broja kontrolnih karakteristika dovodi do komplikacije specifikacije. To pak komplicira - a ponekad čak i onemogućuje - izbor elemenata uzorka i, u svakom slučaju, dovodi do njegovog poskupljenja. Ako su, na primjer, urbana ili ruralna pripadnost i socioekonomski status također relevantni za studiju, tada će anketar možda morati tražiti studenta prve godine koji je urban i iz više ili srednje klase. Slažem se da je puno lakše pronaći samo muškog brucoša.

Drugo, vrlo je teško uvjeriti se da je ovaj uzorak stvarno reprezentativan. Naravno, na uzorku možete provjeriti je li distribucija obilježja koja nisu uključena u kontrolu njihova distribucija u populaciji. Međutim, takav test može dovesti samo do negativnih zaključaka. Moguće je otkriti samo divergenciju distribucija. Ako se distribucije uzorka i populacije za svaku od ovih karakteristika međusobno ponavljaju, postoji mogućnost da se uzorak razlikuje od populacije po nekoj drugoj, a ne eksplicitno navedenoj osobini.

I na kraju, treće. Anketari su, prepušteni sami sebi, skloni određenim radnjama. Oni prečesto pribjegavaju ispitivanju svojih prijatelja. Budući da često ispadnu poput samih anketara, postoji opasnost od pogreške. Dokazi iz Engleske sugeriraju da uzorci kvote imaju tendenciju:

  1. preuveličavanje uloge najpristupačnijih elemenata;
  2. umanjivanje uloge malih obitelji;
  3. preuveličavanje uloge obitelji s djecom;
  4. umanjivanje uloge industrijskih radnika;
  5. umanjivanje uloge onih s najvećim i najnižim primanjima;
  6. umanjivanje uloge slabo obrazovanih građana;
  7. umanjivanje uloge osoba koje zauzimaju niski društveni položaj.
Anketari koji biraju unaprijed određene kvote zaustavljanjem slučajnih prolaznika vjerojatno će se usredotočiti na područja s velikim brojem potencijalnih ispitanika, kao što su trgovački centri, željezničke stanice i zračne luke, ulazi u velike supermarkete i slično. Ovakva praksa dovodi do prevelike zastupljenosti onih skupina ljudi koji najčešće posjećuju takva mjesta. Kada su potrebni kućni posjeti, anketari se često rukovode praktičnošću.
Na primjer, mogu provoditi ankete samo tijekom dana, što dovodi do podcjenjivanja mišljenja radnika. Između ostalog, ne ulaze u trošne zgrade i u pravilu se ne penju na gornje katove zgrada koje nemaju dizala.

Ovisno o specifičnostima problema koji se proučava, te tendencije mogu dovesti do raznih vrsta pogrešaka, ali čini se da je njihovo ispravljanje u fazi analize podataka vrlo, vrlo teško. S druge strane, objektivnim odabirom elemenata uzorka, istraživačima su na raspolaganju određeni alati koji omogućuju pojednostavljenje postupka ocjene reprezentativnosti određenog uzorka. Pri analizi problema reprezentativnosti takvih uzoraka istraživač ne razmatra toliko sastav uzorka koliko postupak odabira njegovih elemenata.

Prozor za istraživanje: Sjajno! Ali tko će to čitati?

Svake godine oglašivači troše milijune dolara na oglase koji se pojavljuju na stranicama bezbrojnih publikacija od Advertising Age do Yankeeja. Određena procjena teksta i slike može se napraviti prije objave, kako se kaže, kod kuće, u reklamnoj agenciji; zapravo se ne testira i procjenjuje sve dok se oglas ne objavi, okružen desecima jednako pažljivo izrađenih oglasa koji se natječu za pažnju čitatelja.

Društvo Roper Starch širom svijeta ocjenjuje čitljivost oglasa postavljenih u potrošačkim, poslovnim, trgovačkim i stručnim časopisima i novinama. O rezultatima istraživanja upoznaju se oglašivači i agencije - naravno, uz odgovarajuću naknadu. Zato što se oglašivači svaki dan jako trude kako bi svoje oglase prenijeli potrošaču, tvrtki Škrob odlučili izraditi uzorak koji će pretplatnicima dati pravovremene i točne informacije o učinkovitosti oglašavanja. Svake godine tvrtka Škrob intervjuirao je više od 50.000 ljudi, pri čemu je razmatrao oko 20.000 oglasa. Godišnje je proučavano oko 500 pojedinačnih publikacija.

Starch je koristio proporcionalno uzorkovanje, s minimalno 100 čitatelja jednog spola i 100 čitatelja drugog spola. Starch je zaključio da su se s ovom veličinom uzorka glavna odstupanja u razini čitljivosti stabilizirala. Osobno su intervjuirane čitateljice starije od 18 godina, au obzir su uzete sve publikacije, osim onih namijenjenih posebnim populacijama (recimo, intervjuirane su djevojke odgovarajuće dobi za ocjenu publikacija iz časopisa Seventeen).

Prilikom provođenja anketa uzeto je u obzir područje distribucije pojedine publikacije. Recimo da je studija Los Angeles magazina proučavala čitatelje koji žive u južnoj Kaliforniji. "Vrijeme" je proučavano diljem zemlje. Istraživanje je bilo posvećeno pojedinačnim brojevima časopisa i provedeno je u 20-30 gradova istovremeno.

Svaki anketar dobio je malu kvotu intervjua, koja je služila u svrhu minimiziranja varijance rezultata ankete. Upitnici su podijeljeni ljudima različitih zanimanja i dobi s različitim primanjima. Svaka takva studija omogućila je iznošenje stavova prilično širokom čitateljstvu. Pri razmatranju niza stručnih, poslovnih i industrijskih publikacija uvažene su i specifičnosti njihove pretplate i distribucije. Liste pretplatnika posvećene publikacijama s prilično uskom nakladom omogućile su odabir prihvatljivih ispitanika.

U svakoj anketi, anketari su tražili od ispitanika da pregledaju publikaciju i pitali jesu li primijetili neki oglas. Ako je odgovor bio potvrdan, matičar je postavljao niz pitanja kako bi procijenio stupanj prihvaćanja oglasa.

Ova procjena može biti trostruka:

  • Obratite pozornost: oni koji su već obratili pozornost na samu činjenicu pojavljivanja takve najave.
  • Upoznati: oni koji su se sjetili bilo kojeg dijela reklame koji se bavi reklamiranim zaštitnim znakom ili oglašivačem.
  • Čitajte: ljudi koji pročitaju barem pola oglasa.

Nakon anketiranja svih oglasa, anketari su zabilježili ključne podatke o klasifikaciji: spol, dob, zanimanje, bračni status, nacionalnost, prihod, veličinu obitelji i sastav obitelji, što je omogućilo unakrsnu tablicu stupnja zanimanja čitatelja.

Kada se ispravno koriste, podaci tvrtke Škrob omogućuju oglašivačima i agencijama da identificiraju i neuspješne i uspješne vrste reklamnih shema koje privlače i zadržavaju pozornost čitatelja. Informacije ove vrste iznimno su vrijedne za oglašivače koje prvenstveno zanima učinkovitost njihove reklamne kampanje.

Izvor: Roper Starch Worldwide, Mamaronek, NY 10543.

Uzorci vjerojatnosti

Istraživač može odrediti vjerojatnost uključivanja bilo kojeg elementa populacije u uzorak vjerojatnosti, budući da se odabir njegovih elemenata provodi na temelju nekog objektivnog procesa i ne ovisi o hirovima i sklonostima istraživača ili terenskog radnika. Budući da je postupak odabira elemenata objektivan, istraživač može procijeniti pouzdanost dobivenih rezultata, što je bilo nemoguće u slučaju determinističkih uzoraka, bez obzira na to koliko je pažljiv bio odabir elemenata potonjih.

Ne treba misliti da su probabilistički uzorci uvijek reprezentativniji od determinističkih. Zapravo, deterministički uzorak također može biti reprezentativniji. Prednost vjerojatnosnih uzoraka je u tome što omogućuju procjenu potencijalne pogreške uzorkovanja. Ako istraživač radi s determinističkim uzorkom, on nema objektivnu metodu za procjenu njegove primjerenosti ciljevima istraživanja.

Jednostavno nasumično uzorkovanje

Većina ljudi na ovaj ili onaj način naiđe na jednostavne nasumične uzorke, bilo kao dio tečaja statistike na institutu ili čitajući o rezultatima relevantnih studija u novinama ili časopisima. U jednostavnom slučajnom uzorku, svaki element uključen u uzorak ima istu danu vjerojatnost da bude među elementima koji se proučavaju, a bilo koja kombinacija elemenata u izvornoj populaciji može potencijalno postati uzorak. Na primjer, ako želimo izvući jednostavan slučajni uzorak svih studenata upisanih na određeni fakultet, samo trebamo napraviti popis svih studenata, dodijeliti broj svakom imenu u njemu i upotrijebiti računalo da nasumično odaberemo broj elemenata.

Populacija

Populacija
Skup elemenata koji zadovoljavaju određene zadane uvjete; također se naziva studijska (ciljana) populacija.
Parametar
Određena karakteristika ili pokazatelj opće ili proučavane populacije.

Opći, ili proučavani, set je zbirka iz koje se vrši izbor. Ova populacija (populacija) može se opisati nizom specifičnih parametara koji su obilježja opće populacije, od kojih je svaki određeni kvantitativni pokazatelj koji razlikuje jednu populaciju od druge.

Zamislite da je populacija koja se proučava cjelokupna odrasla populacija Cincinnatija. Za opis ove populacije mogu se koristiti brojni parametri: prosječna dob, udio stanovništva s više obrazovanje, razina prihoda itd. Imajte na umu da svi ovi pokazatelji imaju određenu fiksnu vrijednost. Naravno, možemo ih izračunati provedbom potpunog popisa stanovništva koje se proučava. Međutim, obično se ne oslanjamo na kvalifikaciju, već na uzorku odabiremo i koristimo vrijednosti dobivene tijekom selektivnog promatranja za određivanje traženih parametara populacije.

Rečeno ilustriramo tablicom. 15.1 primjer hipotetske populacije od 20 ljudi. Rad s malom hipotetskom populacijom poput ove ima brojne prednosti. Prvo, mala veličina uzorka olakšava izračunavanje parametara populacije koji se mogu koristiti za opisivanje. Drugo, ovaj vam volumen omogućuje da razumijete što se može dogoditi kada se usvoji određeni plan uzorkovanja. Obje ove značajke olakšavaju usporedbu rezultata uzorka s "istinitim" iu ovom slučaju poznata vrijednost skupa, što se ne može reći za tipičnu situaciju u kojoj je stvarna vrijednost skupa nepoznata. Usporedba procjene s "pravom" vrijednošću u ovom slučaju dobiva posebnu jasnoću.

Pretpostavimo da želimo procijeniti, iz dvije nasumično odabrane stavke, prosječni dohodak pojedinaca u izvornoj populaciji. Prosječni prihod će biti njegov parametar. Da bismo procijenili ovu prosječnu vrijednost, koju označavamo kao μ, moramo podijeliti zbroj svih vrijednosti njihovim brojem:

Srednja vrijednost populacije μ = Zbroj elemenata populacije / Broj elemenata.

U našem slučaju izračuni daju:

Izvedena populacija

Izvedena populacija sastoji se od svih mogućih uzoraka koji se mogu odabrati iz opće populacije prema zadanom planu uzorkovanja (planu uzorkovanja). Statistika je karakteristika ili pokazatelj uzorka. Statistička vrijednost uzorka koristi se za procjenu određenog parametra populacije. Različiti uzorci daju različite statistike ili procjene za isti parametar populacije.

Izvedena populacija
Skup svih mogućih prepoznatljivih uzoraka koji se mogu odabrati iz opće populacije prema zadanom planu uzorkovanja. Statistika Karakteristika ili mjera uzorka.

Razmotrimo izvedeni skup svih mogućih uzoraka koji se mogu odabrati iz naše hipotetske populacije od 20 pojedinaca planom uzorkovanja koji pretpostavlja da je veličina uzorka n=2 može se dobiti nasumičnim odabirom koji se ne ponavlja.

Pretpostavimo na trenutak da se podaci za svaku jedinicu populacije - u našem slučaju ime i prihod pojedinca - ispišu na kružiće, nakon čega se spuste u vrč i promiješaju. Istraživač vadi jedan krug iz vrča, ispisuje podatke iz njega i stavlja ga na stranu. Isto čini s drugom šalicom uzetom iz vrča. Zatim istraživač vraća obje šalice u vrč, miješa njihov sadržaj i ponavlja isti slijed radnji. U tablici. 15.2 prikazuje moguće ishode navedenog postupka. Za 20 krugova moguće je 190 takvih kombinacija parova.

Za svaku kombinaciju možete izračunati prosječni prihod. Recimo za uzorkovanje AB (k= 1)

k-e Prosječna vrijednost uzorka = zbroj uzoraka / broj uzoraka =

Na sl. 15.4 prikazuje procjenu srednjeg dohotka za cjelokupnu populaciju i iznos pogreške za svaku procjenu za uzorke k = 25, 62,108,147 I 189 .

Prije nego što nastavimo s razmatranjem odnosa između srednjeg dohotka uzorka (statistike) i srednjeg dohotka populacije (parametar koji treba procijeniti), recimo nekoliko riječi o izvedenoj populaciji. Prvo, u praksi ne sastavljamo agregate ove vrste. To bi zahtijevalo previše vremena i truda. Praktičar je ograničen na sastavljanje samo jednog uzorka potrebne veličine. Istraživač koristi koncept izvedena populacija i povezani koncept distribucije uzorka pri formuliranju konačnih zaključaka.

Kako će biti prikazano u nastavku. Drugo, treba imati na umu da je izvedena populacija definirana kao ukupnost svih mogućih različitih uzoraka koji se mogu odabrati iz opće populacije prema danom planu uzorkovanja. Kada se promijeni bilo koji dio plana uzorkovanja, mijenja se i izvedena populacija. Dakle, ako pri odabiru krugova istraživač vrati prvi od uklonjenih diskova u vrč prije nego što izvadi drugi, izvedeni set će uključiti.

uzorci AA, BB itd. Ako je broj neponovljenih uzoraka 3 umjesto 2, bit će uzoraka tipa ABC, i to 1140, a ne 190, kao u prethodnom slučaju. Kada se jednostavni slučajni odabir promijeni bilo kojom drugom metodom određivanja elemenata uzorka, izvedena populacija se također mijenja.

Također treba imati na umu da je odabir uzorka određene veličine iz opće populacije ekvivalentan odabiru jednog elementa (1 od 190) iz izvedene populacije. Ova nam činjenica omogućuje izvlačenje mnogih statističkih zaključaka.

Srednja vrijednost uzorka i opća srednja vrijednost

Možemo li izjednačiti srednju vrijednost uzorka sa stvarnom srednjom populacijom? U svakom slučaju, polazimo od činjenice da su međusobno povezani. Međutim, također vjerujemo da će biti pogreške. Na primjer, može se pretpostaviti da će se informacije dobivene od korisnika interneta značajno razlikovati od rezultata ankete "obične" populacije. U drugim slučajevima možemo pretpostaviti prilično točno podudaranje, inače ne bismo mogli koristiti vrijednost uzorka za procjenu vrijednosti opće. Ali kolika može biti pogreška koju činimo?

Zbrojimo sva uzorka sredina sadržana u tablici. 15.2, te dobiveni zbroj podijelimo s brojem uzoraka, tj. izračunajmo prosjek prosjeka.
Dobit ćemo sljedeći rezultat:

Poklapa se s prosječnom vrijednošću opće populacije. Kažu da u ovom slučaju imamo posla s nepristrana statistika.

Statistika se naziva nepristranom ako je njezin prosjek u svim mogućim uzorcima jednak procijenjenom parametru populacije. Imajte na umu da ovdje ne govorimo o određenoj vrijednosti. Djelomična procjena može biti vrlo daleko od prave vrijednosti - uzmite, na primjer, AB ili ST uzorke. U nekim slučajevima, prava vrijednost populacije možda se neće moći postići kada se razmatra bilo koji mogući uzorak, čak i ako je statistika nepristrana. U našem slučaju to nije slučaj: niz mogućih uzoraka - na primjer, AT - daje srednju vrijednost uzorka jednaku stvarnoj populacijskoj sredini.

Ima smisla razmotriti distribuciju ovih procjena uzorka, a posebno odnos između ove disperzije procjena i varijacija u razini dohotka u populaciji. Kao mjera varijacije koristi se varijanca opće populacije. Da bismo odredili varijancu opće populacije, moramo izračunati odstupanje svake vrijednosti od sredine, zbrojiti kvadrate svih odstupanja i dobiveni zbroj podijeliti s brojem članova. Označimo s a^ varijancu opće populacije. Zatim:

Varijanca populacije σ 2 = Zbroj kvadrata razlika svakog elementa
populacija i prosjek populacije / Broj elemenata populacije =

Disperzija Srednja vrijednost na isti se način može definirati i razina dohotka. To jest, možemo ga pronaći određivanjem odstupanja svake srednje vrijednosti od njihove ukupne srednje vrijednosti, zbrajanjem kvadrata odstupanja i dijeljenjem rezultirajućeg zbroja s brojem članova.

Varijancu prosječne razine dohotka možemo definirati i na drugi način, koristeći varijancu razine dohotka u općoj populaciji, budući da postoji izravan odnos između ove dvije veličine. Da budemo precizni, u slučajevima kada uzorak predstavlja samo mali dio populacije, varijanca srednje vrijednosti uzorka jednaka je varijanci populacije podijeljene s veličinom uzorka:

gdje je σ x 2 varijanca prosječne vrijednosti uzorka razine dohotka, σ 2 varijanca razine dohotka u općoj populaciji, n- veličina uzorka.

Usporedimo sada distribuciju rezultata s distribucijom kvantitativnog svojstva u općoj populaciji. Slika 15.5 pokazuje da je distribucija obilježja populacije prikazana u okviru A multi-vertex (svaka od 20 vrijednosti pojavljuje se samo jednom) i simetrična je u odnosu na pravu srednju vrijednost populacije od 9400.

Distribucija uzorkovanja
Distribucija vrijednosti određene statistike izračunate za sve moguće različite uzorke koji se mogu izdvojiti iz populacije prema danom planu uzorkovanja.

Distribucija ocjena prikazana u polju B temelji se na podacima u tablici. 15.3, koji je pak sastavljen dodjeljivanjem vrijednosti iz tablice. 15.2 jednoj ili drugoj skupini, ovisno o njihovoj veličini, uz naknadni izračun njihovog broja u skupini. Polje B je tradicionalni histogram, razmatran na samom početku studija statistike, koji predstavlja distribucija uzorkovanja statistika. Usput napominjemo sljedeće: koncept distribucije uzorka je najvažniji koncept statistike, on je kamen temeljac konstrukcije statističkih zaključaka. Prema poznatoj distribuciji uzoraka proučavane statistike, možemo zaključiti o odgovarajućem parametru opće populacije. Ako je, s druge strane, poznato samo da se procjena uzorka mijenja od uzorka do uzorka, ali je priroda te promjene nepoznata, postaje nemoguće odrediti pogrešku uzorkovanja povezanu s tom procjenom. Budući da uzorkovana distribucija procjene opisuje kako se ona mijenja od uzorka do uzorka, ona pruža osnovu za određivanje valjanosti uzorka procjene. Iz tog je razloga dizajn uzorkovanja vjerojatnosti tako važan za statističko zaključivanje.

S obzirom na poznate vjerojatnosti uključivanja svakog člana populacije u uzorak, anketari mogu pronaći uzorak distribucije različitih statistika. Istraživači se oslanjaju na te distribucije - bilo da se radi o srednjoj vrijednosti uzorka, omjeru uzorka, varijanci uzorka ili nekoj drugoj statistici - kada proširuju rezultat promatranja uzorka na opću populaciju. Primijetite također da je za uzorke veličine 2 distribucija srednjih vrijednosti uzorka unimodalna i simetrična u odnosu na stvarnu sredinu.

Dakle, pokazali smo da:

  1. Srednja vrijednost svih mogućih sredina uzoraka jednaka je općoj sredini.
  2. Varijanca srednjih vrijednosti uzorka je na neki način povezana s općom varijancom.
  3. Distribucija srednjih vrijednosti uzorka je unimodalna, dok je distribucija vrijednosti kvantitativnog atributa u općoj populaciji multimodalna.

Centralni granični teorem

Teorem koji kaže da za jednostavne nasumične uzorke veličine n, izolirani iz opće populacije s općim prosjekom μ i varijancom σ 2 , općenito n distribucija uzorka srednje vrijednosti x približava se normalnoj sa središtem jednakim μ i varijancom σ 2 . Točnost ove aproksimacije raste s porastom n.

Centralni granični teorem. Unimodalna distribucija procjena može se smatrati manifestacijom središnjeg graničnog teorema, koji kaže da za jednostavne slučajne uzorke volumena n, odabran iz opće populacije s pravom srednjom μ i varijancom σ 2 , za velike n distribucija srednjih vrijednosti uzorka približava se normalnoj sa središtem jednakim stvarnoj sredini i varijancom koja je jednaka omjeru varijance populacije i veličine uzorka, tj.

Ova aproksimacija postaje sve točnija jer n. Zapamtite ovo. Bez obzira na vrstu populacije, distribucija srednjih vrijednosti uzorka bit će normalna za uzorke dovoljno velike veličine. Što se podrazumijeva pod dovoljno velikim volumenom? Ako je distribucija vrijednosti kvantitativnog atributa opće populacije normalna, tada distribucija uzorka znači za uzorke s volumenom od n=1. Ako je distribucija varijable (kvantitativnog atributa) u populaciji simetrična, ali nije normalna, uzorci vrlo male veličine dat će normalnu distribuciju srednjih vrijednosti uzorka. Ukoliko raspodjela nekog kvantitativnog obilježja opće populacije ima izraženu asimetriju, postoji potreba za većim uzorcima. Pa ipak, distribucija srednje vrijednosti uzorka može se uzeti kao normalna samo ako imamo posla s uzorkom dovoljne veličine.

Da bi se izveli zaključci pomoću normalne krivulje, uopće nije potrebno polaziti od uvjeta normalnosti distribucije vrijednosti kvantitativnog atributa opće populacije. Umjesto toga, oslanjamo se na središnji granični teorem i, ovisno o distribuciji populacije, određujemo takvu veličinu uzorka koja bi nam omogućila rad s normalnom krivuljom. Srećom, normalnu distribuciju statistike daju uzorci relativno male veličine - sl. 15.6 jasno pokazuje ovu okolnost. Procjene intervala pouzdanosti. Može li nam navedeno pomoći u donošenju određenih zaključaka o općem prosjeku? Naime, u praksi odabiremo samo jedan, a ne sve moguće uzorke zadane veličine, te na temelju dobivenih podataka donosimo određene zaključke o ciljanoj skupini.

Kako se to događa? Kao što znate, s normalnom distribucijom, određeni postotak svih opažanja ima određenu standardnu ​​devijaciju; recimo 95% opažanja stane unutar ±1,96 standardnih devijacija srednje vrijednosti. Normalna distribucija srednja vrijednost uzorka, na koju se može primijeniti središnji granični teorem, nije iznimka u ovom smislu. Srednja vrijednost takve distribucije uzorka jednaka je općoj sredini μ, a njezino standardno odstupanje naziva se standardna pogreška srednje vrijednosti:

Ispostavilo se da:

  • 68,26% srednjih vrijednosti uzorka ne odstupaju od opće srednje vrijednosti za najviše ± σ x ;
  • 95,45% srednjih vrijednosti uzorka ne odstupaju od opće srednje vrijednosti za najviše ±σ x ;
  • 99,73% srednjih vrijednosti uzorka ne odstupaju od opće srednje vrijednosti za najviše ± σ x ,

tj. određeni udio uzorka znači ovisno o odabranoj vrijednosti z bit će zatvoreno u intervalu određenom vrijednošću z. Ovaj izraz se može prepisati kao nejednakost:

Opći prosjek - z < Среднее по выборке < Генеральное среднее + z(Standardna pogreška srednje vrijednosti)

dakle, sredina uzorka s određenom vjerojatnošću nalazi se u intervalu čije su granice zbroj i razlika srednje vrijednosti distribucije i određenog broja standardnih devijacija. Ova nejednakost se može pretvoriti u oblik:

Prosječna vrijednost uzorka - z(Standardna pogreška srednje vrijednosti)< Генеральное среднее < Среднее по выборке + z(Standardna pogreška srednje vrijednosti)

Ako se promatra omjer 15,1, npr. u 95% slučajeva ( z= 1,96), tada se u 95% slučajeva također promatra omjer 15,2. U slučajevima kada se zaključak temelji na srednjoj vrijednosti jednog uzorka, koristimo izraz 15.2.

Važno je zapamtiti da je izraz 15.2 ne znači da interval koji odgovara danom uzorku mora nužno uključivati ​​opću srednju vrijednost. Interval ima više veze s procedurom odabira. Interval izgrađen oko ove srednje vrijednosti može, ali i ne mora uključivati ​​pravu srednju vrijednost populacije. Naše povjerenje u ispravnost donesenih zaključaka temelji se na činjenici da će 95% svih intervala konstruiranih prema odabranom planu uzorkovanja sadržavati pravu srednju vrijednost. Vjerujemo da naš uzorak pripada ovih 95%.

Kako bismo ilustrirali ovu važnu točku, zamislimo na trenutak da distribucija uzorka znači veličinu uzoraka n= 2 u našem hipotetskom primjeru je normalno. Tablica 15.4 grafički ilustrira ishod za prvih 10 od mogućih 190 uzoraka koji se mogu odabrati prema zadanom dizajnu. Imajte na umu da samo 7 od 10 intervala uključuje opću ili pravu srednju vrijednost. Povjerenje u ispravnost zaključka nije zbog neke privatne procjene, već upravo postupak procjene. Ovaj postupak je takav da za 100 uzoraka za koje će se izračunati srednja vrijednost uzorka i interval pouzdanosti, u 95 slučajeva taj interval uključuje pravu opću vrijednost. Točnost ovog uzorka određena je postupkom kojim je uzorak formiran. Reprezentativni dizajn uzorka ne jamči reprezentativnost svih uzoraka. Postupci statističkog zaključivanja temelje se na reprezentativnosti plana uzorkovanja, zbog čega je ovaj postupak tako kritičan za vjerojatnosne uzorke.

Probabilističko uzorkovanje omogućuje nam da procijenimo točnost rezultata kao blizinu proizvedenih procjena stvarnoj vrijednosti. Što je veća standardna pogreška statistike, to je veći stupanj raspršenosti procjena i manja je točnost postupka.

Neke može zbuniti činjenica da je razina pouzdanosti povezana s postupkom, a ne s određenom vrijednošću uzorka, međutim, treba imati na umu da se vrijednost razine pouzdanosti procjene opće vrijednosti može prilagoditi istraživač. Ako ne želite riskirati i bojite se da biste mogli naići na jedan od tih pet intervala uzorka koji ne uključuje srednju vrijednost populacije, možete odabrati interval pouzdanosti od 99% gdje samo jedan od stotinu intervala uzorka ne uključuje populacija znači. Nadalje, ako možete povećati veličinu uzorka, povećat ćete stupanj pouzdanosti u rezultat, pružajući željenu točnost procjene vrijednosti populacije. O tome ćemo detaljnije govoriti u pogl. 17.

Postupak koji opisujemo ima još jednu komponentu, koja može izazvati određenu neugodnost. Pri procjeni intervala pouzdanosti koriste se tri veličine: x , z i σ x . Srednja vrijednost uzorka x izračunava se iz podataka uzorka, z odabire se na temelju željene razine pouzdanosti. Ali što je s korijenom srednje kvadratne pogreške srednje vrijednosti σ x? Jednako je:

i stoga, da bismo ga odredili, trebamo pitati standardnu ​​devijaciju kvantitativnog atributa opće populacije, tj. 5. Što učiniti u slučajevima kada standardna devijacija s nepoznato? Ovaj problem ne nastaje iz dva razloga. Prvo, obično za većinu kvantitativnih karakteristika koje se koriste u marketinškim istraživanjima, varijacije se mijenjaju puno sporije od razine većine varijabli od interesa za marketinškog stručnjaka. Sukladno tome, ako se istraživanje ponavlja, u izračunima možemo koristiti prethodnu, prethodno dobivenu vrijednost s. Drugo, kada je uzorak odabran i podaci dobiveni, možemo procijeniti varijancu populacije određivanjem varijance uzorka. Nepristrana varijanca uzorka definirana je kao:

Varijanca uzorka ŝ 2 = Zbroj kvadrata odstupanja od srednje vrijednosti uzorka / (broj uzorkovanih stavki -1). Da bismo odredili varijancu uzorka, prvo moramo pronaći srednju vrijednost uzorka. Zatim se pronađu razlike između svake od vrijednosti uzorka i srednje vrijednosti uzorka; te se razlike kvadriraju, zbrajaju i dijele s brojem jednakim broju opažanja uzorka minus jedan. Varijanca uzorka ne daje samo procjenu ukupne varijance, već se također može koristiti za procjenu standardne pogreške srednje vrijednosti. Kada je poznata opća varijanca σ 2, poznata je i korijen srednje kvadratne pogreške σ x, jer:

Kada je opća varijanca nepoznata, standardna pogreška srednje vrijednosti može se samo procijeniti. Ova procjena je dana ŝ x, što je jednako standardnoj devijaciji uzorka podijeljeno s Korijen od veličine uzorka, tj. Procjena se utvrđuje na isti način kao što je određena procjena stvarne vrijednosti, ali se umjesto opće standardne devijacije u formulu za izračun ubacuje standardna devijacija uzorka. Dakle, recimo za uzorak AB sa srednjom vrijednosti uzorka od 5800:

Prema tome, ŝ = 283, i

i 95% razmaka je sada

što je manje od prethodne vrijednosti.

U tablici. 15.5 sažima formule za izračun za različite prosjeke i disperzije, o kojima se govorilo u ovom poglavlju. Formiranje jednostavnog slučajnog uzorka. U našem primjeru odabir elemenata uzorka proveden je pomoću vrča koji je sadržavao sve elemente izvorne populacije. To nam je omogućilo vizualizaciju koncepata izvedene populacije i distribucije uzorka. Ne preporučamo korištenje takve metode u praksi, jer to povećava vjerojatnost pogreške. Šalice se mogu razlikovati po veličini i teksturi, što u određenim slučajevima može dati prednost jednoj nad drugom. Odabir sudionika u vijetnamskoj kampanji, proveden putem lutrije, može poslužiti kao primjer greške ove vrste.

Selekcija se vršila izvlačenjem diskova s ​​datumima rođenja iz velikog bubnja. Televizija je prenosila ovaj postupak u cijeloj zemlji. Nažalost, diskovi su ubačeni u bubanj na sustavan način, tako da su datumi u siječnju prvi, a posljednji u prosincu. Iako je bubanj bio podvrgnut intenzivnoj vrtnji, prosinački datumi padali su mnogo češće nego siječanjski. Naknadno je ovaj postupak revidiran na način da je vjerojatnost takvih sustavnih pogrešaka značajno smanjena. Preferirana metoda za generiranje jednostavnog slučajnog uzorka temelji se na korištenju tablice slučajnih brojeva.

Korištenje takve tablice uključuje sljedeći niz koraka. Prvo, elementima populacije moraju biti dodijeljeni uzastopni brojevi od 1 do N; u našoj hipotetskoj populaciji na element A elementu će biti dodijeljen broj 1 B- broj 2, itd. Drugo, broj znamenki u tablici nasumičnih brojeva mora biti isti kao i broj N. Za N= koristit će se 20 dvoznamenkastih brojeva; Za N između 100 i 999 - troznamenkasti brojevi, itd. Treće, početna pozicija mora se odrediti nasumično. Možemo otvoriti odgovarajuću tablicu nasumičnih brojeva i, zatvorivši oči, kako kažu, ubosti prstom u nju. Budući da su brojevi u tablici nasumičnih brojeva nasumični redoslijed, početna pozicija zapravo nije bitna.

I na kraju, možemo se kretati u proizvoljno odabranom smjeru - gore, dolje ili poprijeko, odabirući one elemente čiji će brojevi odgovarati slučajnim brojevima iz tablice. Kako bismo ilustrirali rečeno, razmotrimo skraćenu tablicu slučajnih brojeva (tablica 15.6). Jer N= 20, trebali bismo raditi samo s dvoznamenkastim brojevima. U tom smislu tab. 15.6 nam savršeno odgovara. Pretpostavimo da smo unaprijed odlučili pomaknuti se niz stupac, početna pozicija je na sjecištu jedanaestog retka i četvrtog stupca, gdje se nalazi broj 77. Ovaj broj je prevelik i stoga ga treba odbaciti. Sljedeća dva broja također će biti odbačena, dok će se četvrta vrijednost 02 koristiti jer je 2 broj elementa U.

Sljedećih pet brojeva također će biti odbačeni kao preveliki, dok će broj 05 označavati element E. Dakle elementi U I E postat će naš uzorak od dva elementa, po kojemu ćemo prosuđivati ​​visinu prihoda ove populacije. Moguća je i alternativna strategija u kojoj će se kao osnova za odabir koristiti računalni program koji generira slučajne brojeve. Nedavne publikacije pokazuju da brojke koje generiraju takvi programi nisu potpuno slučajne, što se može manifestirati na određeni način prilikom izgradnje složenih matematičkih modela, već se mogu koristiti za većinu primijenjenih marketinških istraživanja. Napominjemo još jednom da jednostavan slučajni uzorak zahtijeva sastavljanje sekvencijalnog numeriranog popisa elemenata opće populacije.

Drugim riječima, svaki član izvorne populacije mora biti identificiran. Za neke populacije to nije teško učiniti, na primjer, u studiji o 500 najvećih američkih korporacija, čiji je popis dan u časopisu Fortune. Ovaj popis je već sastavljen, tako da formiranje jednostavnog slučajnog uzorka u ovom slučaju neće biti teško. Za druge početne populacije (na primjer, za sve obitelji koje žive u određenom gradu), sastavljanje općeg popisa je izuzetno teško, što tjera istraživače da pribjegnu drugim shemama istraživanja uzorka.

Sažetak

Cilj učenja 1
Jasno razlikovati pojmove popisa (kvalifikacije) i uzorkovanja

Potpuni popis stanovništva (stanovništva) naziva se kvalificirani. Uzorak set, formiran od odabranih elemenata.

Cilj učenja 2
Poznavati bit i slijed šest faza koje provode istraživači kako bi dobili uzorak populacije

Proces uzorkovanja podijeljen je u šest koraka:

  1. dodjela stanovništva;
  2. određivanje okvira uzorkovanja;
  3. izbor selekcijskog postupka;
  4. određivanje veličine uzorka;
  5. izbor elemenata uzorka;
  6. ispitivanje odabranih elemenata.

Cilj učenja 3
Definirajte koncept "okvira uzorkovanja"

Okvir za uzorkovanje je popis stavki iz kojih će se uzeti uzorak.

Cilj učenja 4
Objasnite razliku između probabilističkog i determinističkog uzorkovanja

U probabilističkom uzorku svaki član populacije može biti uključen s određenim zadano različito od nule vjerojatnost. Vjerojatnosti uključivanja pojedinih članova populacije u uzorak mogu se međusobno razlikovati, ali je vjerojatnost uključivanja svakog elementa u uzorak poznata. Za determinističke uzorke, procjena vjerojatnosti uključivanja bilo kojeg elementa u uzorak postaje nemoguća. Ne može se jamčiti reprezentativnost takvog uzorka. Svi deterministički odabiri temelje se na osobnom stavu, prosudbi ili preferencijama. Takve preferencije ponekad mogu dati dobre procjene karakteristika populacije, ali ne postoji način da se objektivno odredi prikladnost uzorka za zadatak.

Cilj učenja 5
Napravite razliku između uzorkovanja fiksne veličine i višestupanjskog (uzastopnog) uzorkovanja

U slučaju rada s uzorcima fiksne veličine, veličina uzorka se utvrđuje prije početka istraživanja, a analizi rezultata prethodi prikupljanje svih potrebnih podataka. U sekvencijalnom uzorku broj odabranih elemenata nije unaprijed poznat, on se utvrđuje na temelju niza sekvencijalnih odluka.

Cilj učenja 6
Objasnite što je namjerno uzorkovanje i opišite njegove prednosti i slabosti

Stavke za namjerno uzimanje uzoraka ručno se biraju i prezentiraju istraživaču kako je prikladno za potrebe istraživanja. Pretpostavlja se da odabrani elementi mogu dati cjelovitu sliku proučavane populacije. Sve dok je istraživač u ranoj fazi rješavanja problema, kada se utvrđuju izgledi i moguća ograničenja planiranog istraživanja, korištenje namjernog uzorkovanja može biti vrlo učinkovito. Ali ni u kojem slučaju ne treba zaboraviti na slabosti ove vrste uzorka, budući da ga istraživač može koristiti iu deskriptivnim ili kauzalnim studijama, što neće kasno utjecati na kvalitetu njihovih rezultata.

Cilj učenja 7
Definirajte pojam kvotnog uzorkovanja

Proporcionalno uzorkovanje bira se na način da udio elemenata uzorka s određenim karakteristikama približno odgovara udjelu istih elemenata u populaciji koja se proučava; da bi se to postiglo, svakom brojaču je dodijeljena kvota koja određuje karakteristike populacije s kojom mora kontaktirati.

Cilj učenja 8
Objasnite što je parametar u selekcijskom postupku

Parametar - određena karakteristika ili pokazatelj opće ili proučavane populacije; određeni kvantitativni pokazatelj koji razlikuje jedan skup od drugog.

Cilj učenja 9
Objasnite što je to izvedeni skup

Izvedena populacija sastoji se od svih mogućih uzoraka koji se mogu odabrati iz opće populacije prema zadanom planu uzorkovanja.

Cilj učenja 10
Objasnite zašto je koncept distribucije uzorka najvažniji koncept statistike.

Koncept distribucije uzorka kamen je temeljac statističkog zaključivanja. Prema poznatoj distribuciji uzoraka proučavane statistike, možemo zaključiti o odgovarajućem parametru opće populacije. Ako je, s druge strane, poznato samo da se procjena uzorka mijenja od uzorka do uzorka, ali je priroda te promjene nepoznata, postaje nemoguće odrediti pogrešku uzorkovanja povezanu s tom procjenom. Budući da uzorkovana distribucija procjene opisuje kako se ona mijenja od uzorka do uzorka, ona pruža osnovu za određivanje valjanosti uzorka procjene.

Statistička istraživanja su dugotrajna i skupa, pa je došlo do ideje da se kontinuirano promatranje zamijeni selektivnim.

Glavna svrha nekontinuiranog promatranja je dobivanje karakteristika statističke populacije koja se proučava za njezin ispitivani dio.

Selektivno promatranje- ovo je metoda statističkog istraživanja, u kojoj se generalizirajući pokazatelji stanovništva utvrđuju samo za jedan dio, na temelju odredbi slučajnog odabira.

U metodi uzorkovanja proučava se samo određeni dio populacije koja se proučava, dok se statistička populacija koja se proučava naziva opća populacija.

Uzorkom ili jednostavno uzorkom možemo nazvati dio jedinica odabranih iz opće populacije, koje će biti podvrgnute statističkom istraživanju.

Vrijednost metode uzorkovanja: uz minimalan broj jedinica koje se proučavaju, statističko istraživanje će se provesti u kraćim vremenskim razdobljima i uz najmanji trošak sredstava i rada.

U općoj populaciji, udio jedinica koje imaju osobinu koja se proučava naziva se opći udio (označeno R), a prosječna vrijednost svojstva proučavane varijable je opći prosjek (označen X).

U populaciji uzorka udio proučavanog svojstva naziva se udio uzorka ili dio (označava se s w), prosječna vrijednost u uzorku je srednja vrijednost uzorka.

Ako se tijekom razdoblja istraživanja poštuju sva pravila njegove znanstvene organizacije, tada će metoda uzorkovanja dati prilično točne rezultate, pa stoga ovu metodu svrhovito je primijeniti za provjeru podataka kontinuiranog opažanja.

Ova je metoda postala široko rasprostranjena u državnoj i izvanresornoj statistici, jer pri ispitivanju minimalnog broja jedinica koje se proučavaju omogućuje temeljitu i točnu studiju.

Proučavana statistička populacija sastoji se od jedinica s različitim karakteristikama. Sastav uzorka može se razlikovati od sastava opće populacije, ta razlika između karakteristika uzorka i opće populacije čini pogrešku uzorkovanja.

Pogreške svojstvene selektivnom promatranju karakteriziraju veličinu odstupanja između podataka selektivnog promatranja i cjelokupne populacije. Pogreške koje se javljaju tijekom uzorkovanja nazivaju se pogreškama reprezentativnosti i dijele se na slučajne i sustavne.

Ako populacija uzorka ne reproducira točno cijelu populaciju zbog nekontinuirane prirode promatranja, tada se to naziva slučajnim pogreškama, a njihove se veličine određuju s dovoljnom točnošću na temelju zakona velikih brojeva i teorije vjerojatnosti.

Sustavne pogreške nastaju kao posljedica kršenja načela slučajnog odabira populacijskih jedinica za promatranje.

2. Vrste i sheme selekcije

Veličina pogreške uzorkovanja i metode njezina određivanja ovise o vrsti i shemi odabira.

Postoje četiri vrste odabira skupa jedinica promatranja:

1) slučajan;

2) mehanički;

3) tipični;

4) serijski (ugniježđeni).

slučajni odabir- najčešća metoda odabira u slučajnom uzorku, naziva se i metoda lutrije, u kojoj se za svaku jedinicu statističke populacije priprema listić s rednim brojem.

Zatim se nasumično odabire traženi broj jedinica statističke populacije. Pod tim uvjetima, svaki od njih ima jednaku vjerojatnost ulaska u uzorak, primjerice izvlačenja dobitaka, kada se iz ukupnog broja izdanih listića slučajnim odabirom odabere određeni dio brojeva koji čine dobitak. U tom slučaju, svi brojevi imaju jednaku mogućnost ulaska u uzorak.

Mehanički odabir- ovo je metoda kada se cijela populacija podijeli u skupine homogene veličine prema slučajnom kriteriju, tada se iz svake skupine uzima samo jedna jedinica.Sve jedinice proučavane statističke populacije unaprijed su poredane određenim redoslijedom, ali ovisno o na veličini uzorka mehanički se odabire potreban broj jedinica u određenom intervalu.

Tipičan odabir - to je metoda u kojoj se proučavana statistička populacija dijeli prema bitnom, tipičnom obilježju u kvalitativno homogene, slične skupine, zatim se iz svake te skupine nasumično odabire određeni broj jedinica, proporcionalan udjelu skupine u cjelokupno stanovništvo.

Tipična selekcija daje točnije rezultate jer uključuje predstavnike svih tipičnih skupina u uzorku.

Serijski (gniježđeni) odabir. Selekciji podliježu cijele skupine (serije, gnijezda), odabrane nasumično ili mehanički. Za svaku takvu skupinu provodi se serija, kontinuirano promatranje, a rezultati se prenose na cjelokupnu populaciju.

Točnost uzorkovanja također ovisi o shemi odabira. Uzorkovanje se može provesti prema shemi ponovljenog i neponovljenog odabira.

Ponovna selekcija. Svaka odabrana jedinica ili serija vraća se cijeloj populaciji i može se ponovno uzorkovati.To je takozvana shema vraćene lopte.

Ponavljajući odabir. Svaka ispitana jedinica se povlači i ne vraća u populaciju, te se ne ispituje ponovno. Ova se shema naziva nevraćena lopta.

Selekcija koja se ne ponavlja daje točnije rezultate jer uz istu veličinu uzorka promatranje obuhvaća više jedinica proučavane populacije.

Kombinirani odabir može proći kroz jednu ili više faza. Uzorak se naziva jednofaznim ako se jednom odabrane jedinice populacije podvrgnu proučavanju.

Uzorak se naziva višefaznim ako selekcija populacije prolazi kroz faze, uzastopne faze, a svaka faza, faza selekcije ima svoju jedinicu selekcije.

Višefazno uzorkovanje - u svim fazama uzorkovanja zadržava se ista jedinica uzorkovanja, ali se provodi više faza, faza uzorkovanja, koje se međusobno razlikuju po širini programa istraživanja i veličini uzorka.

Karakteristike parametara opće populacije i populacije uzorka označene su sljedećim simbolima:

N- obujam opće populacije;

n- veličina uzorka;

x– opća havarija;

x je srednja vrijednost uzorka;

R– opći udio;

w - udio uzorka;

2 - opća varijanca (raspršenost obilježja u općoj populaciji);

2 - varijanca uzorka iste značajke;

? - standardna devijacija u općoj populaciji;

? je standardna devijacija u uzorku.

3. Pogreške uzorkovanja

Svaka jedinica u promatranju uzorka trebala bi imati jednaku priliku da bude odabrana kao i ostale - to je osnova slučajnog uzorka.

Samoslučajno uzorkovanje - to je odabir jedinica iz cjelokupne opće populacije ždrijebom ili na drugi sličan način.

Načelo slučajnosti je da na uključivanje ili isključivanje objekta iz uzorka ne može utjecati niti jedan čimbenik osim slučajnosti.

Uzorak udjela je omjer broja jedinica u uzorku prema broju jedinica u općoj populaciji:


Samoslučajni odabir u svom čistom obliku je početni među svim drugim vrstama odabira, sadrži i provodi osnovne principe selektivnog statističkog promatranja.

Dvije glavne vrste generalizirajućih pokazatelja koji se koriste u metodi uzorkovanja su prosječna vrijednost kvantitativnog atributa i relativna vrijednost alternativnog atributa.

Udio uzorka (w), odnosno posebnost, određen je omjerom broja jedinica koje imaju svojstvo koje se proučava. m, na ukupan broj jedinica uzorkovanja (n):


Za karakterizaciju pouzdanosti pokazatelja uzorka razlikuju se prosječna i granična pogreška uzorka.

Pogreška uzorkovanja, koja se naziva i pogreška reprezentativnosti, razlika je između odgovarajućeg uzorka i općih karakteristika:

?x = | x - x |;

?w =|h – p|.

Samo uzorkovana opažanja imaju pogrešku uzorkovanja

Srednja vrijednost uzorka i udio uzorka- Ovo slučajne varijable usluge poslužitelja razna značenja ovisno o jedinicama proučavane statističke populacije koje su bile uključene u uzorak. Sukladno tome, pogreške uzorkovanja također su slučajne varijable i također mogu poprimiti različite vrijednosti. Stoga se određuje prosjek mogućih pogrešaka – prosječna pogreška uzorkovanja.

Prosječna pogreška uzorkovanja određena je veličinom uzorka: što je veća populacija, uz ostale uvjete jednake, to je manja prosječna pogreška uzorkovanja. Obuhvaćajući uzorak istraživanja sa sve većim brojem jedinica opće populacije, sve točnije karakteriziramo cjelokupnu populaciju.

Prosječna pogreška uzorkovanja ovisi o stupnju varijacije proučavanog svojstva, zauzvrat, stupanj varijacije karakterizira varijanca? 2 ili w(l - w)- za alternativni znak. Što je manja varijacija obilježja i varijanca, to je manja srednja pogreška uzorkovanja, i obrnuto.

Za nasumično ponovno uzorkovanje, srednje pogreške se teoretski izračunavaju pomoću sljedećih formula:

1) za prosječno kvantitativno svojstvo:


Gdje? 2 - prosječna vrijednost disperzije kvantitativnog svojstva.

2) za dionicu (alternativni znak):


Dakle, kakva je varijanca osobine u populaciji? 2 nije točno poznata, u praksi se koristi vrijednost varijance S 2 izračunata za populaciju uzorka na temelju zakona velikih brojeva, prema kojem populacija uzorka s dovoljno velikom veličinom uzorka točno reproducira karakteristike opće populacije .

Formule za srednju pogrešku uzorkovanja za nasumično ponovno uzorkovanje su sljedeće. Za prosječnu vrijednost kvantitativnog atributa: opća varijanca se izražava kroz izborni sljedećim omjerom:


gdje je S 2 vrijednost disperzije.

Mehaničko uzorkovanje- to je odabir jedinica u skup uzorka iz općeg, koji se dijeli na jednake skupine prema neutralnom kriteriju; provodi se na način da se iz svake takve skupine u uzorku izabere samo jedna jedinica.

Kod mehaničkog odabira, jedinice statističke populacije koja se proučava prethodno se raspoređuju u određeni redoslijed, nakon čega se mehanički odabire određeni broj jedinica u određenom intervalu. U tom je slučaju veličina intervala u općoj populaciji jednaka recipročnoj vrijednosti udjela uzorka.

Uz dovoljno veliku populaciju, mehanički odabir u smislu točnosti rezultata je blizak slučajnom, stoga se za određivanje prosječne pogreške mehaničkog uzorkovanja koriste formule slučajnog neponovljivog uzorkovanja.

Za odabir jedinica iz heterogene populacije koristi se takozvani tipični uzorak, koristi se kada se sve jedinice opće populacije mogu podijeliti u nekoliko kvalitativno homogenih, sličnih skupina prema karakteristikama o kojima ovise proučavani pokazatelji.

Zatim se iz svake tipične skupine slučajnim ili mehaničkim uzorkom vrši pojedinačni odabir jedinica u uzorak.

Tipično uzorkovanje obično se koristi u proučavanju složenih statističkih populacija.

Tipično uzorkovanje daje točnije rezultate. Tipizacijom opće populacije osigurava se reprezentativnost takvog uzorka, zastupljenost svake tipološke skupine u njemu, čime je moguće isključiti utjecaj međugrupne varijance na prosječnu pogrešku uzorka. Stoga, pri određivanju prosječne pogreške tipičnog uzorka, prosjek unutargrupnih varijanci djeluje kao pokazatelj varijacije.

Serijsko uzorkovanje uključuje slučajni odabir iz opće populacije skupina jednake veličine kako bi se sve jedinice bez iznimke podvrgnule promatranju u takvim skupinama.

Budući da se sve jedinice bez iznimke ispituju unutar skupina (serija), prosječna pogreška uzorkovanja (pri odabiru jednakih serija) ovisi samo o međugrupnoj (međuserijskoj) varijanci.

4. Načini širenja rezultata uzorka na populaciju

Karakterizacija opće populacije na temelju rezultata uzorka krajnji je cilj promatranja uzorka.

Metodom uzorkovanja dobivaju se karakteristike opće populacije za pojedine pokazatelje uzorka. Ovisno o ciljevima istraživanja, to se provodi izravnim preračunavanjem pokazatelja uzorka za opću populaciju ili metodom izračuna faktora korekcije.

Metoda izravnog preračunavanja je da s njom dijele pokazatelji uzorka w ili srednje x proširuju se na opću populaciju, uzimajući u obzir pogrešku uzorkovanja.

Metoda faktora korekcije koristi se kada je svrha metode uzorkovanja doraditi rezultate cjelovitog računovodstva. Ova metoda se koristi za doradu podataka godišnjih popisa stočnog fonda stanovništva.

Uzorak - ovo:

1) ukupnost onih elemenata predmeta proučavanja koji će se neposredno proučavati;

2) metode i postupci odabira elemenata predmeta proučavanja.

Populacija - kompletan skup objekata koji se odnose na problem koji se proučava. U sociološkim studijama kao G.S. najčešće djeluju agregati pojedinaca - stanovništvo (gradovi, države i sl.), društvena grupa(mladi, nezaposleni, gospodarstvenici i dr.), publika masovnih medija (MSK) i dr. Međutim, u mnogim slučajevima G.S. može se sastojati od većih elemenata (objekata) - obitelji (kućanstava), akademskih grupa, poduzeća, vjerskih zajednica, pojedinačnih naselja ili država itd.

Uzorak populacije - dio objekata iz opće populacije odabran za proučavanje kako bi se izveo zaključak o cjelokupnoj populaciji.

Da bi se zaključak dobiven proučavanjem uzorka mogao proširiti na cjelokupnu populaciju, uzorak mora imati svojstvo reprezentativnosti.

Reprezentativnost je sposobnost uzorka da predstavlja populaciju koja se proučava. Što točnije sastav uzorka predstavlja populaciju o temama koje se proučavaju, to je njegova reprezentativnost veća.

PRIMJER: Reprezentativnost se može ilustrirati sljedećim primjerom. Pretpostavimo da su populacija svi učenici škole (600 ljudi iz 20 razreda, 30 ljudi u svakom razredu). Predmet proučavanja je stav prema pušenju. Uzorak od 60 srednjoškolaca puno lošije predstavlja populaciju od uzorka od istih 60 ljudi, koji će uključivati ​​po 3 učenika iz svakog razreda. Glavni razlog tome je nejednaka dobna raspodjela u razredima. Dakle, u prvom slučaju reprezentativnost uzorka je niska, au drugom slučaju visoka (ceteris paribus).

Vrste uzoraka

1. Nasumično uzorkovanje.

1.1. Jednostavan slučajni odabir.

1.2 Metoda sustavnog (ili mehaničkog) uzorkovanja.

1.3. Serijsko (ugniježđeno ili klastersko) uzorkovanje.

1.4 Stratificirano uzorkovanje.

2. Neslučajno uzorkovanje (nevjerojatnost).

2.2. slučajni odabir.

2.3. Višestupanjsko i jednostupanjsko uzorkovanje.

1. Nasumično uzorkovanje.

Značajka slučajnog uzorkovanja je da sve jedinice opće populacije imaju jednaku vjerojatnost da budu uključene u uzorak. Za nasumično uzorkovanje, načelo slučajnosti. Osnova uzorka mogu biti popisi zaposlenika poduzeća, telefonski imenici, registracijski popisi vlasnika automobila, popisi birača na biračkim mjestima, kućne knjige, kao i razni popisi koje sastavlja sam sociolog ovisno o ciljevima istraživanja. (popis ulica na kojima se potom vrši selekcija ispitanika).

Slučajni uzorak obično se koristi u ispitivanjima javnog mnijenja prije izbora, referenduma i drugih javnih događanja.

plus ove metode je potpuno poštivanje načela slučajnosti i, kao rezultat, izbjegavanje sustavnih pogrešaka.

Nedostaci ove metode:

– Potreba za popisom elemenata stanovništva.

- Poteškoće u provođenju ankete.

– Relativno velika veličina uzorka.

Uzorak - skup slučajeva (subjekata, objekata, događaja, uzoraka), uz korištenje određene procedure, odabranih iz opće populacije za sudjelovanje u istraživanju.

Veličina uzorka

Veličina uzorka - broj slučajeva uključenih u uzorak. Iz statističkih razloga preporuča se da broj slučajeva bude najmanje 30-35.

Zavisni i nezavisni uzorci

Kada se uspoređuju dva (ili više) uzorka, njihova ovisnost je važan parametar. Ako je moguće uspostaviti homomorfni par (to jest, kada jedan slučaj iz uzorka X odgovara jednom i samo jednom slučaju iz uzorka Y i obrnuto) za svaki slučaj u dva uzorka (a ta je osnova odnosa važna za značajku mjereno na uzorcima), takvi se uzorci nazivaju zavisni. Primjeri zavisnih odabira:

  1. par blizanaca
  2. dva mjerenja bilo koje značajke prije i nakon eksperimentalnog izlaganja,
  3. muževi i žene
  4. i tako dalje.

Ako ne postoji takav odnos između uzoraka, ti se uzorci smatraju neovisnima, na primjer:

  1. muškarci i žene,
  2. psiholozi i matematičari.
  3. Sukladno tome, ovisni uzorci uvijek imaju istu veličinu, dok se veličina neovisnih uzoraka može razlikovati.

Uzorci se uspoređuju pomoću različitih statističkih kriterija:

  • Studentov t-test
  • Wilcoxonov T-test
  • Mann-Whitney U test
  • Kriterij znakova
  • i tako dalje.

Reprezentativnost

Uzorak se može smatrati reprezentativnim ili nereprezentativnim.

Primjer nereprezentativnog uzorka

U Sjedinjenim Državama jedan od najpoznatijih povijesnih primjera nereprezentativnog uzorkovanja je slučaj koji se dogodio tijekom predsjedničkih izbora 1936. godine. Litreary Digest, koji je uspješno predvidio događaje nekoliko prethodnih izbora, krivo je procijenio svoja predviđanja poslavši deset milijuna probnih glasačkih listića svojim pretplatnicima, ljudima odabranim iz telefonskih imenika diljem zemlje i ljudima s popisa automobila. U 25% vraćenih glasačkih listića (gotovo 2,5 milijuna), glasovi su raspoređeni na sljedeći način:

57% dalo je prednost republikanskom kandidatu Alfu Landonu

40% izabralo je tadašnjeg demokratskog predsjednika Franklina Roosevelta

Kao što je poznato, Roosevelt je pobijedio na stvarnim izborima s više od 60% glasova. Pogreška Litreary Digesta bila je sljedeća: u želji da povećaju reprezentativnost uzorka - jer su znali da se većina njihovih pretplatnika smatra republikancima - proširili su uzorak s ljudima odabranim iz telefonskih imenika i popisa registracija. Međutim, nisu uzeli u obzir realnost svog vremena i zapravo su regrutirali još više republikanaca: tijekom Velike depresije uglavnom su si srednja i viša klasa (to jest, većina republikanaca, a ne demokrata) mogli priuštiti vlastite telefone i automobile.

Vrste planova za izgradnju grupa iz uzoraka

Postoji nekoliko glavnih tipova grupnih planova izgradnje:

  • Studija s eksperimentalnom i kontrolnom skupinom, koje su smještene u različitim uvjetima.
  • Studija s eksperimentalnim i kontrolnim skupinama koristeći strategiju odabira u paru
  • Studija koristeći samo jednu grupu - eksperimentalnu.
  • Studija koja koristi mješoviti (faktorijalni) plan - sve su skupine smještene u različite uvjete.

Strategije izgradnje grupe

Odabir grupa za njihovo sudjelovanje u psihološkom eksperimentu provodi se pomoću različitih strategija koje su potrebne kako bi se osiguralo najveće moguće poštivanje unutarnje i vanjske valjanosti.

  • Randomizacija (nasumični odabir)
  • Angažiranje pravih grupa

Randomizacija

Randomizacija, ili slučajni odabir, koristi se za stvaranje jednostavnih nasumičnih uzoraka. Korištenje takvog uzorka temelji se na pretpostavci da će svaki član populacije jednako vjerojatno biti uključen u uzorak. Na primjer, da biste napravili slučajni uzorak od 100 studenata, možete staviti papire s imenima svih studenata u šešir, a zatim iz njega izvaditi 100 papirića - to će biti slučajni odabir (Goodwin J., str. 147).

Odabir po paru

Odabir po paru- strategija konstruiranja grupa uzoraka, u kojoj se grupe ispitanika sastoje od ispitanika koji su ekvivalentni po sporednim parametrima značajnim za eksperiment. Ova strategija je učinkovita za eksperimente koji koriste eksperimentalne i kontrolne grupe s najboljom opcijom - regrutiranjem

Istraživanje obično počinje s nekom pretpostavkom, koja zahtijeva provjeru uz uključivanje činjenica. Ova pretpostavka - hipoteza - formulirana je u odnosu na povezanost pojava ili svojstava u određenom skupu objekata.

Da bi se takve pretpostavke provjerile na činjenicama, potrebno je izmjeriti odgovarajuća svojstva njihovih nositelja. Ali nemoguće je izmjeriti anksioznost kod svih žena i muškaraca, kao što je nemoguće izmjeriti agresivnost kod svih adolescenata. Stoga su pri provođenju studije ograničeni na samo relativno malu skupinu predstavnika relevantnih populacija ljudi.

Populacija- ovo je cijeli skup objekata u odnosu na koje se formulira hipoteza istraživanja.

Na primjer, svi muškarci; ili sve žene; ili svi stanovnici nekog grada. Opće populacije u odnosu na koje će istraživač donositi zaključke na temelju rezultata istraživanja mogu biti manje brojčane i skromnije, primjerice svi prvašići određene škole.

Dakle, opća populacija je, iako ne beskonačna, već u pravilu mnoštvo potencijalnih subjekata nedostupnih kontinuiranom istraživanju.

Uzorak ili uzorak populacije- ovo je skupina objekata ograničenog broja (u psihologiji - subjekti, ispitanici), posebno odabranih iz opće populacije za proučavanje njegovih svojstava. U skladu s tim naziva se proučavanje svojstava opće populacije na uzorku selektivno istraživanje. Gotovo sve psihološke studije su selektivne, a njihovi se zaključci odnose na opću populaciju.

Dakle, nakon što je hipoteza formulirana i odgovarajuće opće populacije određene, istraživač se suočava s problemom organizacije uzorka. Uzorak treba biti takav da je opravdana generalizacija zaključaka studije uzorka – generalizacija, njihova distribucija na opću populaciju. Glavni kriteriji za valjanost zaključaka studijeto su reprezentativnost uzorka i statistička valjanost (empirijskih) rezultata.

Reprezentativnost uzorka- drugim riječima, njegova reprezentativnost je sposobnost uzorka da dosta cjelovito reprezentira proučavane pojave - sa stajališta njihove varijabilnosti u općoj populaciji.

Naravno, samo opća populacija može dati cjelovitu sliku fenomena koji se proučava, u svim njegovim rasponima i nijansama varijabilnosti. Stoga je reprezentativnost uvijek ograničena u onoj mjeri u kojoj je ograničen uzorak. A upravo je reprezentativnost uzorka glavni kriterij pri određivanju granica generalizacije nalaza istraživanja. Ipak, postoje tehnike koje omogućuju dobivanje reprezentativnog uzorka dovoljnog za istraživača (Ove tehnike se proučavaju u kolegiju "Eksperimentalna psihologija").


Prva i glavna tehnika je jednostavan slučajni (randomizirani) odabir. To uključuje osiguravanje da svaki član populacije ima jednaku šansu da bude uključen u uzorak. Slučajni odabir daje mogućnost ulaska u uzorak najrazličitijih predstavnika opće populacije. Istodobno se poduzimaju posebne mjere kako bi se isključila pojava bilo kakve pravilnosti u odabiru. A to nam omogućuje da se nadamo da će na kraju, u uzorku, proučavano svojstvo biti zastupljeno, ako ne u cijelosti, onda u svojoj najvećoj mogućoj raznolikosti.

Drugi način osiguravanja reprezentativnosti je stratificirani slučajni odabir, odnosno odabir prema svojstvima opće populacije. Uključuje preliminarno određivanje onih kvaliteta koje mogu utjecati na varijabilnost svojstva koje se proučava (to može biti spol, razina prihoda ili obrazovanje itd.). Zatim se utvrđuje postotni omjer broja grupa (stratuma) koji se razlikuju po tim svojstvima u općoj populaciji i daje identičan postotni omjer odgovarajućih skupina u uzorku. Nadalje, u svakoj podskupini uzorka ispitanici se biraju po principu jednostavnog slučajnog odabira.

Statistička valjanost, ili statističke značajnosti, rezultati istraživanja određuju se pomoću metoda statističkog zaključivanja.

Jesmo li određenim zaključcima iz rezultata istraživanja osigurani od pogrešaka pri donošenju odluka? Naravno da ne. Uostalom, naše odluke temelje se na rezultatima istraživanja uzorka populacije, kao i na razini našeg psihološkog znanja. Nismo potpuno imuni na pogreške. U statistici se takve pogreške smatraju prihvatljivima ako se ne pojavljuju više od jednog slučaja od 1000 (vjerojatnost pogreške α = 0,001 ili pridružena vrijednost vjerojatnosti pouzdanosti točnog zaključka p = 0,999); u jednom slučaju od 100 (vjerojatnost pogreške α = 0,01 ili pridružena vrijednost vjerojatnosti pouzdanosti ispravnog zaključka p = 0,99) ili u pet slučajeva od 100 (vjerojatnost pogreške α = 0,05 ili pridružena vrijednost vjerojatnosti pouzdanosti od točan učinak p=0,95). U psihologiji je uobičajeno donositi odluke na posljednje dvije razine.

Ponekad se, govoreći o statističkoj značajnosti, koristi koncept "razine značajnosti" (označen kao α). Brojčane vrijednosti p i α međusobno se nadopunjuju do 1000 - potpun skup događaja: ili smo ispravno zaključili ili smo pogriješili. Ove razine nisu izračunate, one su postavljene. Razina značaja može se shvatiti kao neka vrsta "crvene" linije, čije će nam sjecište omogućiti da o ovom događaju govorimo kao o neslučajnom. U svakom kompetentnom znanstvenom izvješću ili publikaciji, izvedeni zaključci moraju biti popraćeni naznakom p ili α vrijednosti na kojima su zaključci doneseni.

Metode statističkog zaključivanja detaljno su obrađene u kolegiju "Matematička statistika". Za sada samo napominjemo da postavljaju određene zahtjeve na broj, odn veličina uzorka.

Nažalost, ne postoje stroge preporuke o preliminarnom određivanju potrebne veličine uzorka. Štoviše, odgovor na pitanje koliko ih je potrebno i dovoljno, istraživač uglavnom dobiva prekasno - tek nakon analize podataka već ispitanog uzorka. Međutim, mogu se formulirati najopćenitije preporuke:

1. Za razvoj dijagnostičke tehnike potrebna je najveća veličina uzorka - od 200 do 1000-2500 ljudi.

2. Ako je potrebno usporediti 2 uzorka, njihov ukupan broj mora biti najmanje 50 osoba; broj uspoređivanih uzoraka treba biti približno isti.

3. Ako se proučava odnos između bilo kojeg svojstva, tada bi veličina uzorka trebala biti najmanje 30-35 osoba.

4. Što više varijabilnost ispitivanog svojstva, to bi uzorak trebao biti veći. Dakle, varijabilnost se može smanjiti povećanjem homogenosti uzorka, npr. po spolu, dobi i sl. Time se, naravno, smanjuje mogućnost generaliziranja zaključaka.

Zavisni i nezavisni uzorci. Tipična istraživačka situacija je kada se svojstvo od interesa za istraživača proučava na dva ili više uzoraka u svrhu njihove daljnje usporedbe. Ovi uzorci mogu biti u različitim omjerima, ovisno o postupku njihove organizacije. Neovisni uzorci karakterizira činjenica da vjerojatnost odabira bilo kojeg subjekta jednog uzorka ne ovisi o odabiru bilo kojeg subjekta drugog uzorka. Protiv, zavisni uzorci karakterizirani su time da se svakom ispitaniku jednog uzorka po određenom kriteriju podudara ispitanik drugog uzorka.

U općem slučaju, ovisni uzorci uključuju parni odabir ispitanika u uspoređivanim uzorcima, a nezavisni uzorci - neovisni odabir ispitanika.

Treba napomenuti da slučajevi "djelomično ovisnih" (ili "djelomično neovisnih") uzoraka nisu dopušteni: to narušava njihovu reprezentativnost na nepredvidiv način.

Zaključno napominjemo da se mogu razlikovati dvije paradigme psiholoških istraživanja.

Takozvani R-metodologija uključuje proučavanje varijabilnosti određenog svojstva (psihološkog) pod utjecajem nekog utjecaja, čimbenika ili drugog svojstva. Uzorak je skup ispitanika.

Drugi pristup Q-metodologija, uključuje proučavanje varijabilnosti subjekta (pojedinca) pod utjecajem različitih podražaja (uvjeta, situacija itd.). Odgovara situaciji kada uzorak je skup podražaja.