Meniu Închide

Cum facem corect o eșantionare

Pentru că adesea ne sunt oferite, fără explicații, în presă și pe Facebook, felurite rezultate ale unor diverse sondaje de opinie și statistici care ne interesează, dar în metoda și concluziile cărora nu suntem siguri că putem avea încredere, este util să cunoaștem unele aspecte esențiale ale cercetării, pentru a ne face o părere informată despre cifrele pe care le primim.

Un astfel de aspect esențial este eșantionarea și, subsecvent, reprezentativitatea unui eșantion. Pentru că, în mod surprinzător, nu este nevoie să includem toată populația vizată într-o cercetare, ci doar o parte, parte care se numește eșantion. Dacă numărul de oameni necesari pentru o cercetare este calculat corespunzător, rezultatele sunt relevante și ne putem baza pe ele.

Ce este eșantionarea?

În cazul sondajelor de opinie, eșantionarea este o procedură prin care se determină, în vederea desfășurării unei activități de cercetare, un număr specific de subiecți dintr-un grup mai mare de persoane care au în comun anumite caracteristici.

Grupul poate fi unul restrâns (de exemplu, clasa a VII-a B dintr-o școală, caracteristica comună fiind apartenența la clasa respectivă) sau poate avea un număr foarte mare de persoane (de exemplu, toți elevii de clasa a VII-a din România, ale căror caracteristici comune sunt: țara în care sunt elevi și anul de studiu).

Eșantionarea se face prin metode validate științific și are scopul de a obține rezultate relevante statistic pentru grupul cercetat, fără a recurge la activitatea laborioasă, costisitoare și adesea imposibilă de a aborda toți membrii grupului.

Este simplu să întrebăm toți elevii dintr-o clasă când preferă să meargă într-o excursie, iar răspunsurile lor sunt în mod evident relevante pentru clasa respectivă (și doar pentru clasa respectivă), dar, pentru a afla părerea tuturor elevilor din țară legat de perioada perfectă pentru organizarea de excursii școlare, trebuie eșantionare.

Costuri reduse, concluzii corecte

Unul dintre aspectele importante ale eșantionării este determinarea corectă a numărului de persoane necesar.

Dacă eșantionul este prea mic raportat la populația cercetată, rezultatele pot prezenta anomalii și pot oferi o imagine trunchiată sau chiar eronată asupra subiectului cercetării. Dacă eșantionul este prea mare, cercetarea devine mult prea costisitoare.

Așa că, pentru a reduce costurile de cercetare și pentru a păstra, în același timp, relevanța rezultatelor, au fost determinate științific metode de calcul pentru a afla numărul de persoane necesar pentru un eșantion corect, raportat la populația cercetată.

Cum se determină numărul de persoane dintr-un eșantion?

Pentru cei care nu doresc să se apuce de calcule, este disponibil un calculator automat, aici: https://www.calculator.net/sample-size-calculator.html; pentru cei care vor să înțeleagă exact cum se face acest calcul, iată, mai jos, formula completă, care ține cont de:

dimensiunea populației care face obiectul cercetării, adică numărul total de persoane despre care vrem să aflăm anumite aspecte.

De exemplu, numărul de elevi din România în anul școlar 2020-2021

marja de eroare, adică posibilitatea de eroare admisibilă, exprimată procentual (5%, adică 0.05; 3%, adică 0.03 ș.a.), care se ia astfel în calcul, și care indică *intervalul* de încredere.

*nivelul* de încredere (diferit de *intervalul* de încredere), care primește un scor Z, adică o valoare critică a distribuției normale la nivelul de încredere necesar, scor care nu mai trebuie calculat, pentru că este disponibil în trusa de lucru a statisticianului într-un tabel.

De exemplu, pentru un nivel de încredere de 90%, scorul Z este de 1.645, pentru 95% – 1.96, pentru 99% – 2.576 etc.

deviația standard, un aspect ceva mai tehnic, care anticipează cam cât de diferite vor fi răspunsurile primite față de medie.

O deviație standard de 0.5 este folosită în general.

Formule

n = N * { [Z²*p*(1-p)/e²] / {N–1+[Z²*p*(1-p)/e²]} }

N = dimensiunea populației

Z = scorul Z corespunzător nivelului de încredere

p = deviația standard

e = marja de eroare

n = eșantionul

Notă importantă!! 

Pentru simplificarea calcului și deoarece diferența la rezultat este foarte mică, nesemnificativă,
pentru toate populațiile care depășesc 100,000 de persoane, eșantionul se poate calcula folosind
N = 100,000, și nu numărul exact.

Formula poate părea copleșitoare, dar această parte se repetă: Z²*p*(1-p)/e² și poate fi calculată prima, pentru simplificare. Datorită diferențelor mici între numărul obținut așa și cel calculat cu formula completă, adesea se folosește doar această parte a formulei pentru o determinare rapidă a eșantionului necesar, mai ales în cazurile în care nu se cunoaște dimensiunea populației, dar se știe că este mai mare de 100,000.

Așadar, dacă o denumim n1, această parte importantă din formula completă devine:

n1 = Z²*p*(1-p)/e²,

iar formula completă devine astfel:

n = N*[n1/(N–1+n1)]

Exemplu

Pentru determinarea dimensiunii eșantionului necesar pentru o populație de 2,800,000 de elevi (numărul de elevi români în anul școlar 2020-2021, conform B1.ro: https://www.b1.ro/stiri/social/anul-scolar-2020-2021-cati-elevi-are-in-total-romania-343038.html), cu marjă de eroare de 3%, se face următorul calcul:

n = 100,000 * { [1.96²*0.5*(1-0.5)/0.03²] / {100,000–1+[1.96²*0.5*(1-0.5)/0.03²]} }

n1 = 1.96²*0.5*(1-0.5)/0.03² = 1067.11;

Putem folosi acest număr ca eșantion sau putem calcula în continuare:

n = 100,000 * { 1067.11 / {100,000–1+1067.11} }

n = 1055.85, adică (rotunjit) 1056 de persoane

Dacă se calculează
folosind N = 1.800.000, rezultatul este 1067, adică 11 persoane în plus în eșantionul calculat prin formula completă la 100,000 și, întâmplător în acest caz, exact eșantionul calculat prin varianta simplificată

În încheiere, este de notat că, pentru cercetări pe populații mai mari de 100,000 de persoane, la marje de eroare de 3% sunt reprezentative eșantioane mici, 1067 de persoane (1,067%) fiind suficiente pentru a oferi o concluzie relevantă statistic cercetătorilor.

În cazul populațiilor reduse numeric, eșantioanele corect determinate sunt proporțional mai mari față de cele necesare pentru studierea populațiilor numeroase.

De exemplu:

Pentru o populație de 1000 de persoane, pentru o marjă de eroare de 5%, eșantionul necesar este de 278 de persoane (27.8%); la o populație de 500 de persoane, pentru o marjă de eroare de 5%, eșantionul necesar este de 218 de persoane (43,6%).

Alina Voinea

Articol disponibil și pe site-ul parintiicerschimbare.ro