
במאמר זה, המהווה חלק מסדרת מאמרים בנושא מקצוע הסקרים (ראו קישורים בתחתית העמוד), אענה על שאלות הנוגעות למונח הסטטיסטי "מדגם", ועל הקשר שלו לסקרים.
מהו "מדגם"? מהו גודל מדגם "טוב" ואיך קובעים את גודל המדגם הרצוי?, האם עדיף מדגם גדול או מדגם קטן?, ומהם היתרונות והחסרונות של כל אפשרות. בנוסף אסביר מהו המקור לבחירה של 500 איש כמדגם מייצג של האוכלוסיה בישראל, ומתי ניתן (או צריך) לחרוג מהגדרה זו.
מהו מדגם?
כאשר אנו מעוניינים לקבל מידע ולהסיק מסקנות על אוכלוסייה מסוימת, ישנן שתי אפשרויות: האחת היא לפנות לכל האוכלוסיה והאפשרות השנייה היא פנייה למדגם.
מתי פונים לכל האוכלוסיה? בעיקר כשמדובר באוכלוסיה קטנה יחסית, לדוגמה: אם אני חברה שנותנת שירותים ל-100 לקוחות, ומעוניינת לבחון את שביעות רצונם של הלקוחות, אני אבחר בפנייה לכל הלקוחות. זה מאפשר לי לדעת מה כל לקוח חושב, לטפל במקרים נקודתיים, ולפנייה אישית יש גם ערך "שיווקי" - שמירה על קשר בלתי אמצעי, ומסר של "אכפת לי ממה שאתה חושב". ישנם מקרים מיוחדים נוספים בהם גם פונים לאוכלוסיות גדולות מאוד, לדוגמה ב"מפקד אוכלוסין" שעורכת הלשכה המרכזית לסטטיסטיקה פעם בכ-10 שנים לערך (מתוקף חוק מדינה).
מה קורה כאשר המשאבים מוגבלים, אבל מעניינת אותנו עמדתו של ציבור גדול?
נשתמש במדגם: כשמו כן הוא – דגימה של חלק מהאוכלוסיה. מן הסתם, כאשר אנו מבצעים דגימה, רמת הדיוק פוחתת במידת מה (כי פנינו רק לחלק מהאוכלוסיה), ולכן לאחר ביצוע דגימה, נשתמש בכלים סטטיסטיים לצורך הערכת מידת השגיאה שבין תוצאות הסקר לבין תוצאות האמת.
לא אסביר מהו מדגם מייצג ואילו שיטות דגימה קיימות כדי לשמור על ייצוגו של המדגם, משום שנושאים אלו הוסברו בפירוט במאמר "סקרים - שאלות ותשובות". בקווים כלליים אציין שעלינו לוודא שכל חלק מהאוכלוסיה (או תת-אוכלוסייה) מיוצג באופן יחסי בהתאם לגודלו באוכלוסיה הכללית.
אז איך קובעים את גודל המדגם?
ראשית נסביר בקצרה שני מושגים הקשורים ביניהם:
המושג הראשון הוא רווח בר סמך: רווח בר סמך נמדד באחוזים, ומשמעותו בשפה פשוטה היא "הדירות הניסוי", כלומר ברווח בר סמך של 95%, אם נחזור על הניסוי 100 פעמים (כל פעם עם מדגם חדש), ב-95 מהניסויים אנחנו צפויים לקבל תוצאות דומות ולהסיק את אותן המסקנות (למען הדיוק, נקבל תוצאות שנמצאות בתוך התחום של מרווח הטעות שמיד נסביר את משמעותו). רווח בר סמך של 95% מקובל ברוב הסקרים בהם נדרשת דגימה (לעיתים ברפואה מחמירים ומשתמשים ברווח בר סמך של 99%).
מרווח הטעות הוא אחוז הטעות המירבי שעשוי להיות בתוצאות הסקר. לדוגמה אם מרווח הטעות הוא 5% ±, ו-50% מהמשיבים בסקר ציינו העדפה למוצר מסוים, אז באוכלוסיה כולה, העדפה זו תנוע בין 45%-55% (אבל לא מחוץ לטווח הזה).
ניתן לפשט זאת כך: במתח שבין מדגם גדול ויקר (עלויות גבוהות ורמת דיוק גבוהה) לבין מדגם קטן וזול (עלויות נמוכות ורמת דיוק נמוכה), צריך לבחור גודל מדגם מיטבי: כלומר המדגם הקטן ביותר שעונה על הצורך שלשמו אנחנו מבצעים את הסקר.
אם הסקר נועד להשוות בין תתי-קבוצות בתוך האוכלוסיה, אז נצטרך להגדיל את המדגם בשביל שכל תת-קבוצה תיוצג כהלכה. אם אנחנו לא מעוניינים בהשוואה בין תתי קבוצות אלא רק "בנצ'מרק" (הערכת המצב) בקרב כלל האוכלוסיה, אז ניתן להסתפק במדגם קטן יותר. לפני תחילת סקר, אנחנו מבררים מול הלקוח האם נדרשות השוואות מסוימות בין תתי אוכלוסיות, ובאיזו שגיאת דגימה מרבית ניתן להסתפק, ובהתבסס על הצורך שהלקוח מציין אנו ממליצים על גודל המדגם, שיטת הדגימה וכן הלאה.
אתם בטח שואלים את עצמכם, למה בסקרים ארציים נהוג לדגום 500 משיבים. ככלל אצבע 500 משיבים מביאים לשגיאת הערכה של עד 4.4% ±. כמובן שייתכן שהשגיאה בפועל תהיה נמוכה מכך (ואותה ניתן להעריך יותר במדיוק כאשר מסיימים את איסוף הנתונים). שגיאה זו נחשבת קבילה במרבית המקרים, ולכן נהוג להסתפק בגודל מדגם כזה.
כדי להעריך מהו גודל המדגם הרצוי או להעריך מראש את השגיאה המירבית, ניתן להיעזר במחשבון גודל מדגם (שמחשב מה צריך להיות גודל המדגם כתלות בפרמטרים: גודל האוכלוסיה ושגיאה מירבית רצויה), או במחשבון מרווח טעות (שמחשב מהי השגיאה המרבית הצפויה כתלות בפרמטרים גודל האוכלוסיה וגודל המדגם).
בנוסף, ניתן גם להיעזר בתרשים הבא. כל קו מייצג גודל מדגם שונה, ציר ה-X מייצג את גודל האוכלוסיה שאותה אנחנו רוצים לייצג, וציר ה-Y את מרווח הטעות הצפוי (הכל ברווח בר סמך של 95%). התרשים מתייחס לגודל מדגם בהנחה שאין צורך בהשוואה בין תתי-קבוצות באוכלוסיה.
![]() |
הכותב הינו מנהל מחלקת חקר הביצועים במכון שריד, תלמיד מחקר (דוקטורנט) באוניברסיטת תל-אביב במחלקה להנדסת תעשייה, בעל תואר שני בחקר ביצועים וסטטיסטיקה מטעם אוניברסיטת תל אביב, ותואר ראשון במתמטיקה עם סטטיסטיקה וחקר ביצועים מטעם הטכניון. בעל ניסיון עתיר בביצוע מחקרים סטטיסטיים ומחקרי חקר ביצועים. |
מכון שריד - שרותי מחקר והדרכה בע"מ. משרד ראשי: שד' משה שרת 33, קרית חיים (חיפה). טלפון 04-8413030 (רב קוי). פקס 04-8422016. סניף רמת גן ברחוב אבא הלל סילבר 12 (בית איילון): 03-3751375.
נשמח לעמוד לשירותך. מדיניות הפרטיות לחברים בפאנל IASQ, מדיניות הפרטיות למחקרים (כולל GDPR) - אנגלית.