في كثير من الأحيان ، يريد الباحثون معرفة الإجابات عن الأسئلة ذات النطاق الكبير. فمثلا:
- ماذا شاهد الجميع في بلد معين على شاشات التلفزيون الليلة الماضية؟
- من يفعل الناخبين تنوي التصويت ل في الانتخابات المقبلة؟
- كم من الطيور تعود من الهجرة في مكان معين؟
- ما هي نسبة القوى العاملة العاطلة عن العمل؟
هذه الأنواع من الأسئلة ضخمة بمعنى أنها تتطلب منا تتبع ملايين الأفراد.
تعمل الإحصائيات على تبسيط هذه المشكلات باستخدام تقنية تسمى أخذ العينات. من خلال إجراء عينة إحصائية ، يمكن تقليل عبء العمل لدينا بشكل كبير. بدلاً من تتبع سلوك المليارات أو الملايين ، نحتاج فقط إلى فحص سلوكات الآلاف أو المئات. كما سنرى ، هذا التبسيط يأتي بسعر.
السكان والتعدادات
سكان الدراسة الإحصائية هو ما نحاول اكتشاف شيء عنه. يتكون من جميع الأفراد الذين يتم فحصهم. يمكن أن يكون السكان أي شيء حقًا. يمكن اعتبار كل من كاليفورنيا ، مثل caribous ، وأجهزة الكمبيوتر ، والسيارات ، أو المقاطعات سكانًا ، وفقًا للسؤال الإحصائي. على الرغم من أن معظم السكان الذين يجري بحثهم كبيرون ، فلا يجب أن يكونوا بالضرورة.
تتمثل إحدى الإستراتيجيات للبحث في السكان في إجراء التعداد السكاني. في التعداد ، ندرس كل فرد من السكان في دراستنا. والمثال الرئيسي لهذا هو
تعداد الولايات المتحدة. كل عشر سنوات ، يرسل مكتب الإحصاء استبيانًا للجميع في البلاد. يتم زيارة أولئك الذين لا يعودون النموذج من قبل العاملين في التعدادالتعدادات محفوفة بالمصاعب. أنها عادة ما تكون مكلفة من حيث الوقت والموارد. بالإضافة إلى ذلك ، من الصعب ضمان الوصول إلى جميع السكان. السكان الآخرين أكثر صعوبة لإجراء التعداد السكاني. إذا أردنا أن ندرس عادات الكلاب الضالة في ولاية نيويورك ، فلنستمتع بالتوفيق الكل من تلك الأنياب عابرة.
عينات
نظرًا لأنه من المستحيل أو غير العملي عادةً تعقب كل فرد من السكان ، فإن الخيار التالي المتاح هو أخذ عينات من السكان. العينة هي أي مجموعة فرعية من السكان ، لذلك يمكن أن يكون حجمها صغيرًا أو كبيرًا. نريد أن تكون عينة صغيرة بما يكفي للإدارة من خلال قوتنا الحاسوبية ، لكنها كبيرة بما يكفي لمنحنا نتائج ذات دلالة إحصائية.
إذا كانت إحدى شركات الاقتراع تحاول تحديد مدى رضا الناخبين عن الكونغرس و حجم العينة هو واحد ، ثم النتائج ستكون بلا معنى (ولكن من السهل الحصول عليها). من ناحية أخرى ، فإن سؤال الملايين من الناس سوف يستهلك الكثير من الموارد. لتحقيق التوازن ، عادة ما يكون لاستطلاعات الرأي من هذا النوع أحجام عينة تبلغ حوالي 1000.
عينات عشوائية
لكن الحصول على حجم العينة الصحيح لا يكفي لضمان نتائج جيدة. نريد عينة تمثل السكان. لنفترض أننا نريد معرفة عدد الكتب التي يقرأها الأمريكي العادي سنويًا. نطلب من 2000 طالب جامعي متابعة ما قرأوه على مدار العام ، ثم التحقق مرة أخرى معهم بعد مرور عام. نجد أن متوسط عدد الكتب المقروءة هو 12 ، ومن ثم نستنتج أن المتوسط الأمريكي يقرأ 12 كتابًا سنويًا.
المشكلة في هذا السيناريو هي في العينة. تتراوح أعمار غالبية طلاب الجامعات بين 18 و 25 عامًا ويطلب منهم من قبل مدرسيهم قراءة الكتب المدرسية والروايات. هذا هو التمثيل السيئ للشخص الأمريكي العادي. تحتوي العينة الجيدة على أشخاص من مختلف الأعمار ومن جميع مناحي الحياة ومن مناطق مختلفة من البلد. للحصول على مثل هذه العينة ، نحتاج إلى إعدادها بشكل عشوائي بحيث يكون لكل أمريكي احتمال متساوٍ في أن يكون في العينة.
أنواع العينات
المعيار الذهبي للتجارب الإحصائية هو عينة عشوائية بسيطة. في مثل هذه العينة من الحجم ن الأفراد ، كل فرد من السكان لديه نفس الاحتمال في أن يتم اختيارهم للعينة ، وكل مجموعة من ن الأفراد لديهم نفس احتمال أن يتم اختيارهم. هناك مجموعة متنوعة من الطرق لأخذ عينات من السكان. بعض الأكثر شيوعا هي:
- عينة عشوائية
- عينة عشوائية بسيطة
- عينة استجابة طوعية
- عينة مقبولة
- عينة منهجية
- عينة الكتلة
- عينة طبقية
بعض كلمات المشورة
كما يقول المثل ، "لقد بدأ حسنا نصف عمله." للتأكد من أن دراساتنا وتجاربنا الإحصائية لها نتائج جيدة ، نحتاج إلى التخطيط والبدء فيها بعناية. من السهل التوصل إلى عينات إحصائية سيئة. جيد عينات عشوائية بسيطة تتطلب بعض العمل للحصول عليها. إذا تم الحصول على بياناتنا بشكل عشوائي وبأسلوب متعجرف ، فبغض النظر عن مدى تعقيد تحليلنا ، فإن التقنيات الإحصائية لن تقدم لنا أي استنتاجات جديرة بالاهتمام.