أخذ العينات الإحصائية يستخدم في كثير من الأحيان في الإحصائيات. في هذه العملية ، نهدف إلى تحديد شيء ما حول السكان. نظرًا لأن المجموعات كبيرة الحجم عادةً ، فإننا نشكل عينة إحصائية عن طريق تحديد مجموعة فرعية من السكان ذات حجم محدد مسبقًا. من خلال دراسة العينة يمكننا استخدام إحصاءات استنتاجية لتحديد شيء ما عن السكان.
عينة إحصائية من الحجم ن ينطوي على مجموعة واحدة من ن الأفراد أو الموضوعات التي تم اختيارها عشوائيا من السكان. يرتبط توزيع العينات بشكل وثيق الصلة بمفهوم العينة الإحصائية.
أصل توزيعات أخذ العينات
يحدث توزيع أخذ العينات عندما نشكل أكثر من واحد عينة عشوائية بسيطة من نفس الحجم من مجتمع معين. تعتبر هذه العينات مستقلة عن بعضها البعض. لذا ، إذا كان الفرد في عينة واحدة ، فإن لديه نفس احتمالية وجوده في العينة التالية التي يتم أخذها.
نحسب إحصائية معينة لكل عينة. قد تكون هذه عينة تعنيأو تباين العينة أو نسبة العينة. نظرًا لأن الإحصاء يعتمد على العينة التي لدينا ، فستنتج كل عينة عادةً قيمة مختلفة لإحصائية الاهتمام. إن نطاق القيم التي تم إنتاجها هو ما يمنحنا توزيع العينات الخاص بنا.
توزيع العينات للوسائل
على سبيل المثال ، سننظر في توزيع العينات للمتوسط. متوسط المحتوى هو معلمة غير معروفة عادةً. إذا حددنا عينة بحجم 100 ، فسيتم حساب متوسط هذه العينة بسهولة عن طريق إضافة جميع القيم معًا ثم القسمة على إجمالي عدد نقاط البيانات ، في هذه الحالة ، 100. قد تعطينا عينة واحدة بحجم 100 متوسط 50. قد يكون لعينة أخرى متوسطها 49. 51 عينة أخرى يمكن أن يكون لها متوسط 50.5.
توزيع هذه العينات يعني يعطينا توزيع العينات. نود أن نفكر في أكثر من أربع وسائل نموذجية كما فعلنا أعلاه. مع وجود عدة عينات أخرى ، سيكون لدينا فكرة جيدة عن شكل توزيع العينات.
لماذا نهتم؟
قد يبدو توزيعات أخذ العينات مجردة إلى حد ما ونظريًا. ومع ذلك ، هناك بعض النتائج الهامة للغاية من استخدام هذه. واحدة من المزايا الرئيسية هي أننا نزيل التباين الموجود في الإحصائيات.
على سبيل المثال ، لنفترض أننا نبدأ بتعداد سكاني متوسط μ وانحراف معياري σ. يعطينا الانحراف المعياري قياسًا لمدى انتشار التوزيع. سنقوم بمقارنة ذلك بتوزيع العينات التي تم الحصول عليها من خلال تكوين عينات عشوائية بسيطة من الحجم ن. سيظل توزيع متوسط العينات له متوسط μ ، ولكن الانحراف المعياري مختلف. يصبح الانحراف المعياري لتوزيع العينات σ / √ ن.
وبالتالي لدينا ما يلي
- يسمح لنا حجم العينة البالغ 4 بتوزيع العينات مع انحراف معياري σ / 2.
- يسمح لنا حجم العينة البالغ 9 بتوزيع العينات مع انحراف معياري σ / 3.
- يسمح لنا حجم العينة البالغ 25 بتوزيع العينات مع انحراف معياري σ / 5.
- يسمح لنا حجم العينة البالغ 100 بتوزيع العينات مع انحراف معياري σ / 10.
في التمرين
في ممارسة الإحصائيات ، نادرًا ما نقوم بتوزيع توزيعات العينات. بدلاً من ذلك ، نتعامل مع الإحصاءات المستمدة من عينة عشوائية بسيطة من الحجم ن كما لو كانت نقطة واحدة على طول توزيع العينات المقابل. وهذا يؤكد مرة أخرى لماذا نرغب في الحصول على أحجام عينات كبيرة نسبيًا. كلما كان حجم العينة أكبر ، كلما قل الاختلاف الذي سنحصل عليه في إحصائياتنا.
لاحظ أنه ، بخلاف المركز والانتشار ، لا يمكننا قول أي شيء عن شكل توزيع العينات لدينا. اتضح أنه في ظل بعض الظروف الواسعة إلى حد ما ، فإن نظرية الحد المركزي يمكن تطبيقه ليخبرنا بشيء مذهل للغاية حول شكل توزيع العينات.