أخذ العينات الإحصائية يمكن القيام به في عدد من الطرق المختلفة. بالإضافة إلى نوع طريقة أخذ العينات التي نستخدمها ، هناك سؤال آخر يتعلق بما يحدث على وجه التحديد للفرد الذي اخترناه عشوائيًا. هذا السؤال الذي يطرح نفسه عندما يتم أخذ العينات ، "بعد أن نقوم باختيار فرد وتسجيل قياس السمة التي ندرسها ، ماذا نفعل مع الفرد؟"
هناك خياران:
- يمكننا استبدال الفرد مرة أخرى في المجموعة التي نقوم بأخذ عينات منها.
- يمكننا اختيار عدم استبدال الفرد.
يمكننا بسهولة أن نرى أن هذه تؤدي إلى حالتين مختلفتين. في الخيار الأول ، يترك الاستبدال مفتوحًا إمكانية اختيار الفرد عشوائيًا للمرة الثانية. بالنسبة للخيار الثاني ، إذا كنا نعمل بدون بديل ، فمن المستحيل اختيار نفس الشخص مرتين. سنرى أن هذا الاختلاف سيؤثر على حساب الاحتمالات المتعلقة بهذه العينات.
التأثير على الاحتمالات
لمعرفة كيفية تعاملنا مع الاستبدال يؤثر على حساب الاحتمالات ، خذ بعين الاعتبار سؤال المثال التالي. ما هو احتمال سحب اثنين من ارسالا ساحقا من سطح قياسي من البطاقات?
هذا السؤال غامض. ماذا يحدث بمجرد رسم البطاقة الأولى؟ هل نعيدها إلى السطح أم نتركها؟
نبدأ بحساب الاحتمال مع الاستبدال. هناك أربع أوراق و 52 ورقة ، وبالتالي فإن احتمال رسم الآس هو 4/52. إذا استبدلنا هذه البطاقة وسحبنا مرة أخرى ، يكون الاحتمال مرة أخرى 4/52. هذه الأحداث مستقلة ، لذلك نقوم بضرب الاحتمالات (4/52) × (4/52) = 1/169 ، أو حوالي 0.592٪.
سنقوم الآن بمقارنة هذا مع نفس الموقف ، باستثناء أننا لا نستبدل البطاقات. لا يزال احتمال رسم الآس في السحب الأول 4/52. بالنسبة للبطاقة الثانية ، نفترض أن الآس قد تم رسمه بالفعل. يجب علينا الآن حساب الاحتمال الشرطي. بمعنى آخر ، نحتاج إلى معرفة ما هو احتمال رسم الآس الثاني ، بالنظر إلى أن البطاقة الأولى هي أيضًا الآس.
هناك الآن ثلاثة ارسالا ساحقا من أصل ما مجموعه 51 بطاقة. وبالتالي فإن الاحتمال المشروط لآس الثانية بعد رسم الآس هو 3/51. احتمالية سحب اثنين من الآسات دون استبدال هي (4/52) × (3/51) = 1/221 ، أو حوالي 0.425٪.
نرى مباشرة من المشكلة أعلاه أن ما نختار القيام به مع الاستبدال له تأثير على قيم الاحتمالات. يمكن أن يغير كثيرا هذه القيم.
أحجام السكان
هناك بعض المواقف التي لا يؤدي فيها أخذ العينات مع أو بدون استبدال إلى تغيير كبير في أي احتمالات. لنفترض أننا نختار بشكل عشوائي شخصين من مدينة يبلغ عدد سكانها 50000 نسمة ، منهم 30000 من هؤلاء الأشخاص من الإناث.
إذا أخذنا عينات من الاستبدال ، فإن احتمال اختيار أنثى في الاختيار الأول يتم تقديمه من خلال 30000/50000 = 60٪. احتمال أنثى في الاختيار الثاني لا يزال 60 ٪. احتمال أن يكون كلا الشخصين أنثى هو 0.6 × 0.6 = 0.36.
إذا أخذنا العينات دون استبدال ، فإن الاحتمال الأول لن يتأثر. الاحتمال الثاني هو الآن 29999/49999 = 0.5999919998... ، وهو قريب جدًا من 60٪. احتمال أن يكون كلاهما أنثى 0.6 × 0.5999919998 = 0.359995.
الاحتمالات مختلفة من الناحية الفنية ، ومع ذلك ، فهي قريبة بما فيه الكفاية ليكون تمييزه تقريبا. لهذا السبب ، في كثير من الأحيان ، على الرغم من أننا نأخذ عينة دون بديل ، فإننا نتعامل مع اختيار كل فرد كما لو كان مستقلاً عن الأفراد الآخرين في العينة.
تطبيقات أخرى
هناك حالات أخرى نحتاج فيها إلى التفكير فيما إذا كان يجب أخذ عينات منها أو بدونها. على سبيل المثال هذا الحذاء. تقع هذه التقنية الإحصائية تحت عنوان تقنية إعادة التشكيل.
في bootstrapping نبدأ مع عينة إحصائية من السكان. نستخدم بعد ذلك برامج الكمبيوتر لحساب عينات التمهيد. بمعنى آخر ، يعيد الكمبيوتر اختبار الاستبدال من العينة الأولية.