مثال على Bootstrapping في الإحصائيات

التمهيد هي تقنية إحصائية قوية. يفيد بشكل خاص عندما عينة الحجم الذي نعمل معه صغير. في ظل الظروف المعتادة ، لا يمكن التعامل مع أحجام العينات التي تقل عن 40 عن طريق افتراض التوزيع الطبيعي أو أ ر التوزيع. تعمل تقنيات Bootstrap بشكل جيد مع العينات التي تحتوي على أقل من 40 عنصرًا. والسبب في ذلك هو أن bootstrapping يتضمن إعادة التشكيل. هذه الأنواع من التقنيات تفترض شيئا عن توزيع من بياناتنا.

أصبح Bootstrapping أكثر شيوعًا حيث أصبحت موارد الحوسبة متاحة بسهولة أكبر. هذا لأنه من أجل أن يكون الإقلاع عمليًا يجب استخدام الكمبيوتر. سنرى كيف يعمل هذا في المثال التالي للتمهيد.

نبدأ بـ عينة إحصائية من مجتمع لا نعرف عنه شيئًا. سيكون هدفنا هو فاصل ثقة بنسبة 90٪ حول متوسط العينة. على الرغم من أن الأساليب الإحصائية الأخرى المستخدمة لتحديد فترات الثقة نفترض أننا نعرف المتوسط أو الانحراف المعياري لسكاننا ، ولا يتطلب التمهيد التمهيد أي شيء آخر غير العينة.

لأغراض المثال الخاص بنا ، سنفترض أن العينة هي 1 ، 2 ، 4 ، 4 ، 10.

نعيد الآن تشكيل عينة مع الاستبدال من نموذجنا لتشكيل ما يعرف باسم عينات التمهيد. سيكون لكل عينة تمهيد حجم خمسة ، تمامًا مثل العينة الأصلية. نظرًا لأننا نختار عشوائيًا ثم نستبدل كل قيمة ، فقد تختلف عينات bootstrap عن العينة الأصلية وعن بعضها البعض.

instagram viewer

بالنسبة إلى الأمثلة التي قد نواجهها في العالم الحقيقي ، سنفعل ذلك بإعادة تشكيل مئات إن لم يكن آلاف المرات. في ما يلي أدناه ، سنرى مثالًا على 20 عينة تمهيد:

نظرًا لأننا نستخدم Bootstrapping لحساب فترة الثقة لمتوسط المحتوى ، فإننا نحسب الآن وسائل كل من عينات Bootstrap. هذه الوسائل مرتبة بترتيب تصاعدي هي: 2 ، 2.4 ، 2.6 ، 2.6 ، 2.8 ، 3 ، 3 ، 3.2 ، 3.4 ، 3.6 ، 3.8 ، 4 ، 4 ، 4.2 ، 4.6 ، 5.2 ، 6 ، 6 ، 6.6 ، 7.6.

نحصل الآن من قائمة عينات التمهيد لدينا يعني فاصل الثقة. نظرًا لأننا نريد فاصل ثقة بنسبة 90٪ ، فإننا نستخدم المئين 95 و 5 كنقاط نهاية للفترات. والسبب في ذلك هو أنه تم تقسيم 100٪ - 90٪ = 10٪ إلى النصف بحيث يكون لدينا الوسط 90٪ من جميع وسائل عينة التمهيد.