Bootstrapping هو تقنية إحصائية تقع تحت العنوان الأوسع لإعادة التشكيل. تتضمن هذه التقنية إجراءً بسيطًا نسبيًا ولكن يتم تكراره مرات عديدة لدرجة أنه يعتمد بشكل كبير على حسابات الكمبيوتر. يوفر Bootstrapping طريقة أخرى غير فترات الثقة لتقدير معلمة المحتوى. يبدو أن Bootstrapping يعمل كثيرًا مثل السحر. تابع القراءة لمعرفة كيف تحصل على اسمها المثير للاهتمام.
شرح Bootstrapping
هدف واحد إحصائيات استدلالية هو تحديد قيمة معلمة المجتمع. عادةً ما يكون قياس ذلك بشكل مباشر باهظًا أو حتى مستحيلًا. لذلك نستخدم أخذ العينات الإحصائية. نأخذ عينة من السكان ونقيس إحصائية من هذه العينة ثم نستخدم هذه الإحصائية لنقول شيئًا عن المعلمة المقابلة من السكان.
على سبيل المثال ، في مصنع الشوكولاتة ، قد نرغب في التأكد من أن قطع الحلوى لها خصوصية تعني وزن. ليس من المجدي وزن كل قطعة حلوى يتم إنتاجها ، لذلك نستخدم تقنيات أخذ العينات لاختيار 100 قطعة حلوى بشكل عشوائي. نحن نحسب متوسط 100 قطعة حلوى ونقول أن متوسط عدد السكان يقع ضمن هامش الخطأ من متوسط العينة.
لنفترض أنه بعد بضعة أشهر نريد أن نعرف بدقة أكبر - أو أقل من أ هامش الخطأ
- ما هو الوزن الوسطي للحلوى في اليوم الذي اختبرنا فيه خط الإنتاج. لا يمكننا استخدام قطع الحلوى اليوم أيضًا العديد من المتغيرات دخلت الصورة (دفعات مختلفة من الحليب والسكر وحبوب الكاكاو وظروف جوية مختلفة وموظفين مختلفين على الخط وما إلى ذلك). كل ما لدينا من اليوم الذي نثير اهتمامنا فيه هو الأوزان المائة. بدون آلة الزمن مرة أخرى إلى ذلك اليوم ، يبدو أن الهامش الأولي للخطأ هو أفضل ما يمكن أن نأمله.لحسن الحظ ، يمكننا استخدام تقنية الحذاء. في هذه الحالة ، نحن بشكل عشوائي عينة مع الاستبدال من الأوزان المائة المعروفة. ثم نسمي هذا عينة تمهيد. نظرًا لأننا نسمح بالاستبدال ، فمن المرجح ألا تتطابق عينة التمهيد هذه مع العينة الأولية. قد يتم تكرار بعض نقاط البيانات ، وقد يتم حذف نقاط بيانات أخرى من المائة الأولية في عينة تمهيد. بمساعدة الكمبيوتر ، يمكن إنشاء آلاف عينات التمهيد في وقت قصير نسبيًا.
مثال
كما ذكرنا ، لاستخدام تقنيات Bootstrap حقًا ، نحتاج إلى استخدام الكمبيوتر. سيساعد المثال العددي التالي على توضيح كيفية عمل العملية. إذا بدأنا بالعينة 2 ، 4 ، 5 ، 6 ، 6 ، فإن كل ما يلي هي عينات تمهيد ممكنة:
- 2 ,5, 5, 6, 6
- 4, 5, 6, 6, 6
- 2, 2, 4, 5, 5
- 2, 2, 2, 4, 6
- 2, 2, 2, 2, 2
- 4,6, 6, 6, 6
تاريخ التقنية
تقنيات Bootstrap جديدة نسبيا في مجال الإحصاء. تم نشر الاستخدام الأول في ورقة 1979 برادلي إيفرون. نظرًا لزيادة قوة الحوسبة وأصبحت أقل تكلفة ، أصبحت تقنيات bootstrap أكثر انتشارًا.
لماذا الاسم Bootstrapping؟
يأتي اسم "bootstrapping" من العبارة ، "لرفع نفسه من خلال bootstraps له." هذا يشير إلى شيء مناف للعقل ومستحيل. حاول بأقصى ما تستطيع ، لا يمكنك رفع نفسك في الهواء عن طريق سحب قطع من الجلد على حذائك.
هناك بعض النظريات الرياضية التي تبرر تقنيات التمهيد. ومع ذلك ، يبدو أن استخدام bootstrapping يبدو أنك تفعل المستحيل. على الرغم من أنه لا يبدو أنك ستتمكن من تحسين تقدير إحصاء السكان عن طريق إعادة استخدام نفس العينة مرارًا وتكرارًا ، إلا أن الإقلاع يمكن أن يفعل ذلك في الواقع.