في كثير من الأحيان عندما ندرس مجموعة ، نقوم بالفعل بمقارنة مجموعتين من السكان. اعتمادا على معامل هذه المجموعة التي نحن مهتمون بها والظروف التي نتعامل معها ، هناك العديد من التقنيات المتاحة. إحصائي الإستنباط لا يمكن عادة تطبيق الإجراءات التي تتعلق بمقارنة مجموعتين من السكان على ثلاثة أو أكثر من السكان. لدراسة أكثر من مجتمعين في وقت واحد ، نحتاج إلى أنواع مختلفة من الأدوات الإحصائية. تحليل التباين، أو ANOVA ، هي تقنية من التدخل الإحصائي تسمح لنا بالتعامل مع العديد من السكان.
مقارنة الوسائل
لمعرفة المشاكل التي تنشأ ولماذا نحتاج إلى ANOVA ، سننظر في مثال. لنفترض أننا نحاول تحديد ما إذا كان تعني تختلف أوزان حلوى M&M الخضراء والحمراء والزرقاء والبرتقالية عن بعضها البعض. سنذكر متوسط الأوزان لكل من هؤلاء السكان ، μ1, μ2, μ3 μ4 وعلى التوالي. قد نستخدم المناسبة اختبار الفرضية عدة مرات ، واختبار C (4،2) ، أو ستة مختلفة فرضيات فارغة:
- ح0: μ1 = μ2 للتحقق مما إذا كان متوسط وزن مجموعة الحلوى الحمراء مختلفًا عن متوسط وزن مجموعة الحلوى الزرقاء.
- ح0: μ2 = μ3 لمعرفة ما إذا كان متوسط وزن مجموعة الحلوى الزرقاء يختلف عن متوسط وزن مجموعة الحلوى الخضراء.
- ح0: μ3 = μ4 للتحقق مما إذا كان متوسط وزن مجموعة الحلوى الخضراء يختلف عن متوسط وزن مجموعة حلوى البرتقال.
- ح0: μ4 = μ1 لمعرفة ما إذا كان متوسط وزن مجموعة حلوى البرتقال يختلف عن متوسط وزن مجموعة الحلوى الحمراء.
- ح0: μ1 = μ3 للتحقق مما إذا كان متوسط وزن مجموعة الحلوى الحمراء يختلف عن متوسط وزن مجموعة الحلوى الخضراء.
- ح0: μ2 = μ4 للتحقق مما إذا كان متوسط وزن الحلوى الزرقاء يختلف عن متوسط وزن الحلوى البرتقالية.
هناك العديد من المشاكل في هذا النوع من التحليل. سيكون لدينا ستة ص-القيم. على الرغم من أننا قد نختبر كل منها بنسبة 95٪ مستوى الثقة، ثقتنا في العملية الكلية أقل من ذلك لأن الاحتمالات تتضاعف: .95 × .95 × .95 × .95 × .95 × .95 تقريبًا .74 ، أو مستوى 74٪ من الثقة. وبالتالي ازداد احتمال حدوث خطأ من النوع الأول.
على مستوى أكثر جوهرية ، لا يمكننا مقارنة هذه المعلمات الأربع ككل بمقارنتها مع اثنين في وقت واحد. قد تكون وسائل M & M الأحمر والأزرق كبيرة ، حيث يكون متوسط وزن اللون الأحمر أكبر نسبيًا من متوسط وزن اللون الأزرق. ومع ذلك ، عندما نفكر في الأوزان المتوسطة لجميع أنواع الحلوى الأربعة ، فقد لا يكون هناك فرق كبير.
تحليل التباين
للتعامل مع المواقف التي نحتاج فيها لإجراء مقارنات متعددة نستخدم ANOVA. يتيح لنا هذا الاختبار النظر في معايير العديد من السكان في وقت واحد ، دون الدخول في بعض المشاكل التي تواجهنا إجراء اختبارات الفرضيات على معلمتين في كل مرة.
لإجراء ANOVA مع مثال M&M أعلاه ، سنقوم باختبار الفرضية الصفرية H0:μ1 = μ2 = μ3= μ4. هذا يشير إلى أنه لا يوجد فرق بين متوسط أوزان M & MS الأحمر والأزرق والأخضر. الفرضية البديلة هي أن هناك بعض الاختلاف بين متوسط أوزان M & MS الأحمر والأزرق والأخضر والبرتقالي. هذه الفرضية هي مزيج من عدة عبارات حأ:
- الوزن الوسطي لمجموعات الحلوى الحمراء لا يساوي الوزن المتوسط لمجموعات الحلوى الزرقاء OR
- الوزن الوسطي لمجموعات الحلوى الزرقاء لا يساوي متوسط وزن مجموعة الحلوى الخضراء OR
- الوزن الوسطي لمجموعات الحلوى الخضراء لا يساوي الوزن المتوسط لمجموعات الحلوى البرتقالية OR
- الوزن الوسطي لمجموعات الحلوى الخضراء لا يساوي متوسط وزن مجموعة الحلوى الحمراء OR
- الوزن الوسطي لمجموعات الحلوى الزرقاء لا يساوي الوزن المتوسط لمجموعات الحلوى البرتقالية OR
- الوزن الوسطي لمجموعات الحلوى الزرقاء لا يساوي الوزن المتوسط لمجموعات الحلوى الحمراء.
في هذه الحالة بالذات ، من أجل الحصول على القيمة الاحتمالية ، سنستخدم a توزيع الاحتمالات معروف ب توزيع F. يمكن إجراء الحسابات التي تنطوي على اختبار ANOVA F يدويًا ، ولكن عادةً ما يتم حسابها باستخدام برنامج إحصائي.
مقارنات متعددة
ما يفصل ANOVA عن التقنيات الإحصائية الأخرى هو أنه يستخدم لإجراء مقارنات متعددة. هذا أمر شائع في جميع الإحصاءات ، حيث أننا نرغب في مقارنة أكثر من مجموعتين من المرات. عادةً ما يشير الاختبار العام إلى وجود نوع من الاختلاف بين المعلمات التي ندرسها. ثم نتبع هذا الاختبار مع بعض التحليلات الأخرى لتحديد أي معلمة تختلف.