إحدى ميزات مجموعة البيانات المهمة لتحديد ما إذا كانت تحتوي على أي قيم متطرفة. تعتبر القيم المتطرفة بديهية كقيم في مجموعتنا من البيانات التي تختلف اختلافًا كبيرًا عن غالبية البيانات المتبقية. بالطبع ، هذا الفهم للقيم المتطرفة غامض. لكي يتم اعتباره بعيدًا ، كم يجب أن تنحرف القيمة عن بقية البيانات؟ هل ما يسميه أحد الباحثين بآخر سيطابقه بآخر؟ من أجل توفير بعض الاتساق والتدبير الكمي لتحديد القيم المتطرفة ، نستخدم الأسوار الداخلية والخارجية.
للعثور على الأسوار الداخلية والخارجية لمجموعة من البيانات ، نحتاج أولاً إلى بعضها الآخر الإحصاء الوصفي. سنبدأ بحساب الأرباع. هذا سوف يؤدي إلى المدى الرباعي. وأخيرًا ، بعد هذه الحسابات ، سنتمكن من تحديد الأسوار الداخلية والخارجية.
الأرباع
ال الربع الأول والثالث هي جزء من ملخص خمسة أرقام من أي مجموعة من البيانات الكمية. نبدأ بإيجاد متوسط البيانات أو منتصفها بعد أن يتم سرد جميع القيم بترتيب تصاعدي. القيم أقل من المتوسط المقابل لنصف البيانات تقريبًا. نجد متوسط هذا النصف من مجموعة البيانات ، وهذا هو الربع الأول.
وبطريقة مماثلة ، نعتبر الآن النصف العلوي من مجموعة البيانات. إذا وجدنا متوسط هذا النصف من البيانات ، فسيكون لدينا الأرباع الثالثة. هذه الأرباع تحصل على اسمها من حقيقة أنها قسمت مجموعة البيانات إلى أربعة أجزاء متساوية الحجم ، أو أرباع. وبعبارة أخرى ، ما يقرب من 25 ٪ من جميع قيم البيانات أقل من الربع الأول. وبنفس الطريقة ، فإن 75٪ تقريبًا من قيم البيانات أقل من الربع الثالث.
النطاق الربيعي
نحتاج بعد ذلك لإيجاد النطاق الربيعي (IQR). هذا أسهل في الحساب من الربع الأول س1 والربع الثالث س3. كل ما علينا فعله هو أخذ الفرق بين هذين الرباعيين. هذا يعطينا الصيغة:
معدل الذكاء = س3 - س1
يخبرنا IQR عن مدى انتشار النصف الأوسط من مجموعة بياناتنا.
ابحث عن الأسوار الداخلية
يمكننا الآن العثور على الأسوار الداخلية. نبدأ بـ IQR ونضرب هذا الرقم في 1.5. ثم نطرح هذا الرقم من الربع الأول. نضيف هذا الرقم أيضًا إلى الربع الثالث. يشكل هذان الرقمان سياجنا الداخلي.
أوجد الأسوار الخارجية
بالنسبة للأسوار الخارجية ، نبدأ بـ IQR ونضرب هذا الرقم في 3. ثم نطرح هذا الرقم من الربع الأول ونضيفه إلى الربع الثالث. هذان الرقمان هما أسوارنا الخارجية.
كشف القيم الشاذة
كشف القيم المتطرفة أصبح الآن سهلاً مثل تحديد مكان تكمن قيم البيانات في الإشارة إلى سياجنا الداخلي والخارجي. إذا كانت قيمة البيانات المفردة أكثر تطرفًا من أي من أسوارنا الخارجية ، فإن هذا يكون بعيدًا ويشار إليه أحيانًا باسم الخارج القوي. إذا كانت قيمة بياناتنا بين السياج الداخلي والخارجي المقابل ، فإن هذه القيمة تكون مشبوهة أو خارجة معتدلة. سنرى كيف يعمل هذا مع المثال أدناه.
مثال
لنفترض أننا قمنا بحساب الربع الأول والثالث من بياناتنا ، ووجدنا هذه القيم إلى 50 و 60 على التوالي. النطاق الربعي IQR = 60-50 = 10. بعد ذلك ، نرى أن 1.5 x IQR = 15. هذا يعني أن الأسوار الداخلية تكون عند 50 - 15 = 35 و 60 + 15 = 75. هذا هو 1.5 x IQR أقل من الربع الأول ، وأكثر من الربع الثالث.
نحن نحسب الآن 3 x IQR ونرى أن هذا هو 3 × 10 = 30. الأسوار الخارجية هي 3 x IQR أكثر تطرفًا من الربع الأول والثالث. هذا يعني أن الأسوار الخارجية هي 50-30 = 20 و 60 + 30 = 90.
تعتبر أي قيم بيانات أقل من 20 أو أكبر من 90 قيمًا متطرفة. أي قيم بيانات تتراوح بين 29 و 35 أو بين 75 و 90 هي قيم متطرفة مشتبه بها.