كيفية تقدير الانحرافات المعيارية (SD)

click fraud protection

الانحراف المعياري والمدى كلاهما يقيسان انتشار مجموعة البيانات. يخبرنا كل رقم بطريقته الخاصة عن مدى تباعد البيانات ، حيث إنهما مقياسان للاختلاف. رغم عدم وجود علاقة واضحة بين مجموعة والانحراف المعياري، هناك بحكم التجربة التي يمكن أن تكون مفيدة لربط هذه الإحصاءات اثنين. يشار إلى هذه العلاقة أحيانًا باسم قاعدة النطاق للانحراف المعياري.

تخبرنا قاعدة النطاق أن الانحراف المعياري للعينة يساوي تقريبًا ربع نطاق البيانات. بعبارات أخرىس = (الحد الأقصى - الحد الأدنى) / 4. هذه صيغة واضحة جدًا للاستخدام ، ويجب استخدامها فقط كصيغة خشنة للغاية تقدير الانحراف المعياري.

مثال

لمعرفة مثال على كيفية عمل قاعدة النطاق ، سننظر في المثال التالي. لنفترض أننا نبدأ بقيم بيانات 12 و 12 و 14 و 15 و 16 و 18 و 18 و 20 و 20 و 25. هذه القيم لها تعني من 17 والانحراف المعياري لحوالي 4.1. إذا بدلاً من ذلك ، قمنا أولاً بحساب نطاق بياناتنا كـ 25 - 12 = 13 ثم قسّم هذا الرقم على أربعة لدينا تقديرنا للانحراف المعياري كـ 13/4 = 3.25. هذا الرقم قريب نسبياً من الانحراف المعياري الحقيقي وجيد لتقدير تقريبي.

لماذا يعمل؟

قد يبدو أن قاعدة النطاق غريبة بعض الشيء. لماذا تعمل؟ ألا يبدو الأمر تعسفيا تماما لتقسيم النطاق على أربعة فقط؟ لماذا لا نقسم على عدد مختلف؟ في الواقع هناك بعض التبريرات الرياضية التي تجري وراء الكواليس.

instagram viewer

أذكر خصائص منحنى الجرس والاحتمالات من أ التوزيع القياسي. تتعلق إحدى الميزات بكمية البيانات التي تقع ضمن عدد معين من الانحرافات المعيارية:

  • يوجد حوالي 68٪ من البيانات ضمن انحراف معياري واحد (أعلى أو أقل) عن الوسط.
  • يوجد حوالي 95٪ من البيانات ضمن انحرافين معياريين (أعلى أو أقل) عن الوسط.
  • حوالي 99٪ يقع ضمن ثلاثة انحرافات معيارية (أعلى أو أقل) عن الوسط.

الرقم الذي سوف نستخدمه له علاقة بـ 95٪. يمكننا أن نقول أن 95 ٪ من اثنين من الانحرافات المعيارية أقل من المتوسط ​​إلى اثنين من الانحرافات القياسية فوق المتوسط ​​، لدينا 95 ٪ من البيانات لدينا. وبالتالي ، فإن كل توزيعنا الطبيعي قد يمتد على جزء خط يبلغ طوله أربعة انحرافات قياسية.

لا يتم توزيع جميع البيانات عادة وشكل منحنى الجرس. لكن معظم البيانات تتصرف جيدًا بما يكفي بحيث يؤدي انحرافان معياريان عن الوسط إلى التقاط جميع البيانات تقريبًا. نقدر ونقول أن الانحرافات المعيارية الأربعة تقارب حجم النطاق ، وبالتالي فإن النطاق المقسوم على أربعة هو تقريب تقريبي للانحراف المعياري.

يستخدم لقاعدة المدى

قاعدة النطاق مفيدة في عدد من الإعدادات. أولاً ، إنه تقدير سريع جدًا للانحراف المعياري. يتطلب الانحراف المعياري العثور على الوسط أولاً ، ثم طرح هذا المتوسط ​​من كل نقطة بيانات ، مربعة الاختلافات ، إضافة هذه ، قسمة على واحد أقل من عدد نقاط البيانات ، ثم (في النهاية) تأخذ مربع جذر. من ناحية أخرى ، تتطلب قاعدة النطاق فقط طرحًا واحدًا وقسمًا واحدًا.

الأماكن الأخرى التي تكون فيها قاعدة النطاق مفيدة عندما يكون لدينا معلومات غير كاملة. تتطلب الصيغ مثل تحديد حجم العينة ثلاثة أجزاء من المعلومات: المطلوب هامش الخطأ، ال مستوى الثقة والانحراف المعياري للسكان الذين ندرسهم. في كثير من الأحيان يكون من المستحيل معرفة ما السكان الانحراف المعياري يكون. من خلال قاعدة النطاق ، يمكننا تقدير هذه الإحصائية ، ومن ثم معرفة مدى ضخامة حجم العينة.

instagram story viewer