اختصار صيغة مجموع المربعات

click fraud protection

حساب أ عينة التباين أو الانحراف المعياري عادة ما يتم ذكره على أنه كسر. يتضمن بسط هذا الكسر مجموع انحرافات مربعة عن المتوسط. في الإحصاء، الصيغة لهذا المجموع الكلي للمربعات هي

Σ (سأنا - س̄)2

يشير الرمز x هنا إلى متوسط ​​العينة ، ويخبرنا الرمز to أن نجمع الاختلافات المربعة (xأنا - س̄) للجميع أنا.

بينما تعمل هذه الصيغة للحسابات ، هناك صيغة مختصرة مكافئة لا تتطلب منا أولاً حساب متوسط ​​العينة. هذه الصيغة المختصرة لمجموع المربعات هي

Σ (سأنا2) - (Σ سأنا)2/ن

هنا المتغير ن يشير إلى عدد نقاط البيانات في العينة.

مثال الصيغة المعيارية

لمعرفة كيفية عمل صيغة الاختصار هذه ، سننظر في مثال يتم حسابه باستخدام كلا الصيغتين. لنفترض أن عينتنا هي 2 ، 4 ، 6 ، 8. متوسط ​​العينة هو (2 + 4 + 6 + 8) / 4 = 20/4 = 5. الآن نحسب فرق كل نقطة بيانات بمتوسط ​​5.

  • 2 – 5 = -3
  • 4 – 5 = -1
  • 6 – 5 = 1
  • 8 – 5 = 3

نقوم الآن بتربيع كل من هذه الأرقام وجمعها معًا. (-3)2 + (-1)2 + 12 + 32 = 9 + 1 + 1 + 9 = 20.

مثال صيغة اختصار

الآن سنستخدم نفس مجموعة البيانات: 2 ، 4 ، 6 ، 8 ، مع صيغة الاختصار لتحديد مجموع المربعات. نقوم أولاً بتربيع كل نقطة بيانات ونجمعها معًا: 22 + 42 + 62 + 82 = 4 + 16 + 36 + 64 = 120.

instagram viewer

الخطوة التالية هي جمع كل البيانات وتربيع هذا المجموع: (2 + 4 + 6 + 8)2 = 400. نقسم هذا على عدد نقاط البيانات للحصول على 400/4 = 100.

نطرح الآن هذا الرقم من 120. هذا يعطينا أن مجموع الانحرافات المربعة هو 20. كان هذا بالضبط الرقم الذي وجدناه بالفعل من الصيغة الأخرى.

كيف يعمل هذا؟

كثير من الناس سيقبلون فقط الصيغة بالقيمة الظاهرية وليس لديهم أي فكرة عن سبب عمل هذه الصيغة. باستخدام القليل من الجبر ، يمكننا أن نرى لماذا تعادل صيغة الاختصار هذه الطريقة القياسية والتقليدية لحساب مجموع الانحرافات المربعة.

على الرغم من أنه قد يكون هناك المئات ، إن لم يكن الآلاف من القيم في مجموعة بيانات واقعية ، سنفترض أن هناك ثلاث قيم بيانات فقط: س1، س2، س3. ما نراه هنا يمكن توسيعه إلى مجموعة بيانات تحتوي على آلاف النقاط.

نبدأ بملاحظة أن (س1 + س2 + س3) = 3 ×. التعبير Σ (xأنا - س̄)2 = (س1 - س̄)2 + (س2 - س̄)2 + (س3 - س̄)2.

نستخدم الآن الحقيقة من الجبر الأساسي (أ + ب)2 = أ2 + 2 أ ب + ب2. هذا يعني أن (س1 - س̄)2 = س12 -2x1 x̄ + x̄2. نقوم بذلك من أجل المصطلحين الآخرين في مجموعتنا ، ولدينا:

س12 -2x1 x̄ + x̄2 + س22 -2x2 x̄ + x̄2 + س32 -2x3 x̄ + x̄2.

نعيد ترتيب هذا ولدينا:

س12+ س22 + س32+ 3x̄2 - 2x (x1 + س2 + س3) .

بإعادة كتابة (x1 + س2 + س3) = 3x̄ يصبح ما يلي:

س12+ س22 + س32 - 3x̄2.

الآن منذ 3x̄2 = (س1+ س2 + س3)2/ 3 ، تصبح صيغتنا:

س12+ س22 + س32 - (خ1+ س2 + س3)2/3

وهذه حالة خاصة من الصيغة العامة المذكورة أعلاه:

Σ (سأنا2) - (Σ سأنا)2/ن

هل هو حقًا اختصار؟

قد لا يبدو أن هذه الصيغة هي اختصار حقًا. بعد كل شيء ، في المثال أعلاه ، يبدو أن هناك العديد من الحسابات. جزء من هذا يتعلق بحقيقة أننا نظرنا فقط إلى حجم عينة صغير.

بينما نزيد حجم العينة ، نرى أن صيغة الاختصار تقلل من عدد الحسابات بمقدار النصف تقريبًا. لا نحتاج إلى طرح المتوسط ​​من كل نقطة بيانات ثم تربيع النتيجة. هذا يقلل بشكل كبير من العدد الإجمالي للعمليات.

instagram story viewer