ما هو الارتباط في الإحصاء؟

click fraud protection

في بعض الأحيان تأتي البيانات الرقمية في أزواج. ربما أ عالم الحفريات يقيس أطوال عظم الفخذ (عظم الساق) والعضد (عظم الذراع) في خمسة أحافير من نفس فصيلة الديناصورات. قد يكون من المنطقي التفكير في أطوال الذراع بشكل منفصل عن أطوال الساق ، وحساب أشياء مثل المتوسط ​​أو الانحراف المعياري. ولكن ماذا لو كان الباحث فضوليًا لمعرفة ما إذا كانت هناك علاقة بين هذين القياسين؟ لا يكفي مجرد إلقاء نظرة على الذراعين بشكل منفصل عن الساقين. بدلا من ذلك ، ينبغي على عالم الحفريات أن يقرن أطوال العظام لكل هيكل عظمي واستخدام مساحة الإحصاء يعرف بالارتباط.

ما هو الارتباط؟ في المثال أعلاه افترض أن الباحث درس البيانات ولم يصل إلى ما يثير الدهشة النتيجة أن أحافير الديناصور بأذرع أطول لها أيضًا أرجل أطول ، والأحفوريات ذات أذرع أقصر سيقان أقصر. أظهر مخطط مبعثر للبيانات أن جميع نقاط البيانات تم تجميعها بالقرب من خط مستقيم. يقول الباحث بعد ذلك أن هناك علاقة قوية مستقيمة أو علاقه مترابطهبين أطوال عظام الذراع وعظام ساق الحفريات. يتطلب المزيد من العمل لتوضيح مدى قوة الارتباط.

الارتباط و Scatterplots

نظرًا لأن كل نقطة بيانات تمثل رقمين ، فإن المخطط المبعثر ثنائي الأبعاد يساعد بشكل كبير في تصور البيانات. لنفترض أن لدينا بالفعل أيدينا على بيانات الديناصورات ، وأن الأحافير الخمسة لها القياسات التالية:

instagram viewer

  1. Femur 50 سم ، عظم العضد 41 سم
  2. Femur 57 سم ، عظم العضد 61 سم
  3. فيمور 61 سم ، عظم العضد 71 سم
  4. فيمور 66 سم ، عظم العضد 70 سم
  5. فيمور 75 سم ، عظم العضد 82 سم

ينتج عن الرسم البياني المبعثر للبيانات ، مع قياس عظم الفخذ في الاتجاه الأفقي وقياس عظم العضد في الاتجاه الرأسي ، الرسم البياني أعلاه. تمثل كل نقطة قياسات أحد الهياكل العظمية. على سبيل المثال ، تتوافق النقطة في أسفل اليسار مع الهيكل العظمي رقم 1. النقطة في الجزء العلوي الأيمن هي الهيكل العظمي رقم 5.

يبدو بالتأكيد أنه يمكننا رسم خط مستقيم يكون قريبًا جدًا من جميع النقاط. ولكن كيف نقول على وجه اليقين؟ القرب في عين الناظر. كيف نعرف أن تعريفات "التقارب" تتطابق مع شخص آخر؟ هل هناك أي طريقة يمكننا من خلالها تحديد هذا القرب؟

معامل الارتباط

لقياس مدى قرب البيانات من كونها على طول خط مستقيم ، يأتي معامل الارتباط إلى الإنقاذ. ال معامل الارتباط، يشار إليها عادة ص، هو رقم حقيقي بين -1 و 1. قيمة ال ص يقيس قوة الارتباط على أساس الصيغة ، ويزيل أي ذاتية في العملية. هناك العديد من المبادئ التوجيهية التي يجب وضعها في الاعتبار عند تفسير قيمة ص.

  • إذا ص = 0 عندئذ تكون النقاط خليطًا تامًا ولا توجد علاقة مباشرة بين البيانات.
  • إذا ص = -1 أو ص = 1 ثم تصطف جميع نقاط البيانات بشكل مثالي على الخط.
  • إذا ص هي قيمة غير هذه النهايات ، فالنتيجة هي أقل من الكمال للخط المستقيم. في مجموعات بيانات العالم الحقيقي ، هذه هي النتيجة الأكثر شيوعًا.
  • إذا ص هو إيجابي ثم الخط يصعد مع منحدر إيجابي. إذا ص سالبة ثم ينخفض ​​الخط مع ميل سلبي.

حساب معامل الارتباط

صيغة معامل الارتباط ص أمر معقد ، كما يمكن رؤيته هنا. مكونات الصيغة هي الوسائل والانحرافات المعيارية لكلا مجموعتي البيانات الرقمية ، بالإضافة إلى عدد نقاط البيانات. لمعظم التطبيقات العملية ص مملة لحساب باليد. إذا تم إدخال بياناتنا في آلة حاسبة أو برنامج جدول بيانات مع أوامر إحصائية، عادة ما تكون هناك وظيفة مدمجة لحسابها ص.

حدود الارتباط

على الرغم من أن الارتباط أداة قوية ، إلا أن هناك بعض القيود في استخدامه:

  • لا يخبرنا الارتباط تمامًا بكل شيء عن البيانات. الوسائل والانحرافات المعيارية لا تزال مهمة.
  • يمكن وصف البيانات من خلال منحنى أكثر تعقيدًا من الخط المستقيم ، ولكن هذا لن يظهر في حساب ص.
  • تؤثر القيم المتطرفة بقوة على معامل الارتباط. إذا رأينا أي قيم غريبة في بياناتنا ، يجب أن نكون حذرين بشأن الاستنتاجات التي نستخلصها من قيمة ص.
  • فقط لأن مجموعتين من البيانات مترابطة ، فهذا لا يعني أن إحداها هي سبب من جهة أخرى.
instagram story viewer