الانحدار الخطي هو أسلوب إحصائي يستخدم لمعرفة المزيد حول العلاقة بين متغير مستقل (متنبئ) ومتغير تابع (قياسي). عندما يكون لديك أكثر من متغير مستقل واحد في تحليلك ، يُشار إلى ذلك باسم الانحدار الخطي المتعدد. بشكل عام ، يسمح الانحدار للباحث بطرح السؤال العام "ما هو أفضل تنبؤ ...؟"
على سبيل المثال ، دعنا نقول أننا ندرس أسباب بدانة، ويقاس مؤشر كتلة الجسم (BMI). على وجه الخصوص ، أردنا معرفة ما إذا كانت المتغيرات التالية تنبؤات مهمة لمؤشر كتلة الجسم للشخص: عدد الوجبات السريعة وجبات الطعام التي يتم تناولها أسبوعيًا ، وعدد ساعات المشاهدة التليفزيونية في الأسبوع ، وعدد الدقائق التي يقضونها في الأسبوع ، وأولياء الأمور مؤشر كتلة الجسم. سيكون الانحدار الخطي منهجية جيدة لهذا التحليل.
معادلة الانحدار
عندما تقوم بإجراء تحليل الانحدار باستخدام متغير مستقل واحد ، تكون معادلة الانحدار هي Y = a + b * X حيث Y هو المتغير التابع ، X هو المتغير المستقل ، وهو الثابت (أو التقاطع) ، و b هو ال انحدار خط الانحدار. على سبيل المثال ، دعنا نقول أن GPA هو أفضل توقع لمعادلة الانحدار 1 + 0.02 * IQ. إذا حصل الطالب على معدل ذكاء 130 ، فسيكون المعدل التراكمي 3.6 (1 + 0.02 * 130 = 3.6).
عندما تجري تحليلًا للانحدار يكون لديك فيه أكثر من متغير مستقل ، تكون معادلة الانحدار هي Y = a + b1 * X1 + b2 * X2 +... + bp * Xp. على سبيل المثال ، إذا أردنا تضمين المزيد من المتغيرات في تحليل المعدل التراكمي الخاص بنا ، مثل مقاييس التحفيز والانضباط الذاتي ، فسنستخدم هذا معادلة.
ار سكوير
ص مربع ، المعروف أيضا باسم معامل التحديد، هي إحصائية شائعة الاستخدام لتقييم ملاءمة النموذج لمعادلة الانحدار. بمعنى ، ما مدى جودة جميع المتغيرات المستقلة في التنبؤ بالمتغير التابع لديك؟ تتراوح قيمة مربع R من 0.0 إلى 1.0 ويمكن ضربها في 100 للحصول على نسبة مئوية التباين شرح. على سبيل المثال ، العودة إلى معادلة الانحدار المعدل التراكمي لدينا مع متغير واحد فقط مستقل (IQ)... دعنا نقول أن لدينا كان R-square للمعادلة 0.4. يمكننا تفسير ذلك على أنه يعني أن 40٪ من التباين في المعدل التراكمي موضحة معدل الذكاء. إذا قمنا بعد ذلك بإضافة متغيرين آخرين (الدافع والانضباط الذاتي) ويزيد مربع R 0.6 ، وهذا يعني أن معدل الذكاء والتحفيز والانضباط الذاتي يفسرون معًا 60٪ من التباين في المعدل التراكمي درجات.
تتم عادة تحليلات الانحدار باستخدام برنامج إحصائي ، مثل SPSS أو SAS وبالتالي يتم احتساب مربع R لك.
تفسير معاملات الانحدار (ب)
تمثل معاملات b من المعادلات أعلاه قوة واتجاه العلاقة بين المتغيرات المستقلة والمتغيرة. إذا نظرنا إلى معادلة GPA و IQ ، 1 + 0.02 * 130 = 3.6 ، 0.02 هي معامل الانحدار لمتغير IQ. هذا يخبرنا أن اتجاه العلاقة هو إيجابي بحيث يزيد معدل الذكاء ، ويزيد أيضا المعدل التراكمي. إذا كانت المعادلة 1 - 0.02 * 130 = Y ، فهذا يعني أن العلاقة بين IQ و GPA كانت سالبة.
الافتراضات
هناك العديد من الافتراضات حول البيانات التي يجب الوفاء بها من أجل إجراء تحليل الانحدار الخطي:
- الخطي: من المفترض أن تكون العلاقة بين المتغيرات المستقلة والمستقلة التابعة خطية. على الرغم من أن هذا الافتراض لا يمكن تأكيده بالكامل ، إلا أن النظر إلى أ scatterplot من المتغيرات الخاصة بك يمكن أن تساعد في اتخاذ هذا القرار. في حالة وجود انحناء في العلاقة ، يمكنك التفكير في تحويل المتغيرات أو السماح صراحةً بالمكونات غير الخطية.
- الحياة الطبيعية: ومن المفترض أن بقايا يتم توزيع المتغيرات الخاصة بك عادة. أي أن الأخطاء في التنبؤ بقيمة Y (المتغير التابع) يتم توزيعها بطريقة تقترب من المنحنى العادي. يمكنك أن تبحث في رسم بياني أو مؤامرات الاحتمال العادي لفحص توزيع المتغيرات الخاصة بك وقيمها المتبقية.
- استقلال: من المفترض أن الأخطاء في التنبؤ بقيمة Y كلها مستقلة عن بعضها البعض (غير مرتبطة).
- الشذوذ الجنسي: من المفترض أن يكون التباين حول خط الانحدار هو نفسه بالنسبة لجميع قيم المتغيرات المستقلة.
مصدر
- StatSoft: كتاب الإحصاء الإلكتروني. (2011). http://www.statsoft.com/textbook/basic-statistics/#Crosstabulationb.