ما هو خط انحدار المربعات الصغرى؟

scatterplot هو نوع من الرسوم البيانية المستخدمة لتمثيل البيانات المقترنة. يتم رسم المتغير التوضيحي على طول المحور الأفقي ورسم متغير الاستجابة على طول المحور العمودي. أحد أسباب استخدام هذا النوع من الرسم البياني هو البحث عن العلاقات بين المتغيرات.

إن النمط الأساسي الذي يجب البحث عنه في مجموعة من البيانات المقترنة هو الخط المستقيم. من خلال أي نقطتين ، يمكننا رسم خط مستقيم. إذا كان هناك أكثر من نقطتين في scatterplot لدينا ، فمعظم الوقت لن نتمكن من رسم خط يمر بكل نقطة. بدلاً من ذلك ، سنرسم خطًا يمر عبر منتصف النقاط ويعرض الاتجاه العام الخطي للبيانات.

بينما ننظر إلى النقاط في الرسم البياني لدينا ونتمنى رسم خط من خلال هذه النقاط ، يطرح سؤال. أي خط يجب أن نرسم؟ هناك عدد لا حصر له من الخطوط التي يمكن رسمها. باستخدام أعيننا وحدها ، من الواضح أن كل شخص ينظر إلى scatterplot يمكن أن ينتج خطًا مختلفًا قليلاً. هذا الغموض مشكلة. نريد أن يكون لدينا طريقة محددة للجميع للحصول على نفس الخط. الهدف هو الحصول على وصف دقيق رياضي للخط الذي يجب رسمه. أقل المربعات خط الانحدار هو واحد من هذا القبيل من خلال نقاط البيانات لدينا.

instagram viewer

المربعات الصغرى

يوضح اسم خط المربعات الصغرى ما الذي يفعله. نبدأ مع مجموعة من النقاط مع الإحداثيات التي قدمها (سأنا, ذأنا). سوف يمر أي خط مستقيم بين هذه النقاط وسيتخطى أو يقل عن كل من هذه النقاط. يمكننا حساب المسافات من هذه النقاط إلى السطر عن طريق اختيار قيمة س ثم طرح الملاحظة ذ تنسيق يتوافق مع هذا س من ذ تنسيق خطنا.

خطوط مختلفة خلال نفس المجموعة من النقاط تعطي مجموعة مختلفة من المسافات. نريد أن تكون هذه المسافات صغيرة بقدر ما نستطيع. لكن هناك مشكلة. نظرًا لأن مسافاتنا يمكن أن تكون إيجابية أو سلبية ، فإن مجموع كل هذه المسافات سوف يلغي بعضها البعض. مجموع المسافات يساوي دائما صفر.

الحل لهذه المشكلة هو القضاء على جميع الأرقام السالبة عن طريق تربيع المسافات بين النقاط والخط. هذا يعطي مجموعة من الأرقام غير السالبة. الهدف الذي كان لدينا لإيجاد خط أفضل ملاءمة هو جعل مجموع هذه المسافات المربعة أصغر ما يمكن. حساب التفاضل والتكامل يأتي لانقاذ هنا. عملية التمييز في حساب التفاضل والتكامل تجعل من الممكن تقليل مجموع المسافات المربعة من خط معين. هذا ما يفسر عبارة "المربعات الصغرى" باسمنا لهذا السطر.

خط أفضل صالح

نظرًا لأن خط المربعات الصغرى يقلل المسافات المربعة بين الخط ونقاطنا ، يمكننا أن نفكر في هذا الخط باعتباره الخط الذي يناسب بياناتنا. هذا هو السبب في أن خط المربعات الصغرى يُعرف أيضًا باسم الخط الأنسب. من بين جميع الخطوط المحتملة التي يمكن رسمها ، يكون خط المربعات الصغرى هو الأقرب إلى مجموعة البيانات ككل. قد يعني هذا أن خطنا سيغيب عن الوصول إلى أي من النقاط في مجموعة البيانات الخاصة بنا.

ملامح خط المربعات الصغرى

هناك بعض الميزات التي يمتلكها كل خط مربعات على الأقل. البند الأول من الاهتمام يتعامل مع منحدر خطنا. المنحدر لديه اتصال إلى معامل الارتباط من البيانات لدينا. في الواقع ، ميل الخط يساوي ص (ق)ذس). هنا س س يدل على الانحراف المعياري لل س ينسق و س ذ الانحراف المعياري لل ذ إحداثيات البيانات الخاصة بنا. ترتبط علامة معامل الارتباط ارتباطًا مباشرًا بعلامة ميل خط المربعات الصغرى.

هناك ميزة أخرى لخط المربعات الصغرى تتعلق بنقطة يمر بها. بينما ال ذ اعتراض خط المربعات الصغرى قد لا يكون مثيراً للاهتمام من وجهة نظر إحصائية ، فهناك نقطة واحدة. يمر كل سطر من المربعات الصغرى عبر النقطة الوسطى للبيانات. هذه النقطة الوسطى لديها س تنسيق هذا هو تعني من س القيم و ذ تنسيق هذا هو معنى ذ القيم.

instagram story viewer