في بعض الأحيان في الإحصاءات ، من المفيد أن نرى أمثلة محسوبة للمشاكل. يمكن لهذه الأمثلة أن تساعدنا في اكتشاف مشاكل مماثلة. في هذه المقالة ، سوف نسير في عملية إجراء إحصاءات استنتاجية نتيجة تتعلق بوسيلتين من السكان. لن نرى فقط كيفية إجراء أ اختبار الفرضية حول الفرق بين وسيلتين من السكان ، سنقوم أيضًا ببناء أ فاصل الثقة لهذا الاختلاف. تسمى الطرق التي نستخدمها في بعض الأحيان اختبار t لعينتين وفاصل ثقة t لعينتين.
بيان المشكلة
لنفترض أننا نرغب في اختبار الأهلية الرياضية لأطفال المدارس الابتدائية. أحد الأسئلة التي قد تكون لدينا هي ما إذا كانت مستويات الدرجات الأعلى لها درجات اختبار أعلى.
يتم أخذ عينة عشوائية بسيطة من 27 طالبًا في الصف الثالث لاختبار الرياضيات ، ويتم تسجيل إجاباتهم ، وتبين أن النتائج لها متوسط نقاط 75 نقطة مع الانحراف المعياري للعينة من 3 نقاط.
يتم إعطاء عينة عشوائية بسيطة من 20 طالبًا في الصف الخامس في نفس اختبار الرياضيات ويتم تسجيل إجاباتهم. متوسط الدرجات للصف الخامس هو 84 نقطة مع انحراف معياري للعينة قدره 5 نقاط.
بالنظر إلى هذا السيناريو ، نطرح الأسئلة التالية:
- هل تزودنا بيانات العينة بأدلة على أن متوسط نتيجة الاختبار لجميع طلاب الصف الخامس يتجاوز متوسط درجة الاختبار لسكان جميع طلاب الصف الثالث؟
- ما هو فاصل الثقة 95٪ للاختلاف في متوسط درجات الاختبار بين سكان الصف الثالث والخامس؟
الشروط والإجراءات
يجب علينا تحديد الإجراء الذي نستخدمه. عند القيام بذلك ، يجب علينا التأكد والتحقق من استيفاء الشروط لهذا الإجراء. يطلب منا مقارنة وسيلتين السكان. مجموعة واحدة من الطرق التي يمكن استخدامها للقيام بذلك هي تلك التي تتكون من نموذجين من إجراءات t.
من أجل استخدام إجراءات t هذه لعينتين ، نحتاج إلى التأكد من أن الشروط التالية سارية:
- لدينا عينتان عشوائيتان بسيطتان من المجتمعين محل الاهتمام.
- لا تشكل عيناتنا العشوائية البسيطة أكثر من 5 ٪ من السكان.
- العيّنتان مستقلتان عن بعضهما ولا يوجد تطابق بين المواضيع.
- يتم توزيع المتغير عادة.
- كلا من المتوسط السكاني والانحراف المعياري غير معروف لكل من السكان.
نرى أن معظم هذه الشروط قد تحققت. قيل لنا أن لدينا عينات عشوائية بسيطة. عدد السكان الذي ندرسه كبير حيث يوجد الملايين من الطلاب في هذه المستويات الدراسية.
الشرط الذي يتعذر علينا افتراضه تلقائيًا هو ما إذا كانت نتائج الاختبار موزعة بشكل طبيعي. نظرًا لأن لدينا حجم عينة كبيرًا بما فيه الكفاية ، من خلال قوة إجراءات t لدينا ، لا نحتاج بالضرورة إلى المتغير ليتم توزيعه بشكل طبيعي.
نظرًا لأن الشروط مستوفاة ، فإننا نجري عدة حسابات أولية.
خطأ تقليدي
الخطأ المعياري هو تقدير للانحراف المعياري. بالنسبة لهذه الإحصائية ، نضيف تباين العينات للعينات ثم نأخذ الجذر التربيعي. هذا يعطي الصيغة:
(س1 2 / ن1 + س22 / ن2)1/2
باستخدام القيم أعلاه ، نرى أن قيمة الخطأ القياسي هي
(32 / 27+ 52 / 20)1/2 =(1 / 3 + 5 / 4 )1/2 = 1.2583
درجات الحرية
يمكننا استخدام التقريب المحافظ لدينا درجات الحرية. قد يقلل هذا من تقدير عدد درجات الحرية ، ولكن الحساب أسهل بكثير من استخدام صيغة ولش. نستخدم الحجم الأصغر من حجم العينة ، ثم نطرح واحدًا من هذا الرقم.
بالنسبة لمثالنا ، أصغر العينة هي 20. هذا يعني أن عدد درجات الحرية هو 20 - 1 = 19.
اختبار الفرضية
نرغب في اختبار الفرضية القائلة بأن طلاب الصف الخامس لديهم درجة اختبار متوسط أكبر من متوسط درجة طلاب الصف الثالث. دع μ1 يكون متوسط درجات سكان جميع طلاب الصف الخامس. وبالمثل ، دعونا μ2 يكون متوسط درجات سكان جميع طلاب الصف الثالث.
الفرضيات هي كما يلي:
- ح0: μ1 - μ2 = 0
- حأ: μ1 - μ2 > 0
إحصاء الاختبار هو الفرق بين وسيلة العينة ، والذي يتم تقسيمه بعد ذلك على الخطأ المعياري. نظرًا لأننا نستخدم نموذجًا للانحرافات المعيارية لتقدير الانحراف المعياري للسكان ، فإن إحصاء الاختبار من توزيع t.
قيمة إحصاء الاختبار (84-75) / 1.2583. هذا هو حوالي 7.15.
نحدد الآن ما هي قيمة p لهذا الاختبار الفرضي. ننظر إلى قيمة إحصائية الاختبار ، وحيث يقع هذا على توزيع t مع 19 درجة من الحرية. لهذا التوزيع ، لدينا 4.2 × 10-7 كقيمة p الخاصة بنا. (إحدى الطرق لتحديد ذلك هي استخدام الدالة T.DIST.RT في Excel.)
نظرًا لأن لدينا قيمة p صغيرة ، فإننا نرفض الفرضية الصفرية. الاستنتاج هو أن متوسط درجات الاختبار للصف الخامس أعلى من متوسط درجة الاختبار للصف الثالث.
فاصل الثقة
نظرًا لأننا أثبتنا وجود اختلاف بين متوسطات الدرجات ، فإننا نحدد الآن فاصل الثقة للفرق بين هاتين الوسيلتين. لدينا بالفعل الكثير مما نحتاجه. يحتاج فاصل الثقة للفرق إلى تقدير وهامش خطأ.
تقدير الفرق بين وسيلتين هو حساب مباشر. نجد ببساطة اختلاف وسيلة العينة. هذا الاختلاف في العينة يعني تقدير فرق السكان.
بالنسبة لبياناتنا ، الفرق في متوسط العينة هو 84-75 = 9.
يكون هامش الخطأ أكثر صعوبة في الحساب بقليل. لهذا ، نحن بحاجة إلى ضرب الإحصاء المناسب في الخطأ المعياري. تم العثور على الإحصائيات التي نحتاجها من خلال استشارة جدول أو برنامج إحصائي.
مرة أخرى باستخدام التقريب المحافظ ، لدينا 19 درجة من الحرية. بالنسبة لفاصل الثقة 95٪ ، نرى أن ر* = 2.09. يمكننا استخدام دالة T.INV في Exceل لحساب هذه القيمة.
نجمع الآن كل شيء ونرى أن هامش الخطأ لدينا هو 2.09 × 1.2583 ، وهو ما يقرب من 2.63. فاصل الثقة هو 9 ± 2.63. الفاصل الزمني هو 6.37 إلى 11.63 نقطة في الاختبار الذي اختاره طلاب الصف الخامس والثالث.