فاصل الثقة لفروق نسبتين من السكان

فترات الثقة هي جزء واحد من إحصاءات استنتاجية. الفكرة الأساسية وراء هذا الموضوع هي تقدير قيمة السكان غير المعروفين معامل باستخدام عينة إحصائية. لا يمكننا فقط تقدير قيمة المعلمة ، ولكن يمكننا أيضًا تكييف أساليبنا لتقدير الفرق بين المعلمتين المرتبطتين. على سبيل المثال ، قد نرغب في العثور على الفرق في النسبة المئوية للناخبين المصوتين في الولايات المتحدة الذين يدعمون تشريعًا معينًا مقارنةً بالنساء المصوتات.

سنرى كيفية القيام بهذا النوع من الحساب عن طريق إنشاء فاصل ثقة للفرق بين نسبي السكان. في هذه العملية سوف ندرس بعض النظرية وراء هذا الحساب. سوف نرى بعض أوجه التشابه في كيفية بناء أ فاصل الثقة لنسبة سكان واحدة وكذلك فاصل الثقة للفرق بين اثنين من السكان يعني.

عموميات

قبل النظر في الصيغة المحددة التي سنستخدمها ، دعونا ننظر في الإطار العام الذي يناسبه هذا النوع من الثقة. يتم إعطاء شكل نوع فاصل الثقة الذي سننظر إليه بواسطة الصيغة التالية:

تقدير +/- هامش الخطأ

العديد من فترات الثقة من هذا النوع. هناك رقمان نحتاج إلى حسابهما. أول هذه القيم هو تقدير المعلمة. القيمة الثانية هي هامش الخطأ. يحسب هامش الخطأ هذا حقيقة أن لدينا تقدير. يوفر لنا فاصل الثقة مجموعة من القيم الممكنة للمعلمة غير المعروفة الخاصة بنا.

instagram viewer

الظروف

يجب أن نتأكد من تلبية جميع الشروط قبل القيام بأي عملية حسابية. لإيجاد فاصل الثقة للفرق بين نسبتين من السكان ، نحتاج إلى التأكد من الانتظار التالي:

  • نحن نملك اثنان عينات عشوائية بسيطة من أعداد كبيرة من السكان. هنا "كبير" يعني أن عدد السكان أكبر 20 مرة على الأقل من حجم العينة. سيتم تدوين أحجام العينات بواسطة ن1 و ن2.
  • تم اختيار الأفراد لدينا بشكل مستقل عن بعضهم البعض.
  • هناك ما لا يقل عن عشرة نجاحات وفشل عشرة في كل من العينات لدينا.

إذا كان العنصر الأخير في القائمة غير راضٍ ، فقد يكون هناك طريقة للتغلب على هذا. يمكننا تعديل بالإضافة إلى أربعة فاصل الثقة البناء والحصول عليها نتائج قوية. ونحن نمضي قدمًا ، نفترض أن جميع الشروط المذكورة أعلاه قد استوفيت.

العينات والنسب السكانية

الآن نحن على استعداد لبناء فاصل الثقة لدينا. نبدأ بتقدير الفرق بين نسب السكان لدينا. ويقدر كل من هذه النسب السكانية بنسبة العينة. نسب العينة هذه هي إحصائيات تم العثور عليها عن طريق قسمة عدد النجاحات في كل عينة ، ثم قسمة على حجم العينة المعني.

يتم الإشارة إلى نسبة السكان الأولى بواسطة ص1. إذا كان عدد النجاحات في عينة لدينا من هذا السكان هو ك1، ثم لدينا نسبة عينة من ك1 / ن1.

نشير إلى هذه الإحصاء بواسطة p̂1. نقرأ هذا الرمز كـ "p1وماذا "لأنه يشبه الرمز p1 مع قبعة على القمة.

بطريقة مماثلة يمكننا حساب نسبة العينة من مجموعتنا الثانية. المعلمة من هذا السكان هو ص2. إذا كان عدد النجاحات في عينة لدينا من هذا السكان هو ك2، ونسبة العينة لدينا هي p̂2 = ك2 / ن2.

تصبح هاتان الإحصائتان الجزء الأول من فاصل الثقة. تقدير ص1 هو p̂1. تقدير ص2 هو p̂2. لذلك تقدير الفرق ص1 - ص2 هو p̂1 - p̂2.

توزيع العينات من الفرق في نسبة العينات

بعد ذلك نحتاج إلى الحصول على صيغة هامش الخطأ. للقيام بذلك سوف ننظر أولا في توزيع العينات من p̂1 . هذا هو التوزيع ذو الحدين مع احتمال النجاح ص1 و ن1 التجارب. متوسط ​​هذا التوزيع هو النسبة ص1. الانحراف المعياري لهذا النوع من المتغير العشوائي له تباين في ص1 (1 - ص1 )/ن1.

توزيع العينات من p̂2 يشبه ذلك من p̂1 . ما عليك سوى تغيير كل المؤشرات من 1 إلى 2 ولدينا توزيع ذي حدين بمتوسط ​​p2 والتباين من ص2 (1 - ص2 )/ن2.

نحتاج الآن إلى عدد قليل من النتائج من الإحصاءات الرياضية من أجل تحديد توزيع أخذ العينات من p̂1 - p̂2. يعني هذا التوزيع ص1 - ص2. نظرًا لحقيقة أن الفروق تضاف معًا ، نرى أن التباين في توزيع العينات هو ص1 (1 - ص1 )/ن1 + ص2 (1 - ص2 )/ن2. الانحراف المعياري للتوزيع هو الجذر التربيعي لهذه الصيغة.

هناك بعض التعديلات التي نحتاج إلى إجرائها. الأول هو أن صيغة الانحراف المعياري لـ p̂1 - p̂2 يستخدم معلمات غير معروفة من ص1 و ص2. بالطبع إذا كنا نعرف هذه القيم بالفعل ، فلن تكون هذه مشكلة إحصائية مثيرة للاهتمام على الإطلاق. لن نحتاج إلى تقدير الفرق بين ص1 و ص2.. بدلا من ذلك يمكننا ببساطة حساب الفرق الدقيق.

يمكن إصلاح هذه المشكلة عن طريق حساب خطأ قياسي بدلاً من الانحراف المعياري. كل ما نحتاج إلى القيام به هو استبدال نسب السكان بنسب العينة. يتم حساب الأخطاء القياسية بناءً على الإحصاءات بدلاً من المعلمات. الخطأ المعياري مفيد لأنه يقدر فعليًا الانحراف المعياري. ما يعنيه هذا بالنسبة لنا هو أننا لم نعد بحاجة إلى معرفة قيمة المعلمات ص1 و ص2. .نظرًا لأن نسب العينة هذه معروفة ، يتم إعطاء الخطأ القياسي بواسطة الجذر التربيعي للتعبير التالي:

1 (1 - p̂1 )/ن1 + p̂2 (1 - p̂2 )/ن2.

العنصر الثاني الذي نحتاج إلى معالجته هو الشكل المحدد لتوزيع العينات لدينا. اتضح أنه يمكننا استخدام التوزيع الطبيعي لتقريب توزيع أخذ العينات من p̂1 - p̂2. سبب ذلك تقني إلى حد ما ، ولكن تم توضيح ذلك في الفقرة التالية.

كلا p̂1 و p̂2 لديك توزيع العينات التي هي ذات الحدين. يمكن تقريب كل توزيع من هذه التوزيعات ذات الحدين بشكل جيد من خلال التوزيع الطبيعي. هكذا p̂1 - p̂2 هو متغير عشوائي. يتم تشكيله كمزيج خطي من اثنين من المتغيرات العشوائية. كل من هذه تقارب من قبل التوزيع الطبيعي. لذلك توزيع أخذ العينات من p̂1 - p̂2 كما توزع عادة.

الثقة فاصل الفورمولا

لدينا الآن كل ما نحتاجه لتجميع فاصل الثقة لدينا. التقدير هو (p̂1 - p̂2) وهامش الخطأ هو z * [p̂1 (1 - p̂1 )/ن1 + p̂2 (1 - p̂2 )/ن2.]0.5. القيمة التي ندخلها z * تمليها مستوى الثقة سي. يشيع استخدام القيم ل z * هي 1.645 لثقة 90٪ و 1.96 لثقة 95٪. هذه القيم ل z * تدل على جزء من التوزيع الطبيعي القياسي حيث بالضبط C في المئة من التوزيع بين -z * و z *.

تمنحك الصيغة التالية فاصل ثقة للاختلاف بين نسبي السكان:

(p̂1 - p̂2) +/- z * [p̂1 (1 - p̂1 )/ن1 + p̂2 (1 - p̂2 )/ن2.]0.5