فهم الكم: التعاريف والاستخدامات

click fraud protection

إحصائيات موجزة مثل الوسيط ، الربع الأول والربع الثالث هي قياسات الموقف. وذلك لأن هذه الأرقام تشير إلى مكان وجود نسبة محددة من توزيع البيانات. على سبيل المثال ، الوسيط هو الموضع الأوسط للبيانات قيد التحقيق. نصف البيانات لها قيم أقل من المتوسط. وبالمثل ، فإن 25٪ من البيانات لها قيم أقل من الربع الأول و 75٪ من البيانات لها قيم أقل من الربع الثالث.

هذا المفهوم يمكن تعميمه. طريقة واحدة للقيام بذلك هي للنظر النسب المئوية. تشير النسبة المئوية 90 إلى النقطة التي تحتوي فيها 90٪ من البيانات على قيم أقل من هذا الرقم. بشكل عام ، فإن صالمئوي عشر هو الرقم ن لأي منهم ص٪ من البيانات أقل من ن.

متغيرات عشوائية مستمرة

على الرغم من أن إحصاءات ترتيب الوسيط والرباع الأول والرباع الثالث عادة ما يتم تقديمها في الإعداد مع مجموعة منفصلة من البيانات ، يمكن أيضا تعريف هذه الإحصاءات لعشوائية مستمرة متغير. لأننا نعمل مع توزيع مستمر نستخدم لا يتجزأ. ال صالمئوي عشر رقم ن مثل ذلك:

-₶نF ( س ) dx = ص/100.

هنا F ( س ) هي وظيفة كثافة الاحتمال. وبالتالي يمكننا الحصول على أي النسبة المئوية التي نريد ل مستمر توزيع.

الكميلات

هناك تعميم آخر هو ملاحظة أن إحصائيات طلباتنا تقسم التوزيع الذي نعمل معه. يقوم الوسيط بتقسيم البيانات التي تم تعيينها إلى النصف ، بينما تقوم الوسيطة أو 50٪ من التوزيع المستمر بتقسيم التوزيع إلى النصف من حيث المساحة. الربع الأول ،

instagram viewer
الوسيط والربع الثالث يقسم بياناتنا إلى أربع قطع مع نفس العدد في كل منها. يمكننا استخدام التكامل أعلاه للحصول على النسب المئوية 25 و 50 و 75 ، وتقسيم التوزيع المستمر إلى أربعة أجزاء من مساحة متساوية.

يمكننا تعميم هذا الإجراء. السؤال الذي يمكننا أن نبدأ به هو إعطاء عدد طبيعي نكيف يمكننا تقسيم توزيع المتغير إلى ن قطع متساوية الحجم؟ هذا يتحدث مباشرة إلى فكرة الكميات.

ال ن يتم العثور على الكميات لمجموعة البيانات تقريبًا عن طريق ترتيب البيانات بالترتيب ثم تقسيم هذا الترتيب من خلال ن - 1 نقاط متباعدة بالتساوي على الفاصل الزمني.

إذا كانت لدينا دالة كثافة الاحتمال لمتغير عشوائي مستمر ، فإننا نستخدم المكون أعلاه لإيجاد الكميات. إلى عن على ن الكميات ، نريد:

  • أول من لديك 1 /ن من منطقة التوزيع إلى يسارها.
  • الثانية لديها 2 /ن من منطقة التوزيع إلى يسارها.
  • ال صعشر أن يكون ص/ن من منطقة التوزيع إلى يسارها.
  • آخر من لديك (ن - 1)/ن من منطقة التوزيع إلى يسارها.

نرى ذلك لأي عدد طبيعي ن، ال ن الكميات تتوافق مع 100ص/نالمئين عشر ، حيث ص يمكن أن يكون أي عدد طبيعي من 1 إلى ن - 1.

الكميات المشتركة

يتم استخدام أنواع معينة من الكميات بشكل شائع بما يكفي للحصول على أسماء محددة. أدناه قائمة من هذه:

  • ويسمى 2 quantile الوسيط
  • وتسمى الكميات 3 terciles
  • تسمى الكميات الأربعة (الرباعيات)
  • وتسمى الكميات الخمسة الخماسيات
  • وتسمى الكميات 6 sextiles
  • تسمى الكميات 7 الحاجز
  • تسمى الكميات الثمانية بالكتيل
  • تسمى الكميات العشر عشرية
  • تسمى الكميات الاثني عشر الاثني عشرية
  • تسمى الكميات العشرين باليقظة
  • تسمى الكميات 100 النسب المئوية
  • 1000 الكميّات تسمى بيرميليس

بالطبع ، توجد كميات أخرى غير تلك الموجودة في القائمة أعلاه. في كثير من الأحيان تطابق الكمية المحددة المستخدمة حجم العينة من مستمر توزيع.

استخدام الكميات

إلى جانب تحديد موضع مجموعة من البيانات ، فإن الكميات مفيدة بطرق أخرى. لنفترض أن لدينا عينة عشوائية بسيطة من السكان ، وتوزيع السكان غير معروف. للمساعدة في تحديد ما إذا كان النموذج ، مثل التوزيع العادي أو توزيع Weibull ، مناسبًا جيدًا للسكان الذين أخذنا عينات منهم ، يمكننا أن ننظر إلى كميات بياناتنا والنموذج.

عن طريق مطابقة الكميّات من بيانات العينة الخاصة بنا إلى الكميات من معين توزيع الاحتمالات، والنتيجة هي مجموعة من البيانات المقترنة. نحن نرسم هذه البيانات في مخطط مبعثر ، والمعروفة باسم مؤامرة كمية أو مؤامرة q-q. إذا كان scatterplot الناتج خطيًا تقريبًا ، فإن النموذج مناسب تمامًا لبياناتنا.

instagram story viewer