لا توجد قاعدة في الواقع لعدد الفصول الدراسية التي يجب أن تكون هناك. هناك شيئان يجب مراعاتهما حول عدد الفصول. إذا كان هناك فئة واحدة فقط ، فستندرج جميع البيانات في هذه الفئة. سيكون الرسم البياني الخاص بنا ببساطة مستطيلًا واحدًا مع الارتفاع نظرًا لعدد العناصر في مجموعة البيانات الخاصة بنا. هذا لن يجعل من المفيد جدا أو رسم بياني مفيد.
على الجانب الآخر ، يمكن أن يكون لدينا العديد من الفئات. سيؤدي هذا إلى العديد من الحانات ، والتي قد لا يكون أي منها طويلًا جدًا. سيكون من الصعب للغاية تحديد أي خصائص مميزة عن البيانات باستخدام هذا النوع من الرسم البياني.
للحماية من هذين النقيضين ، لدينا قاعدة عامة لاستخدامها لتحديد عدد الفئات للرسم البياني. عندما يكون لدينا مجموعة صغيرة نسبيًا من البيانات ، فإننا نستخدم عادةً حوالي خمس فئات فقط. إذا كانت مجموعة البيانات كبيرة نسبيًا ، فإننا نستخدم حوالي 20 فئة.
مرة أخرى ، يجب التأكيد على أن هذه قاعدة أساسية ، وليس مبدأ إحصائيًا مطلقًا. يمكن أن تكون هناك أسباب جيدة للحصول على عدد مختلف من فئات البيانات. سنرى مثالاً على ذلك أدناه.
قبل أن نفكر في بعض الأمثلة ، سنرى كيفية تحديد الفئات في الواقع. نبدأ هذه العملية بإيجاد
نطاق من بياناتنا. بمعنى آخر ، نطرح أدنى قيمة للبيانات من أعلى قيمة للبيانات.عندما تكون مجموعة البيانات صغيرة نسبيًا ، نقسم النطاق على خمسة. الحاصل هو عرض الفئات للرسم البياني لدينا. ربما نحتاج إلى إجراء بعض التقريب في هذه العملية ، مما يعني أن العدد الإجمالي للفصول قد لا ينتهي به المطاف ليكون خمسة.
عندما تكون مجموعة البيانات كبيرة نسبيًا ، نقسم النطاق على 20. كما كان من قبل ، تعطينا مشكلة القسمة هذه عرض فئات الرسم البياني لدينا. أيضًا ، كما رأينا سابقًا ، قد ينتج عن التقريب لدينا أكثر أو أقل بقليل من 20 فئة.
في أي من حالات مجموعة البيانات الكبيرة أو الصغيرة ، نجعل الفصل الأول يبدأ عند نقطة أقل بقليل من أصغر قيمة بيانات. يجب أن نقوم بذلك بطريقة تجعل قيمة البيانات الأولى تندرج في الفئة الأولى. يتم تحديد الفئات اللاحقة الأخرى من خلال العرض الذي تم تعيينه عندما قسمنا النطاق. نحن نعلم أننا في الصف الأخير عندما تحتوي هذه الفئة على أعلى قيمة بيانات لدينا.
على سبيل المثال ، سنحدد عرض الفصل المناسب والفئات لمجموعة البيانات: 1.1 ، 1.9 ، 2.3 ، 3.0 ، 3.2 ، 4.1, 4.2, 4.4, 5.5, 5.5, 5.6, 5.7, 5.9, 6.2, 7.1, 7.9, 8.3, 9.0, 9.2, 11.1, 11.2, 14.4, 15.5, 15.5, 16.7, 18.9, 19.2.
نرى أن هناك 27 نقطة بيانات في مجموعتنا. هذه مجموعة صغيرة نسبيًا ولذا سنقسم النطاق على خمسة. النطاق هو 19.2 - 1.1 = 18.1. نقسم 18.1 / 5 = 3.62. هذا يعني أن عرض الفصل 4 سيكون مناسبًا. أصغر قيمة بيانات لدينا هي 1.1 ، لذلك نبدأ الصف الأول عند نقطة أقل من ذلك. نظرًا لأن بياناتنا تتكون من أرقام موجبة ، فمن المنطقي جعل الفصل الأول ينتقل من 0 إلى 4.
على سبيل المثال ، لنفترض أن هناك اختبارًا متعدد الخيارات يحتوي على 35 سؤالًا ، و 1000 طالب في مدرسة ثانوية يأخذون الاختبار. نرغب في تشكيل رسم بياني يوضح عدد الطلاب الذين حصلوا على درجات معينة في الاختبار. نرى أن 35/5 = 7 و 35/20 = 1.75. على الرغم من قاعدة الإبهام التي تمنحنا خيارات فئات العرض 2 أو 7 لاستخدامها في الرسم البياني لدينا ، قد يكون من الأفضل أن يكون لدينا فئات عرض 1. تتوافق هذه الفصول مع كل سؤال أجاب عليه الطالب بشكل صحيح في الاختبار. سيتمركز أولها عند 0 والأخير سيتمركز في 35.