يعد التحليل العنقودي أسلوبًا إحصائيًا يستخدم لتحديد كيفية تجميع الوحدات المختلفة - مثل الأشخاص أو المجموعات أو المجتمعات - معًا بسبب الخصائص المشتركة بينها. يُعرف أيضًا باسم التجميع ، وهو أداة تحليل بيانات استكشافية تهدف إلى فرز الكائنات المختلفة إلى مجموعات بطريقة تجعلها ينتمون إلى نفس المجموعة لديهم درجة قصوى من الارتباط وعندما لا ينتمون إلى نفس المجموعة تكون درجة ارتباطهم الحد الأدنى. على عكس البعض الآخر تقنيات احصائيه، لا تحتاج البنى التي يتم الكشف عنها من خلال التحليل العنقودي إلى تفسير أو تفسير - فهي تكتشف البنية في البيانات دون توضيح سبب وجودها.
ما هو التجميع؟
التكتل موجود في كل جانب من جوانب حياتنا اليومية تقريبًا. خذ على سبيل المثال العناصر الموجودة في محل بقالة. يتم دائمًا عرض أنواع مختلفة من العناصر في نفس المواقع أو المواقع القريبة - اللحوم والخضروات والصودا والحبوب والمنتجات الورقية وما إلى ذلك. غالبًا ما يرغب الباحثون في أن يفعلوا نفس الشيء بالبيانات وتجميع الكائنات أو الموضوعات في مجموعات ذات معنى.
لنأخذ مثالاً من العلوم الاجتماعية ، لنفترض أننا ننظر إلى البلدان ونريد تجميعها في مجموعات بناءً على خصائص مثل
تقسيم العملأو الجيوش أو التكنولوجيا أو السكان المتعلمين. سنجد أن بريطانيا واليابان وفرنسا وألمانيا والولايات المتحدة لها خصائص متشابهة وسيتم تجميعها معًا. سيتم تجميع أوغندا ونيكاراغوا وباكستان معًا في مجموعة مختلفة لأنهم يشتركون في مجموعة مختلفة من الخصائص ، بما في ذلك انخفاض مستويات الثروة ، وتقسيم أبسط للعمل ، والمؤسسات السياسية غير المستقرة وغير الديمقراطية نسبيًا ، وانخفاض التكنولوجيا تطوير.يستخدم التحليل العنقودي عادة في المرحلة الاستكشافية للبحث عندما لا يكون لدى الباحث أي منها فرضيات مسبقة. وهي ليست الطريقة الإحصائية الوحيدة المستخدمة عادةً ، ولكنها تتم في المراحل الأولى من المشروع للمساعدة في توجيه بقية التحليل. لهذا السبب ، لا يكون اختبار الأهمية عادة مناسبًا أو غير مناسب.
هناك عدة أنواع مختلفة من التحليل العنقودي. النوعان الأكثر استخدامًا هما التكتل يعني التكتل والتجمع الهرمي.
K- تعني التكتل
K- يعني التكتل التعامل مع الملاحظات في البيانات على أنها كائنات لها مواقع ومسافات عن بعضها البعض (لاحظ أن المسافات المستخدمة في التكتل لا تمثل في الغالب مسافات مكانية). يقسم الكائنات إلى مجموعات K الحصرية المتبادلة بحيث تكون الكائنات داخل كل عنقود كما هي قريبة من بعضها قدر الإمكان وفي نفس الوقت ، بعيدًا عن الأشياء الموجودة في مجموعات أخرى قدر الإمكان. ثم تتميز كل عنقود من قبلها يعني أو نقطة المركز.
المجموعات الهرمية
يعد التجميع الهرمي طريقة لفحص التجمعات في البيانات في وقت واحد عبر مجموعة متنوعة من المقاييس والمسافات. يقوم بذلك عن طريق إنشاء شجرة عنقود بمستويات مختلفة. على عكس التجمعات العنقودية ، فإن الشجرة ليست مجموعة واحدة من العناقيد. وبدلاً من ذلك ، فإن الشجرة هي تسلسل هرمي متعدد المستويات حيث يتم ضم العناقيد على مستوى واحد كمجموعات في المستوى الأعلى التالي. تبدأ الخوارزمية المستخدمة بكل حالة أو متغير في مجموعة منفصلة ثم تجمع الكتل حتى يتم ترك واحدة فقط. يسمح هذا للباحث بتحديد مستوى التجميع الأنسب لبحوثه.
إجراء تحليل الكتلة
معظم برامج الإحصاء يمكن إجراء تحليل الكتلة. في SPSS ، حدد تحليل من القائمة ، ثم تصنيف و التحليل العنقودي. في ساس كتلة بروك يمكن استخدام الوظيفة.
تم التحديث بواسطة نيكي ليزا كول ، د.