هر مدل بهمنظور اندازه کارایی باید ارزیابی شوند و لذا عملاً برای ارزیابی نیاز به معیارها و توابعی است.
در این قسمت با یکی از معروف ترین معیارهای لازم برای ارزیابی دقت تشخیص اشاره میکنیم.
معیار اطلاعات متقابل نرمال شده
معیارNMI طبق معادله زیر تعریف شده است. در معادله، پارامترهای A و Bدو بخش جداشده از یک شبکه، C ماتریس درهم ریختگی، Cij برابر تعداد گره های مشترک بین جامعه i در بخش A و جامعه j در بخش B میباشد.
تحلیل خوشه ای چیست؟
اصطلاح تحلیل خوشه ای (کلاستر) که اولین بار توسط تریون در سال 1939 استفاده شد، در بردارنده الگوریتمها و روشهایی برای گروهبندی موردهای مشابه (شامل افراد، اشیاء، رویدادها و ...) درون طبقات مختلف میباشد. سؤالی که معمولاً محققان با آن روبرو میشوند این است که "چگونه دادههای مشاهده شده را درون ساختاری بامعنی سازماندهی کنند؟". تحلیل کلاستر موارد را بر اساس میزان ارتباطشان دستهبندی میکند. بنابراین افراد یک کلاستر دارای بیشترین میزان ارتباط با یکدیگر و کمترین میزان ارتباط با اعضای دیگر کلاسترها میباشند. از آنچه گفته شد میتوان فهمید که تحلیل کلاستر بدون آنکه به تشریح چرایی وجود دادهها بپردازد، برای کشف ساختار دادهها بکار میرود.بنابراین تحلیل کلاستر ابزاری اکتشافی است که میتواند ارتباطات و ساختار بین دادهها را که قبلاً مشهود و محسوس نبودند را آشکار نماید.در این روش هیچ فرضی در مورد تعداد گروهها یا ساختمان آنها در نظر گرفته نمیشود. دستهبندی کردن بر اساس مشابهتها و یا فواصل انجام میشود.
چرا تحلیل خوشهای ارزشمند است؟
اما ممکن استگروههای غیرقابل انتظاری ایجاد کند که احتمالاً بیانگر روابط جدیدی خواهد بود و باید مورد بررسی دقیقتری قرار گیرند.
انواع تحلیل خوشهای
تحلیل خوشهای دو مرحلهای
این رویه (Procedure)، ابزاری اکتشافی است که برای آشکار نمودن گروههای (خوشههای) ذاتی و طبیعی موجود در مجموعه داده که به طور معمول دیده نمیشوند، طراحی شده است.
وجه تمایز الگوریتم موجود در این رویه با فنون سنتی خوشهبندی بصورت زیر بیان می شود:
این روش برای پیدا کردن گروههای واقعی موجود در مشاهدات یا متغیرها بسیار مفید است. همزمان با متغیرهای پیوسته وگسسته به خوبی کار میکند. همچنینمیتواند فایل دادههای بسیار بزرگ را تحلیل نماید.
تحلیل خوشهای –Kمیانگین
این رویه محدود به متغیرهای قابل اندازهگیری (کمی) است. اما برای کار با دادههای بزرگ مناسب است و امکان ذخیرهسازی فاصلهها از مرکز خوشه را فراهم مینماید.
تحلیل خوشه ای سلسله مراتبی
اگر تعداد مشاهدات کم باشد و انتخاب بین چندین روش مختلف سازماندهی خوشهها، تبدیل متغیرها و اندازهگیری عدم شباهت بین خوشهها مطرح باشد، معمولاً این رویه پیشنهاد میشود.
در روش خوشهبندی سلسله مراتبی، به خوشههای نهایی بر اساس میزان عمومیت آنها ساختاری سلسله مراتبی، معمولاً به صورت درختی نسبت داده میشود. به این درخت سلسله مراتبی دندوگرام میگویند. روشهای خوشهبندی بر اساس ساختار سلسله مراتبی تولیدی توسط آنها معمولاً به دو دسته زیر تقسیم میشوند: