بخش دوم:
تکنیک های تشخیص جامعه
روش های تشخیص جامعه را می توان به طور کلی به دو نوع دسته بندی کرد. روشهای انباشتگی و روشهای تقسیمی. در روشهای انباشتهای، یالها یکی یکی به نموداری که فقط شامل گرهها است اضافه میشود. لبه ها از لبه قوی تر به لبه ضعیف تر اضافه می شوند. روشهای تقسیمبندی برعکس روشهای تجمعی پیروی میکنند. در آنجا، یال ها یکی یکی از یک نمودار کامل حذف می شوند.
در یک شبکه معین میتواند هر تعداد اجتماع وجود داشته باشد و اندازههای آنها متفاوت باشد. این ویژگی ها روند تشخیص جوامع را بسیار سخت می کند. با این حال، تکنیک های مختلفی در حوزه تشخیص جامعه پیشنهاد شده است. چهار الگوریتم تشخیص جامعه محبوب در زیر توضیح داده شده است. همه این الگوریتم های فهرست شده را می توان در کتابخانه cdlib پایتون پیدا کرد.
1-تشخیص جامعه لووان
الگوریتم تشخیص جامعه Louvain در ابتدا در سال 2008 به عنوان یک روش آشکارسازی سریع جامعه برای
شبکه های بزرگ پیشنهاد شد.این رویکرد مبتنی بر مدولار بودن است، که سعی میکند تفاوت بین تعداد واقعی یالها
در یک جامعه و تعداد مورد انتظار لبهها در جامعه را به حداکثر برساندبا این حال، بهینه سازی مدولاریت در یک شبکه
NP-hard است، بنابراین باید از اکتشافی استفاده کرد. الگوریتم Louvain به دو فاز تکرار شونده تقسیم می شود.
حرکت محلی گره ها)تجمیع شبکه(
الگوریتم با یک شبکه وزنی از N گره شروع می شود. در مرحله اول، الگوریتم یک جامعه متفاوت را به
هر گره شبکه اختصاص می دهد.سپس برای هر گره، همسایگان را در نظر گرفته و با حذف گره خاص از جامعه
فعلی و قرار دادن در جامعه همسایه، به دست آوردن مدولار بودن را ارزیابی می کند. اگر سود مثبت و حداکثر
شود، گره در جامعه همسایه قرار می گیرد. اگر سود مثبتی وجود نداشته باشد، گره در همان جامعه باقی
خواهدماند.این فرآیند به طور مکرر و برای همه گره ها اعمال می شود تا زمانی که هیچ بهبود دیگری وجود
نداشته باشد.فاز اول الگوریتم Louvain زمانی متوقف می شود که ماکزیمم محلی مدولاریت به دست آید. در مرحله
دوم، الگوریتم با در نظر گرفتن جوامعی که در فاز اول بهعنوان گره یافت می شوند، یک شبکه جدید می سازد.
پس از تکمیل فاز دوم، الگوریتم فاز اول را مجدداً در شبکه حاصل اعمال خواهد کرد.این مراحل تا زمانی که
تغییری در شبکه ایجاد نشود و حداکثر ماژولاریت به دست آید تکرار می شود.الگوریتم تشخیص جامعه
Louvain جوامع جوامع را در طول فرآیند آشکار می کند. به دلیل سهولت اجرا و همچنین سرعت الگوریتم
بسیار محبوب است.با این حال، یکی از محدودیت های اصلی الگوریتم استفاده از ذخیره سازی شبکه در
حافظه اصلی است. استفاده از الگوریتم تشخیص جامعه Louvain با استفاده از کتابخانه cdlib پایتون در
زیر آورده شده است.
from cdlib import algorithmsimport networkx as nxG = nx.karate_club_graph()coms = algorithms.louvain(G, weight=’weight’, resolution=1., randomize=False)
2. تشخیص جامعه سورپرایز
با توجه به محدودیتهای مدولاریته، معیاری مبتنی بر احتمالات کلاسیک به نام Surprise برای
ارزیابی کیفیت پارتیشن یک شبکه به جوامع معرفی شده است. این الگوریتم تقریباً شبیه به الگوریتم
تشخیص جامعه Louvain است با این تفاوت که به جای مدولار بودن از شگفتی ها استفاده می کند.گره ها
از یک جامعه به جامعه دیگر منتقل می شوند به طوری که شگفتی ها حریصانه بهبود می یابند. این
رویکرد احتمال وجود یک پیوند در یک جامعه را در نظر می گیرد. استفاده از سورپرایز در محدوده
بسیاری از جوامع کوچک و استفاده از مدولاریت در محدود تعداد کمی از جوامع بزرگ به خوبی کار
می کند.استفاده از الگوریتم تشخیص جامعه سورپرایز با استفاده از کتابخانه cdlib پایتون در زیر آورده
شده است.
from cdlib import algorithmsimport networkx as nxG = nx.karate_club_graph()coms = algorithms.surprise_communities(G)
3. تشخیص جامعه لیدن
در تحقیقات بعدی (2019)، V.A. تراگ و همکاران نشان داد که تشخیص جامعه Louvain تمایل
به کشف جوامعی دارد که به صورت داخلی قطع شده اند(جامعه های بد مرتبط).درالگوریتم
Louvain، انتقال یک گره که به عنوان پل بین دو جزء در یک جامعه عمل کرده است،به یک
جامعه جدید ممکن است جامعه قدیمی را قطع کند. اگر جامعه قدیمی بیشتر تقسیم شود،این مشکلی
نخواهد بود. اما طبق گفته تراگ و همکاران، این چنین نخواهد بود. گره های دیگر در جامعه
قدیمی به دلیل ارتباطات قوی به آن اجازه می دهند تا به عنوان یک جامعه واحد باقی بماند.
همچنین به گفته آنها، لووین تمایل به کشف جوامع مرتبط بسیار هفتگی دارد.بنابراین، آنها
الگوریتم بسیار سریعتر لیدن را پیشنهاد کرده اند که تضمین می کند که جوامع به خوبی به هم
متصل هستند.علاوه بر فازهای مورد استفاده در الگوریتم Louvain، لیدن از یک فاز دیگر استفاده
می کند که سعی می کند پارتیشن های کشف شده را اصلاح کند.
سه فاز در الگوریتم لیدن عبارتند از:
حرکت محلی گره ها
اصلاح پارتیشن ها
تجمیع شبکه بر اساس پارتیشن های تصفیه شده
در مرحله پالایش، الگوریتم سعی می کند پارتیشن های تصفیه شده را از پارتیشن های
پیشنهادی فاز اول شناسایی کند. جوامع پیشنهاد شده توسط فاز اول ممکن است در مرحله
دوم به چند پارتیشن تقسیم شوند. مرحله پالایش از یک رویکرد حریصانه پیروی نمی کند
و ممکن است یک گره را با یک جامعه به طور تصادفی انتخاب شده ادغام کند که عملکرد
کیفیت را افزایش می دهد. این تصادفی بودن امکان کشف فضای پارتیشن را به
طور گسترده تر می دهد. همچنین در مرحله اول، لیدن رویکرد متفاوتی را به لووین
دنبال می کند. لیدن به جای بازدید از تمام گرههای شبکه پس از تکمیل اولین بازدید
از همه گرهها، فقط از گرههایی بازدید میکند که همسایگی آنها تغییر کرده است.
استفاده از الگوریتم تشخیص جامعه لیدن با استفاده از کتابخانه cdlib پایتون
در زیر آورده شده است.
from cdlib import algorithmsimport networkx as nxG = nx.karate_club_graph()coms = algorithms.leiden(G)
4. تشخیص جامعه Walktrap
Walktrap روش دیگری برای تشخیص جامعه بر اساس پیاده روی تصادفی است که در آن
فاصله بین رئوس از طریق پیاده روی تصادفی در شبکه اندازه گیری می شود.
Walktrap یک الگوریتم کارآمد است که در پیچیدگی زمانی O(mn²) و در بدترین حالت
پیچیدگی فضای O(n²) اجرا می شود. اما در بیشتر سناریوهای دنیای واقعی، Walktrap در
O((n²) log n) پیچیدگی زمانی و O(n²) پیچیدگی فضایی اجرا می شود. شهود اصلی این الگوریتم
این است که پیادهرویهای تصادفی روی یک گراف/شبکه تمایل دارند در بخشهای بهم پیوسته
مرتبط با جوامع به دام بیفتند. Walktrap از نتیجه پیاده روی تصادفی برای ادغام جوامع جداگانه
به روشی از پایین به بالا استفاده می کند. کیفیت پارتیشن ها را می توان با استفاده از هر معیار
کیفیت موجود ارزیابی کرد. این می تواند مانند ماژولار بودن در تشخیص جامعه Louvain
یا هر معیار دیگری باشد.استفاده از الگوریتم تشخیص جامعه Walktrap با استفاده از کتابخانه
cdlib پایتون در زیر آورده شده است.
from cdlib import algorithmsimport networkx as nxG = nx.karate_club_graph()coms = algorithms.walktrap(G)
نتیجه
تشخیص جامعه در درک و ارزیابی ساختار شبکه های بزرگ و پیچیده بسیار کاربردی است.
این رویکرد از ویژگیهای لبهها در نمودارها یا شبکهها استفاده میکند و از این رو
برای تحلیل شبکه به جای رویکرد خوشهبندی مناسبتر است. الگوریتم های خوشه بندی تمایل دارند
تا گره های محیطی منفرد را از جوامعی که باید به آن تعلق داشته باشند جدا کنند. الگوریتم های
مختلفی برای تشخیص جامعه شبکه پیشنهاد و پیاده سازی شده است. هر یک از اینها بسته به ماهیت
شبکه و همچنین دامنه مشکل اعمال شده دارای مزایا و معایب مختلفی هستند.
References