دانلود مقالات و پایان نامه ها با موضوع مدیریت دانش مشتریان بانک مهر اقتصاد با استفاده ... |
![]() |
۳-۲-۵-۱-۲- محدودیتهای الگوریتم K-Means
K-Means زمانی که خوشهها از لحاظ اندازه و چگالی متفاوت و اشکال غیر کروی داشته باشند محدودیتهایی خواهد داشت. همچنین این الگوریتم زمانی که دادهها حاوی مقادیر پرت باشند با مشکل مواجه خواهد شد.
علیرغم اینکه خاتمه پذیری الگوریتم بالا تضمین شده است ولی جواب نهایی آن واحد نبوده و همواره جوابی بهینه نیست. به طور کلی روش ساده بالا دارای مشکلات زیر است:
-
- جواب نهایی به انتخاب خوشههای اولیه وابستگی دارد.
-
- اگر در تکراری از الگوریتم تعداد دادههای متعلق به خوشهای صفر شد راهی برای تغییر و بهبود ادامه روش وجود ندارد.
-
- در این روش فرض شده است که تعداد خوشهها از ابتدا مشخص است. اما معمولاً در کاربردهای زیادی تعداد خوشهها مشخص نیست [۳۱].
۳-۲-۵-۲- خوشهبندی به روش WK-Means[147]
در خوشهبندی با الگوریتم K-Means ارزش همه دادهها یکسان در نظر گرفته می شود که این مسئله یکی از نقاط ضعف این الگوریتم شناخته می شود. در روش WK-Means سعی شده با وزن دهی متغیرها بر اساس اهمیت نسبی آنها این ضعف را تعدیل نماید.
در الگوریتم W-K-Means به دادهها بر اساس اهمیت وزن داده میشود یعنی اگر دادههایمان x1،x2،…،xn باشد به ترتیب وزن w1،w2،…،wn میگیرند. این رویکرد میتواند تا حد زیادی با مقدار اولیه وزن، کیفیت خوشهای را تحت تأثیر قرار دهد. پس از آماده سازی دادهها، وزن دادهها برای ارائه اطلاعات بیشتر برای الگوریتم W-K-Means در جهت بهبود دقت طراحی میشوند.
مراحل انجام کار در این الگوریتم مانند الگوریتم K-Means است. تنها تفاوت آنها در محاسبه میانگین میباشد. در الگوریتم W-K-Means میانگین به صورت زیر محاسبه میگردد.
(۳-۶) | = |
که در آن Xi دادههای ورودی، K، تعداد خوشهها و Wi وزن هر یک از این دادهها میباشد. با این فرمول مرکز خوشهها مشخص میشود و دادهها در خوشهای قرار میگیرد که کمتری فاصله را تا مرکز خوشهها دارد، بقیه مراحل مانند الگوریتم K-Means تکرار میشود.
الگوریتم خوشهبندی به روش w-K-means |
|
۳-۲-۵-۳- خوشهبندی به روش A-H-Means[148]
خوشهبندی K-Means یک روش ساده و سریع است که به دلیل پیادهسازی آسان و تعداد تکرار کم، عموماً مورد استفاده قرار میگیرد. الگوریتم K-Means در تلاش برای یافتن مراکز خوشههای (c1,c2,…,ck) به گونهای عمل میکند که مجموع مربعات فاصلهی هر نقطه xi تا نزدیکترین مرکز خوشه (cj) کمترین شود. وابستگی کارایی K-Means روی مقداردهی اولیه مراکز، یک مشکل اصلی این الگوریتم میباشد. در این الگوریتم ارتباطی قوی بین نقاط داده و نزدیکترین مراکز خوشه برقرار شده و باعث میشود مراکز خوشهها از محدودهی تراکم محلی دادهها خارج نشوند. روش K-harmonic means این مشکل عمده را از طریق جایگزینی کمترین فاصله یک نقطه از مراکز که در K-Means استفاده میشود با میانگین هارمونیک[۱۴۹] فاصله هر نقطه تا تمامی مراکز برطرف میکند. میانگین هارمونیک یک امتیاز مناسبی را به هر نقطهی داده بر اساس نزدیکی آن به هر مرکز میدهد که این امر را به عنوان یک ویژگی میانگین هارمونیک در نظر میگیرند.
روش A-H-Means، یک روش میانگینگیری بسط یافته است که به ازای مقادیر مختلف Q سایر روشهای محاسبه میانگین را نیز نتیجه خواهد داد.
نمادهای زیر برای فرمولبندی الگوریتم A-harmonic means استفاده میشود:
X= {x1,x2,…,xn}: دادهای که باید خوشهبندی شود.
C={c1,c2,…,cK}: مجموعه مراکز خوشهها.
فرم در حال بارگذاری ...
[شنبه 1400-08-22] [ 04:11:00 ب.ظ ]
|