پایان نامه رشته کامپیوتر : بررسی روش های خوشه بندی توزیعی |
خوشهبندی میشوند.
در سالهای اخیر، پیشنهاداتی برای اكتشاف دانش و كاوش داده ها، و به ویژه برای خوشهبندی گـسترش
یافته اما تنها تعداد كمی از آنها برای منابع داده ای توزیعشده اسـت. در ایـن تحقیـق، یـك مـروری بـر
الگوریتمهای خوشهبندی توزیعی مطرح شدهاست.
مقدمه
امروزه حتی با گسترش وب، كاربران برای یافتن نیازهای خود با مناب ع اطلاعاتی بسیاری مواجه هـستند.
چگونگی یافتن سریع نیازهای كاربر از این اقیانوس اطلاعات، یک مسئله ی مهم است. اگـر چـه راهحـل
استفاده از موتور های جستجو در پایگاه داده های یكتا ظاهرا برای آن كارآمد است ، اما در عمل ایـن راه
حل برای جمع آوری همهی اطلاعات مورد نیاز ، به خـصوص اطلاعـات مـرتبط بـا منـابع مخفـی وب ،
ممكن است مشكلاتی را به دنبال داشته باشد.
كشف دانش در پایگاه داده، كاوش داده ها نامیده میشود و ابزاری ارزشمند برای گزینش اطلاعات مفیـد
از هر پایگاه داده است. این ابزار قابلیت محاسباتی بالایی دارد و میتواند به توزیع و موازیسازی دادههـا
بپردازد. برای مسائل مربوط به كاوش دادههـا ، لازم اسـت تـا بخـشبنـدی هوشـمندانه ای از دادههـا را
بهدست آوریم. بدین طریق ما می توانیم داده ها را به صورت جداگانه بررسی كنیم. به منظـور كمـك بـه
قانونمند كردن مساله، معیار اصلی برای بخشبندی هوشمندانه میتواند این باشد كه داده های درون هر
بخش تا آن جاییكه احتمال دارد ، با هم مشابه باشند، در حالی كه داده های درون بخشهای مختلف بـا
یكدیگر هیچ شباهتی نداشته باشند. این معیار همان چیزی است كه در الگوریتمهای خوشهبندی مـورد
استفاده قرار میگیرد و به ما اجازه میدهد تا برای دستیابی به كـل پایگـاه داده، بـه مـوازیسـازی ایـن
مساله بپردازیم.
در فصل اول این تحقیق، مفاهیم توزیعشدگی بهطور خلاصه مورد بررسی قرار میگیرد. سپس در فـصل
دوم، به بحث در مورد خوشهبندی توزیعی پرداخته میشود. در فصل سوم، الگـوریتمهـای خوشـهبنـدی
مورد بررسی و مطالعه قرار گرفته و بهدنبال آن برخی از كاربردهای خوشهبندی در فصل چهـارم مطـرح
میشوند. در نهایت، در فصل پنجم یک نتیجهگیری كوتاهی از این مباحث به عمل میآید.
مقدمه 1-1
یک سیستم توزیع شده، از یک مجموعه از كامپیوترهای مستقل تشكیل شده است كه كـاربران، آنهـا را
به صورت یک سیستم یكپارچه می بینند.[1]
چند مطلب از تعریف فوق مشخص می شود. اول اینكه در یک سیستم توزیـع شـده، تعـدادی كـامپیوتر
وجود دارد. مطلب دیگر اینكه كاربران سیستم توزیع شده، تصور می كنند كه با یک سیستم واحـد كـار
می كنند. از مجموع این دو نكته می توان فهمید كه اجزای داخل یک سیستم توزیع شده باید به شكلی
با همدیگر تعامل داشته باشند كه بتوانند برای كاربر خود این تصور را ایجاد كنند كه با یک سیستم كار
می كند. اینكه چگونه چنین تعاملی ایجاد شود یک مسأله ی م هم در مبحث سیستم های توزیـع شـده
است.
در واقع هیچ اجباری در مورد نوع كامپیوترهای داخل سیـستم توزیـع شـده، همچنـین در مـورد روش
اتصال بین آنها وجود ندارد. یعنی اینكه نباید این محدودیت ها را كه اجزای این سیـستم هـا یـا اتـصال
بین آنها از نوع خاصی باشند، برای سیستم های توزیع شده در نظر گرفت. از طرفی كاربر این سیستمها
نباید هیچ اطلاع و نگرانی در مورد تفاوت های بین كامپیوترهای مختلف موجود در یک سیـستم توزیـع
شده و روشی كه با هم ارتباط برقرار می كنند، همچنین سازمان داخلی سیستم، داشته باشد . ایـن یـك
ویژگی حیاتی برای سیستم های توزیع شده است كه به آن شـفافیت مـی گوینـد . سیـستمی كـه ایـن
فرم در حال بارگذاری ...
[پنجشنبه 1399-10-04] [ 05:31:00 ب.ظ ]
|