فایل الگوریتم طبقه بندی k-نزدیک ترین همسایه فازی داده برای محرمانگی در محاسبات ابری
دسته بندي :
کالاهای دیجیتال »
رشته کامپیوتر و IT (آموزش_و_پژوهش)
این پایان نامه در قالب فرمت word قابل ویرایش ، آماده پرینت و ارائه به عنوان پروژه پایانی میباشد.
فهرست مطالب
عنوان صفحه
چکیده: 1
فصل اول: مقدمه 2
1-1 مقدمه 2
1-2 تعریف مساله و بیان سوال¬های اصلی تحقیق 3
1-3 سابقه وضرورت انجام تحقیق 4
1-4 هدف¬ها 8
1-5 جنبه نوآوری تحقیق: 9
1-6 مراحل انجام تحقیق 9
1-7 ساختار پایان¬نامه 9
فصل دوم: مباحث عمومی پردازش ابری، امنیت و شبیه¬سازی 10
2-1 مقدمه 10
2-2 تاریخچه¬ی مختصری از رایانش ابری 11
2-3 وضعیت کنونی رایانش ابری 12
2-4 خصوصیات رایانش ابری 13
2-4-1 ویژگی کلیدی رایانش ابری 17
2-4-2 مزایای اصلی رایانش ابری 18
2-4-3 کارهای امکان¬پذیر در رایانش ابری. 18
2-5 معماری رایانش ابری 19
2-6 امنیت و چالشهای رایانش ابری 21
2-7 امنیت در رایانش ابری 22
2-8 نقاط ضعف رایانش ابری 22
2-8-1 نیاز به اتصال دائمی اینترنت 22
2-8-2 کار نکردن با اینترنت کم سرعت 23
2-8-3 حفظ حریم خصوصی 23
2-9 معایب امنیتی در محیط¬های ابری 23
2-9-1 موقعیت داده 24
2-9-2 تفکیک داده¬ها 24
2-10 تامین امنیت داده¬ها 24
2-10-1 کنترل و دسترسی 25
2-10-2 رمزگذاری 25
2-11 مقدمه¬ای بر شبیه¬سازی 26
2-12 برخی نرم¬افزارهای شبیه¬سازی شبکه¬های محاسباتی 28
2-13 آشنایی با ابزار کلودسیم 29
2-13-1معماری کلودسیم 30
2-14 مدل¬های تخصیص ماشینهای مجازی 31
2-15 کلاس¬های موجود در کلودسیم 32
2-16 جمع¬بندی 35
فصل سوم: مروری بر کارهای گذشته والگوریتم¬های رمزنگاری 37
3-1 مقدمه 37
3-2 معرفی روش 38
3-3 سوابق کاری گذشته 39
3-4 اهداف روش 41
3-5 طبقه¬بندی داده¬ها 42
3-5-1 یادگیری ماشین 42
3-6 تعریف داده حساس و غیرحساس 46
3-7 طبقه¬بند-Kنزدیک¬ترین همسایه 48
3-8 رمزنگاری با روشRSA 49
3-9 رمز و رمزنگاری 49
3-9-1 الگوریتم¬های رمزنگاری 50
3-10 آراس¬ای 52
3-10-1 مراحل الگوریتم RSA 51
3-11 استاندارد رمزنگاری پیشرفته 54
3-11-1 شرح رمزنگاری 55
3-12جمع¬بندی 56
فصل چهارم: معرفی روش پیشنهادی 57
4-1 مقدمه 57
4-2 معرفی روش جدید -Kنزدیک¬ترین همسایه فازی برای طبقه-بندی داده در محاسبات ابری 58
1-4-2 نظریه مجموعه¬های فازی 58
4-3 تفاوت در نتایج حاصله از الگوریتم¬های طبقه¬بندی 58
4-4 چهارچوب مورد استفاده 59
4-5 روش پیشنهادی 59
4-5-1 داده آموزشی و داده تست 61
4-5-2 ذخیره در ابر 62
4-5-3 روش کار الگوریتمKNN 62
4-5-4 روش کار الگوریتمF-KNN 64
6-4 جمع¬بندی 66
فصل پنجم:آزمایش¬ها و ارزیابی نتایج 67
5-1 مقدمه 67
5-2 جایگاه داده آزمایش ومحیط پیاده سازی واجرا 68
5-3 مقایسه نتایج بدست آمده از الگوریتم -K نزدیک¬ترین همسایه عادی و فازی 72
5-4 خصوصیات لایه نرم افزار به عنوان سرویس 76
5-5 خصوصیات لایه پلتفرم به عنوان سرویس برای مدیریت مجازی 77
5-6 خصوصیات لایه زیرساخت به عنوان سرویس در شبیه¬سازی ابر 78
5-7 نرخ شناسایی 79
5-8 نتایج شبیه¬سازی 80
5-9 زمان شبیه¬سازی مراحل کار 81
5-10 جمع¬بندی 83
فصل ششم:نتیجه¬گیری و پیشنهادها 84
6-1 مقدمه 84
6-2 نتایج حاصل از تحقیق 84
6-3 پیشنهادها 85
مراجع: 86
واژه¬نامه انگلیسی 89
چکیده انگلیسی ................................................................................................................................93
فهرست جدول
عنوان صفحه
جدول2-1 مقایسه محاسبات ابری و محاسبات توری 13
جدول 2-2کلاس¬های پهنای¬باند 30
جدول 2-3 کلاس¬های تکه¬ابر 31
جدول5-1 کلاس های برنامه 69
جدول 5-1 تعداد آیتم های تکه ابر الگوریتم KNN و F-KNN 73
جدول 5-2 خصوصیات لایه نرم افزار به عنوان سرویس الگوریتم KNN 76
جدول 5-3 خصوصیات لایه نرم افزار به عنوان سرویس الگوریتم F-KNN 76
جدول 5-4 خصوصیات لایه پلتفرم به عنوان سرویس الگوریتمKNN 77
جدول 5-5 خصوصیات لایه پلتفرم به عنوان سرویس الگوریتم F-KNN 77
جدول 5-6خصوصیات لایه زیرساخت به عنوان سرویس الگوریتم KNN 78
جدول 5-7 خصوصیات لایه زیرساخت به عنوان سرویس الگوریتم F-KNN 78
جدول 5-8 اطلاعات طبقه بندی داده در الگوریتم KNN 79
جدول 5-9 اطلاعات طبقه بندی داده در الگوریتم F-KNN 79
جدول 5-10 نتایج زمانی شبیه سازی طبقه¬بندی داده¬ها با الگوریتم KNN 80
جدول 5-11 نتایج زمانی شبیه سازی طبقه¬بندی داده¬ها با الگوریتم F-KNN 80
جدول 5-12 زمان شبیه سازی مراحل کار الگوریتم KNN 81
جدول 5-13 زمان شبیه سازی مراحل کار الگوریتم F-KNN 81
فهرست اشکال
عنوان صفحه
شکل 2-1 سرویس¬های رایانش ابری 14
شکل 2-2 پشتیبانی از بستر ناهمگن 16
شکل 2-3 معماری محاسبات ابری. 19
شکل 3-1 فلوچارت یادگیری ماشین 43
شکل 3-2 رمزنگاری به شیوه پیچیدن تکه کاغذی دور استوانه 46
شکل3-3 تقسیم بندی الگوریتم¬ها رمزنگاری 47
شکل3-4 رمزنگاری با کلید متقارن 47
شکل3-5 رمزنگاری با کلید نا متقارن 47
شکل3-6 ابداع کنندگان رمزنگاری RSA 49
شکل3-7 پروتکل تبادل رمز دیفی ـ هلمن 50
شکل 4-1 فلوچارت کلی روش 60
شکل4-2 نمودار توصیفی الگوریتم¬های فازی 64
شکل 4-3 شبه¬کد الگوریتم F-KNN ................................................................................................65
شکل 5-1 فلوچارت الگوریتم های طبقه بندی 72
شکل 5-2 محیط شبیه¬سازی با الگوریتم KNN و F-KNN 74
فهرست علائم اختصاری
واحد پردازشگر مرکزی CPU (Central processing untiy)
اتحادیه امنیت پردازش ابری CSA (Cloud Security Alliance)
حفاظت به عنوان یک سرویس DPaasS (Data Protection as a Service)
آژانس امنیت شبکه و اطلاعات اروپا ENISA (European Union Agency for Network and Information Security)
الگوریتم k نزدیکترین همسایه فازی FKNN (Fuzzy Nearest Neighbor Algorithm)
زیرساخت به عنوان سرویس IaaS (Infrastructure as a Service)
انجمن نظارت و کنترل سیستم های اطلاعاتی ISACA (Information System Audit and Control Association)
الگوریتم k نزدیکترین همسایه KNN (K-Nearest Neighbor Algorithm)
یادگیری ماشین ML (Machine Learning)
سکو به عنوان سرویس PaaS (Platform as a Service)
نرم افزار به عنوان سرویس SaaS (Software as a Service)
سرویس و زیرساخت SLAS (Service Level Agreement)
ماشین مجازی VM (Virtual Machine)
چکیده:
پردازش ابری و محیط ابر و پایگاه داده¬های ابری محل ذخیره-سازی اطلاعات روی وب می¬باشد و برای بالا بردن امنیت در آن ها باید بهترین راه حل را استفاده کرد. مساله ما در اینجا طبقه¬بندی داده¬های محرمانه و فوق¬محرمانه و سپس رمزگذاری آن ها برای ذخیره در ابر می¬باشد برای این کار سرعت و دقت بسیار مهم می¬باشد. در این پژوهش یک الگوریتم طبقه¬بندی داده فازی، در محیط ابری استفاده شده است که در نهایت با زبان جاوا و در شبیه¬ساز کلودسیم شبیه¬سازی شد و توانست طبقه¬بندی موثری برای داده¬ها در محیط ابر ایجاد کند.
الگوریتم طبقه¬بند ارایه شده، الگوریتم k-نزدیک¬ترین همسایه فازی است. با توجه به خصوصیات خوبی که الگوریتم k-نزدیک¬ترین همسایه فازی دارد توانست با سرعت و دقت بیشتر داده¬های محرمانه، فوق محرمانه و عمومی را طبقه¬بندی کند و برای رمزگذاری مناسب برای ذخیره سازی در ابر آماده کند و کارایی طبقه¬بندی داده برای ذخیره¬سازی در ابر را بهبود بخشد.
روش کار بدین صورت می باشد که داده¬های یک پایگاه داده 15000 رکوردی ابتدا توسط الگوریتم k-نزدیک¬ترین همسایه عادی طبقه¬بندی می¬شود و داده¬ها به مرحله رمزگذاری فرستاده می¬شوند و در نهایت در ابر ذخیره می¬شوند و در مقابل آن همان پایگاه داده توسط الگوریتم k-نزدیک¬ترین همسایه فازی طبقه¬بندی می¬شود و به سه کلاس فوق محرمانه، محرمانه و عمومی به مرحله بعدی که رمزگذاری و ذخیره در ابر می¬باشد فرستاده می¬شود. در پیاده¬سازی این روش از زبان جاوا و شبیه¬ساز کلودسیم استفاده شده است و نتایج حاصل به خوبی بیانگر کارایی بهتر الگوریتم k-نزدیک¬ترین همسایه فازی می¬باشد که موجب تولید نتایج بهتر نسبت به الگوریتم k-نزدیک¬ترین همسایه عادی می¬شود .
واژه¬های کلیدی:
پردازش ابری، امنیت، طبقه¬بندی k-نزدیک¬ترین همسایه، طبقه-بندی k-نزدیک¬ترین همسایه فازی
فصل اول
مقدمه
1-1 مقدمه
رایانش ابری به عنوان یکی از مشهورترین و داغ¬ترین موضوعات در زمینه فناوری اطلاعات پدیدار گردید. امروزه کاربران اینترنت به وسیله ابزارهای الکترونیکی بسیار سبکی به سرویس¬های آن دسترسی دارند، در چنین حالتی کاربران نیازهای خود را که ممکن است نیازمند پردازش سنگینی باشد برحسب تقاضا درخواست می¬کنند و بدون توجه به حمل سرویس و چگونگی ارائه آن، به مشاهده نتایج بازگردانده شده می¬پردازند. رایانش ابری برپایه TCP/IP و برپایه اینترنت بوده و شامل پردازنده¬ها با حافظه¬های عظیم، شبکه انتقال داده سریع و معماری سیستم¬های قابل اعتماد می¬باشد و بدون پروتکل¬های استاندارد حاکم بر شبکه نمی¬توان موجودیتی به این فناوری بخشید (گونگ، لیو، رانگ، چن، گونگ ، 2010). سرویس¬های این تکنولوژی به 3 دسته عمده تقسیم می شود: زیرساخت به عنوان سرویس ، سکو به عنوان سرویس و نرم¬افزار به عنوان سرویس می¬باشند. رایانش ابری به 5 لایه، مشتری، کاربردی، سکو، زیرساخت و سرورها تقسیم می شوند. تحمل خطای فوق العاده این فناوری، وفق پذیری آن با زیرساخت شبکه افزایش می¬دهد. ویژگی کاربرد آسان آن، تمام پیچیدگی سرویس¬ها را مخفی کرده و کاربران را با رابطی ساده به مرکز داده متصل می¬کند. مجازی¬سازی و امنیت بالا نیز از خصوصیات دیگر این تکنولوژی می¬باشد (ریکیاکس، پالیز، کاتاسرس، مهرا، وکالی ، 2009).
با توجه به اهمیت زیاد فرایند پردازش¬های ابری و مبحث امنیت آن، در این تحقیق سعی بر این است تا طبقه¬بندی داده-های محرمانه با استفاده از الگوریتم طبقه¬بندی نزدیک¬ترین همسایه فازی به این مهم دست یابیم. در این بخش به تعریف مساله و معرفی ایده خود خواهیم پرداخت.
1-2 تعریف مساله و بیان سوال¬های اصلی تحقیق
طبق تعریف موسسه ملی استاندارد و فناوری (NIST) رایانش ابری مدلی است برای فراهم کردن دسترسی آسان براساس تقاضا کاربر، از طریق شبکه به مجموعه¬ای از منابع رایانش قابل تغییر و پیکربندی (مثل سرورها، شبکه¬ها، فضاهای ذخیره¬سازی، برنامه¬های کاربردی و سرویس¬ها) که این دسترسی بتواند با کمترین نیاز به مدیریت منابع و یا نیاز به دخالت مستقیم فراهم کننده سرویس به سرعت فراهم شده یا آزاد گردد (کچین، هس ، 2010).
محاسبات ابری ساختاری است که به ما امکان می¬دهد تا به برنامه¬های کاربردی دسترسی داشته باشیم که در مکانی غیر از کامپیوترها یا در دیگر ماشین¬های متصل به اینترنت قرار دارند. اکثر مواقع این مکان یک مرکز داده از راه دور می-باشد. محاسبات ابری حذف¬های عملیاتی و سرمایه¬ایی را نوید می¬دهد و مهم¬تر اینکه به بخش¬های IT امکان می¬دهد تا به¬جای حفظ اجرای مرکز داده¬ها، بر روی پروژه¬های استراتژیک متمرکز گردند. هزینه مدیریت منابع بسیار بیشتر از هزینه واقعی خود منابع است پس بهتر است منابع را از طریق ابر از صاحب منبع اجاره کرد.