فایل بررسی مدل مبتنی بر خصیصه جهت تحلیل احساس موجود در نوشتجات

دسته بندي : دیجیتال فایل » رشته کامپیوتر و IT (آموزش_و_پژوهش)

جزئیات و دریافت

این پایان نامه در قالب فرمت word قابل ویرایش ، آماده پرینت و ارائه به عنوان پروژه پایانی میباشد

فهرست مطالب

فصل اول پیشگفتار. 1

1-1- مقدمه. 2

1-3- تحلیل احساس در متن. 6

1-4- اهداف رساله. 8

1-5- روش کار. 9

1-6- ساختار پایان نامه. 9

فصل دوم کارهای انجام شده 10

2-1- مقدمه. 11

2-2- تعریف مسئله. 11

2-3- گام اول تحلیل احساس در متن. 12

2-4- روش‌های مبتنی بر خصیصه‌های N-gram.. 13

2-5- الگوریتم‌های انتخاب خصیصه. 18

فصل سوم روش پیشنهادی. 22

3-1- پیش گفتار. 23

3-2- منابع مورد نیاز. 23

3-3- روش پیشنهادی اول. 25

3-3-1. پیش پردازش اسناد 26

3-3-2. برچسب گذاری ادات سخن. 29

3-3-3. استخراج بردار خصیصه‌ها و ترکیب خصیصه‌ها 30

3-3-4. اعمال الگوریتم انتخاب خصیصه. 33

3-4- روش پیشنهادی دوم 34

3-5- روش پیشنهادی سوم 37

3-5-1. استخراج پلاریته کلمات و فیلتر بردار خصیصه. 38

فصل چهارم پیاده سازی و نتایج گرفته شده 47

4-1- مقدمه. 48

4-2- مجموعه داده‌ها 48

4-3- طبقه‌بندی داده‌ها 48

4-4- نتایج روش اول. 49

4-5- نتایج روش دوم 52

4-6- نتایج روش سوم 53

4-7- مقایسه روش پیشنهادی با روش‌های قبل. 53

8-4- نتایج اعمال روش پیشنهادی برای زبان فارسی..........................................................................................................................54

4-9- کارهای آینده 58

مراجع و منابع. 59

فهرست الگوریتم ها

Algorithm 1 Documents_To_model. 33

Algorithm 2 Documents_To_model2. 35

Algorithm 3 Polarity_Filter. 40

فهرست تصاویر

شکل 1-1 دسته بندی متون.................................................................................... 5

شکل 1-2 تحلیلگر احساس در سطح کلمه................................................................... 7

شکل 1-3 تحلیلگر احساس در سطح جمله................................................................... 7

شکل 1-4 تحلیلگر احساس در سطح سند.................................................................... 8

شکل 2-1 مهمترین الگوریتم های انتخاب خصیصه تک متغیره........................................ 19

شکل 2-2 مهمترین روش های انتخاب خصیصه چند متغیره............................................ 21

شکل 3-1 Sentiwordnet............................................................................. 22

شکل 3-2 شمای کلی روش پیشنهادی اول................................................................ 26

شکل 3-3 شمای پیش پردازش اسناد....................................................................... 27

شکل3-4 برچسب گذار استنفورد............................................................................ 30

شکل3-5 مجموعه خصیصه‌های پیشنهادی برای تحلیل احساس....................................... 32

شکل 3-6 شمای کلی روش پیشنهادی دوم................................................................ 36

شکل 3-7 شمای کلی روش سوم............................................................................ 38

شکل3-8 شمای کلی روش پیشنهادی..................................................................... 43

شکل3-9 برچسب گذار زبان فارسی........................................................................ 44

شکل3-10 مجموعه خصیصه‌های پیشنهادی برای تحلیل احساس متون فارسی..................... 45

فهرست جداول

جدول 2-1 مجموعه خصیصه‌ها N-gram و مثال برای هر خصیصه. 15

جدول 2-2 مجموعه کاملی از خصیصه ها N-gram.. 16

جدول 3-1 لیست Stopwords. 28

جدول 3-2 مثال برای رفع ابهام با استفاده از برچسب ادات سخن. 31

جدول 3-3 کلمات هم معنای great. 35

جدول 3-3 محاسبه تفاضل نسبی پلاریتی کلمات. 39

جدول 3-5 مثال خصیصه استخراج شده از متن. 45

جدول 4-1 مجموعه داده های مورد استفاده در این رساله. 49

جدول 4-2 تعداد خصیصه‌های پس از اعمال الگوریتم انتخاب خصیصه. 50

جدول 4-3 مقایسه روش های پیشنهادی. 50

جدول 4-4 مقایسه نتایج روش پیشنهادی با روش پیشین. 52

جدول 4-5 تعداد کل خصیصه ها بدون اعمال الگوریتم انتخاب خصیصه. 53

جدول 4-6 مقایسه نتایج روش پیشنهادی با روش ارائه شده توسط عباسی و همکارانش.. 54

جدول 4-7 مقایسه نتایج روش پیشنهادی با روش ارائه شده توسط آگاروال و میتال. 54

جدول4-8- نتایج طبقه‌بندی متون فارسی. 57

مقدمه

برخی نویسندگان داده کاوی را به عنوان ابزاری برای جستجو کردن اطلاعات سودمند در حجم زیادی از داده ها تعریف می کنند. برای انجام فرایند داده کاوی با زمینه های گوناگون تحقیقی مواجه می‌شویم، مانند پایگاه داده، یادگیری ماشین و آمار. پایگاه داده‌ها برای تحلیل کردن حجم زیادی از داده‌ها ضروری هستند. یادگیری ماشین، یک ناحیه هوش مصنوعی است که با ایجاد تکنیک‌هایی امکان یادگیری به وسیله تحلیل مجموعه‌های داده‌ای را به کامپیوترها می‌دهند. تمرکز این روش‌ها روی داده سمبولیک است و با آنالیز داده‌های تجربی سر و کار دارد. پایه آن تئوری آماری است. در این تئوری عدم قطعیت و شانس به وسیله تئوری احتمال مدل می‌شوند. امروزه بسیاری از روش‌های آماری در زمینه داده کاوی استفاده می‌شوند. می‌توان گفت که متن کاوی از تکنیک‌های بازیابی اطلاعات، استخراج اطلاعات همچنین پردازش کردن زبان طبیعی استفاده می‌کند و آن‌ها را به الگوریتم‌ها و متدهای داده کاوی، یادگیری ماشین و آماری مرتبط می‌کند. با توجه به ناحیه‌های تحقیق گوناگون، بر هر یک از آن‌ها می‌توان تعاریف مختلفی از متن کاوی در نظر گرفت در ادامه برخی از این تعاریف بیان می‌شوند:

متن کاوی = استخراج اطلاعات: در این تعریف متن کاوی متناظر با استخراج اطلاعات در نظر گرفته می‌شود (استخراج واقعیت‌ها از متن).

متن کاوی = کشف داده متنی: متن کاوی را می‌توان به عنوان متدها و الگوریتم‌هایی از فیلدهای یادگیری ماشین و آماری برای متن‌ها با هدف پیدا کردن الگوهای مفید در نظر گرفت. برای این هدف پیش پردازش کردن متون ضروری است. در بسیاری از روش‌ها، متدهای استخراج اطلاعات، پردازش کردن زبان طبیعی یا برخی پیش پردازش‌های ساده برای استخراج داده از متون استفاده می‌شود، سپس می‌توان الگوریتم‌های داده کاوی را بر روی داده‌های استخراج شده اعمال کرد.

متن کاوی = فرایند استخراج دانش: که در بخش قبلی به طور کامل توضیح داده شده است و در اینجا دیگر بیان نمی‌شود. در این تحقیق ما بیشتر متن کاوی را به عنوان کشف داده متنی در نظر می‌گیریم و بیشتر بر روی روش‌های استخراج الگوهای مفید از متن برای دسته‌بندی مجموعه‌ های متنی یا استخراج اطلاعات مفید، تمرکز می‌کنیم.

در دنياي کنوني مشکل کمبود اطلاعات نيست، بلکه مشکل کمبود دانشي است که از اين اطلاعات مي توان بدست آورد. ميليونها صفحه ي وب، ميليونها کلمه در کتابخانه‌هاي ديجيتال و هزاران صفحه اطلاعات در هر شرکت، تنها چند دست از اين منابع اطلاعاتي هستند. اما نمي‌توان به طور مشخص منبعي از دانش را در اين بين معرفي کرد. دانش خلاصه‌ي اطلاعات است و نيز نتيجه گيري و حاصل فکر و تحليل بر روي اطلاعات.

داده کاوي، يک روش بسيار کارا براي کشف اطلاعات از داده‌هاي ساختيافته‌اي که در جداول نگهداري مي‌شوند، است. داده کاوي، الگوها را از تراکنش‌ها، استخراج مي‌کند، داده را گروه‌بندي مي‌کند و نيز آنرا دسته‌بندي مي‌کند. بوسيله‌ي داده کاوي مي‌توانيم به روابط ميان اقلام داده‌اي که پایگاه داده را پر کرده‌اند، پي ببريم. در عين حال ما با داده کاوي مشکلي داريم و آن عدم وجود عاميت در کاربرد آن است. بيشتر دانش ما اگر به صورت غير ديجيتال نباشند، کاملاً غير ساختيافته اند. کتابخانه‌هاي ديجيتال، اخبار، کتابهاي الکترونيکي، بسياري از مدارک مالي، مقالات علمي و تقريباً هر چيزي که شما مي‌توانيد در داخل وب بيابيد، ساختيافته نيستند. در نتيجه ما نمي‌توانيم آموزه‌هاي داده کاوي را در مورد آنها به طور مستقيم استفاده کنيم. با اين حال، سه روش اساسي در مواجهه با اين حجم وسيع از اطلاعات غير ساختيافته وجود دارد که عبارتند از: بازيابي اطلاعات، استخراج اطلاعات و پردازش زبان طبیعی.

بازیابی اطلاعات: اصولاً مرتبط است با بازيابي مستندات و مدارک. کار معمول دربازیابی اطلاعات اين است که با توجه به نياز مطرح شده از سوي کاربر، مرتبط ترين متون و مستندات و يا در واقع بقچه‌ي کلمه را ازميان ديگر مستندات يک مجموعه بيرون بکشد. اين يافتن دانش نيست بلکه تنها آن بقچه‌اي از کلمات را که به نظرش مرتبط‌تر به نياز اطلاعاتي جستجوگر است را به او تحويل مي‌دهد. اين روش به واقع دانش و حتي اطلاعاتي را برايمان به ارمغان نمي‌آورد.

پردازش زبان طبیعی: هدف کلی پردازش زبان طبیعی رسیدن به یک درک بهتر از زبان طبیعی توسط کامپیوترهاست. تکنیک‌های مستحکم و ساده‌ای برای پردازش کردن سریع متن به کار می‌روند. همچنین از تکنیک‌های آنالیز زبان شناسی نیز برای پردازش کردن متن استفاده می‌شود.

استخراج اطلاعات: هدف روش‌های استخراج اطلاعات، استخراج اطلاعات خاص از سندهای متنی است. استخراج اطلاعات مي‌تواند به عنوان يک فاز پيش پردازش در متن‌کاوی بکار برود. استخراج اطلاعات عبارتند از نگاشت کردن متن‌های زبان طبیعی (مثلا گزارش‌ها، مقالات journal، روزنامه‌ها، ایمیل‌ها، صفحات وب، هر پایگاه داده متنی و.....) به یک نمایش ساختیافته و از پیش تعریف شده یا قالب‌هایی که وقتی پر می‌شوند، منتخبی از اطلاعات کلیدی از متن اصلی را نشان می‌دهند. یکبار اطلاعات استخراج شده و سپس اطلاعات می‌توانند در پایگاه داده برای استفاده‌های آینده، ذخیره شوند.

دسته بندی: دیجیتال فایل » رشته کامپیوتر و IT (آموزش_و_پژوهش)

تعداد مشاهده: 4149 مشاهده

فرمت فایل دانلودی:.docx

فرمت فایل اصلی: docx

تعداد صفحات: 85

حجم فایل:1,995 کیلوبایت

قیمت : 55,000 تومان
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود. پرداخت و دریافت فایل

دسته بندی

نمونه سوالات

کنکور سراسری کنکور ارشد و دکتری کامپیوتر ویژوال بیسیک وزارت نیرو وزارت نیرو وردپرس نمونه سوالات نظام مهندسی موبایل و اندروید مصاحبه حضوری گوناگون طراحی وب شهرداری شهرداری شرکت نفت شرکت نفت شرکت گاز شرکت گاز سی شارپ 🔺سایر رشته کشاورزی و محیط زیست (کتب_و_جزوات) رشته کشاورزی و محیط زیست (کارآموزی_و_گزارشات) رشته کشاورزی و محیط زیست (مقالات_و_تحقیقات) رشته کشاورزی و محیط زیست (آموزش_و_پژوهش) رشته کتابداری (آموزش_و_پژوهش) رشته کامپیوتر و IT (کارآموزی_و_گزارشات) رشته کامپیوتر و IT (مقالات_و_تحقیقات) رشته کامپیوتر و IT (آموزش_و_پژوهش) رشته هنر و گرافیک (کارآموزی_و_گزارشات) رشته هنر و گرافیک (آموزش_و_پژوهش) رشته نفت (کارآموزی_و_گزارشات) رشته نفت (آموزش_و_پژوهش) رشته نساجی (آموزش_و_پژوهش) رشته مکانیک (کارآموزی_و_گزارشات) رشته مکانیک (آموزش_و_پژوهش) رشته مکانیک (نظام_مهندسی) رشته مواد و متالوژی و معدن (کارآموزی_و_گزارشات) رشته مواد و متالورژی (آموزش_و_پژوهش) رشته مهندسی معدن (آموزش_و_پژوهش) رشته مهندسی شیلات (آموزش_و_پژوهش) رشته مهندسی پزشکی (آموزش_و_پژوهش) رشته مهندسی بهداشت (کتب_و_جزوات) رشته مهندسی آب و هواشناسي (کارآموزی_و_گزارشات) رشته مهندسی آب (کتب_و_جزوات) رشته معماری (کارآموزی_و_گزارشات) رشته معماری (آموزش_و_پژوهش) رشته معماری (نظام_مهندسی) رشته معارف اسلامی (آموزش_و_پژوهش) رشته مدیریت (کارآموزی_و_گزارشات) رشته مدیریت (مقالات_و_تحقیقات) رشته مدیریت (آموزش_و_پژوهش) رشته مامایی (آموزش_و_پژوهش) رشته فیزیک (آموزش_و_پژوهش) رشته فلسفه و منطق (آموزش_و_پژوهش) رشته عمران و نقشه برداری (کارآموزی_و_گزارشات) رشته عمران و نقشه برداری (نظام_مهندسی) رشته عمران و نقشه برداری (مقالات_و_تحقیقات) رشته عمران و نقشه برداری (آموزش_و_پژوهش) رشته علوم نجوم (آموزش_و_پژوهش) رشته علوم سیاسی (آموزش_و_پژوهش) رشته علوم دامی (آموزش_و_پژوهش) رشته علوم تربیتی (کارآموزی_و_گزارشات) رشته علوم تربیتی (آموزش_و_پژوهش) رشته علوم اجتماعی (مقالات_و_تحقیقات) رشته علوم اجتماعی (آموزش_و_پژوهش) رشته طراحی (کتب_و_جزوات) رشته صنایع غذایی (آموزش_و_پژوهش) رشته صنایع (کارآموزی_و_گزارشات) رشته صنایع (آموزش_و_پژوهش) رشته شیمی (کارآموزی_و_گزارشات) رشته شیمی (آموزش_و_پژوهش) رشته شهرسازی (آموزش_و_پژوهش) رشته زیست شناسی (آموزش_و_پژوهش) رشته زمین شناسی (آموزش_و_پژوهش) رشته زبانهای خارجه (آموزش_و_پژوهش) رشته ریاضی (آموزش_و_پژوهش) رشته روانشناسی و مشاوره (مقالات_و_تحقیقات) رشته روانشناسی و مشاوره (آموزش_و_پژوهش) رشته دندانپزشکی (آموزش_و_پژوهش) رشته داروسازی (کارآموزی_و_گزارشات) رشته داروسازی (آموزش_و_پژوهش) رشته حقوق (کارآموزی_و_گزارشات) رشته حقوق (آموزش_و_پژوهش) رشته حسابداری (کارآموزی_و_گزارشات) رشته حسابداری (مقالات_و_تحقیقات) رشته حسابداری (آموزش_و_پژوهش) رشته جغرافیا (آموزش_و_پژوهش) رشته تغذیه (آموزش_و_پژوهش) رشته تربیت بدنی (آموزش_و_پژوهش) رشته تاریخ (آموزش_و_پژوهش) رشته پزشکی و پرستاری (کارآموزی_و_گزارشات) رشته پزشکی (مقالات_و_تحقیقات) رشته پزشکی (آموزش_و_پژوهش) رشته پرستاری (آموزش_و_پژوهش) رشته بیمه و بانکداری (آموزش_و_پژوهش) رشته بهداشت (آموزش_و_پژوهش) رشته برق و مخابرات (کارآموزی_و_گزارشات) رشته برق و مخابرات (نظام_مهندسی) رشته برق و مخابرات (مقالات_و_تحقیقات) رشته برق و مخابرات (آموزش_و_پژوهش) رشته انیمیشن (آموزش_و_پژوهش) رشته اقتصاد (آموزش_و_پژوهش) رشته ادبیات (آموزش_و_پژوهش) رشته آمار (آموزش_و_پژوهش) دیگر دلفی دستگاه های اجرایی 🔺درسی جاوا 🔺ترجمه و تحقیق پیام نور پکیج استخدامی بانک ها پروژه های کارآموزی پروژه های کارآفرینی پروژه های طرح توجیهی کشاورزی و دامپروری پروژه های طرح توجیهی صنعتی و کار پروژه های طرح توجیهی دارویی و پزشکی پروژه های طرح توجیهی خوراک و صنایع غذایی پروژه های طرح توجیهی خدماتی پروژه های طرح توجیهی تولیدی 🔺پروژه های آموزشی پایتون 🔺پاورپوینت ها بلاکچین بسته مصاحبه حضوری بسته استخدامی عمومی بسته ICDL بانک ها امتحانات نهایی اسکریپت اسمبلی استخدامی استانداری ادبیات-داستان-شعر-رمان-کتاب آیین نامه رانندگی Visual Basic.net SQL Server PHP Matlab ICDL HTML HTML C و C++ ASP.net Android

نظام مهندسی

نرم افزارها و برنامه ها

قالب و پلاگین

سوالات و جزوات

🔺سایر

زبان برنامه نویسی و اسکریپت

دیجیتال فایل

🔺ترجمه و تحقیق

پروژه های کارآموزی

پروژه های کارآفرینی

فایل بررسی مدل مبتنی بر خصیصه جهت تحلیل احساس موجود در نوشتجات

خرید مطمئن

دسته بندی

آخرین محصولات