راهنمای نگارش پایان نامه درباره : استفاده ازکاربرانی با دقت پیشگویی بالا در سیستم های ... |
۲-۹-۲- استفاده از امتیازهای نرمال شده
(۸)
توسط فرمول بالا این مسئله در نظر گرفته می شود که کاربران مختلف ممکن است بازههای امتیازدهی متفاوتی برای نشان دادن یک درجه اهمیت داشته باشند. در فیلترینگ اشتراکی مبتنی بر کاربر به طور استاندارد از این فرمول برای پیش بینی استفاده می شود .[۷]
۲-۱۰- مشکلات فیلترینگ اشتراکی
فیلترینگ اشتراکی علاوه بر کاربرد وسیع آن و مزایایی که از آن برخوردار است شامل معایبی نیز میباشد که در ادامه به توضیح تعدادی از آنها میپردازیم.
۲-۱۰-۱- پراکنده بودن داده[۵۰]
وقتی ماتریس کاربران - اقلام پراکنده و سایز آن بزرگ باشد این مشکل به وجود می آید. کاربرانی هستند که به همه اقلام امتیاز ندادهاند و تنها به تعداد کمی از آنها امتیاز دادهاند. بنابراین اقلامی وجود دارند که به اندازه کافی امتیازدهی نشدهاند. در این حالت اندازه گیری شباهت روی تعداد امتیازهای ابراز شده اندکی صورت میپذیرد که قابل اعتماد نمی باشد. یکی از مشکلاتی که به دلیل پراکنده بودن داده به وجود می آید شروع سرد است. یعنی برای کاربری که به تازگی وارد سیستم شده و به اندازه کافی امتیازی به اقلام نداده است نمی توان پیشنهاد قابل اعتمادی ارائه کرد. همچنین قلم جدیدی که وارد سیستم می شود نیز همین مشکل را دارد. اقلامی که به اندازه کافی امتیاز دریافت نکرده اند برای پیشنهاد قابل اعتماد نمیباشند. به عنوان مثال Movielens برای اجتناب از بروز چنین مشکلی برای کاربران جدید شرط امتیاز دهی به حداقل ۱۵ قلم را در نظر گرفته است.
پژوهشهای زیادی برای رفع این مشکل انجام شده است. که بسیاری از آنها از روشهای موجود در مدل محتوا محور برای پر کردن خانههای بدون رتبه ماتریس امتیازدهی استفاده می کنند .[۳۹,۴۰,۴۱,۴۲,۴۳]
۲-۱۰-۲- مقیاس پذیری[۵۱]
با زیاد شدن تعداد کاربران و اقلام منابع محاسباتی برای برطرف کردن درخواستهای جدید با کمبود مواجه می شود.
۲-۱۰-۳- اقلام مشابه[۵۲]
بعضی اقلام شبیه به هم هستند ولی به دلیل تفاوت در نامشان سیستم پیشنهادگر یکسان بودن آنها را نمیتواند تشخیص دهد. بنابراین با آنها به طور متفاوت برخورد می کند.
۲-۱۰-۴- گری شیپ[۵۳]
کاربرانی هستند که سلیقهشان موافق یا مخالف با هیچ گروه از کاربران نمی باشد. بنابراین سیستم پیشنهادگر فیلترینگ اشتراکی نمیتواند هیچ منفعتی به آنها برساند.
۲-۱۱- بررسی چگونگی کارکرد و تولید پیشنهاد سایت آمازون
سایت آمازون یکی از معروفترین سایتهای تجارت الکتونیک میباشد که در سال ۱۹۹۵ فعالیت خود را با فروش بر خط کتاب شروع کرد و اکنون در آن محصولاتی مانند ساعت، کتاب، سی دی، تلویزیون و… به فروش میرسد.
آمازون از متد فیلترینگ اشتراکی استفاده می کند و پیشنهادات را بر اساس اقلام تولید می کند. زیرا تعداد اقلام از تعداد کاربران به نسبت کمتر است. روند کار آمازون به این صورت است که لیست اقلام دیده شده توسط هر کاربر در یک ماتریس ذخیره می شود. سپس با بهره گرفتن از معیار شباهت کسینوس میزان شبیه بودن بردارهای اقلام در این ماتریس محاسبه میگردد. بعد از آن شبیهترین اقلام به اقلامی که کاربر تا کنون دیده است به او پیشنهاد می شود. نسخه سادهای از چگونگی تولید پیشنهاد در (شکل شماره ۸) قابل مشاهده میباشد.
شکل شماره ۸: روند تولید پیشنهاد در آمازون [۴۴]
همانطور که مشاهده میکنید کاربر ۳ اخیرا به سیستم وارد شده و قلمA را مشاهده کرده است. سیستم میزان شباهت بردار قلم َA را با سایر اقلام BوC و D با بهره گرفتن از معیار کسینوس به دست می آورد و شبیهترین اقلام که در اینجا B و C میباشند را به او پیشنهاد می کند.
در (شکل شماره ۹) صفحهای از سایت آمازون قابل مشاهده است. در این صفحه کاربر می تواند با کلیک روی لینک Your Recommendation وارد صفحهای شود که می تواند پیشنهاداتی که به او ارائه می شود را توسط موضوع و خط تولید مورد دلخواهش فیلتر کند. همچنین می تواند محصولاتی که قبلا خریداری نموده یا به او پیشنهاد شده است را امتیازدهی کند[۴۵] .
شکل شماره ۹ : نمونه صفحهای از سایت آمازون[۴۵]
(شکل شماره ۱۰) ارائه پیشنهاد بر اساس کارت خرید مشتری را نشان میدهد. یعنی بر اساس محصولاتی که تا کنون خریداری نموده است برای او پیشنهاد تولید می شود [۴۵].
شکل شماره ۱۰: ارائه پیشنهاد بر اساس کارت خرید مشتری [۴۵]
فصل سوم
روش محتوا محور
۳- روش محتوا محور
۳-۱-پیشگفتار
در این پایان نامه از روش محتوا محور جهت ارتقاء روش فیلترینگ اشتراکی استفاده شده است. روش محتوا محور بر اساس ویژگیهای اقلام تعریف می شود. این روش بررسی می کند که اقلام مورد علاقه کاربر دارای چه خصوصیاتی بوده اند، سپس اقلام دارای خصوصیات مشابه را به او پیشنهاد می کند. محتوای اقلام بر حسب نوع آنها می تواند متفاوت باشد. مثلا ژانر فیلم، نوع کتاب و مختصات جغرافیایی رستوران را به ترتیب به عنوان محتوای اقلام فیلم، کتاب یا رستوران در نظر گرفت. به عنوان مثال اگر اکثر فیلمهایی که کاربر دیده است متعلق به ژانر مستند باشند بدین معناست که او به این گونه فیلمها علاقهمند است.
سیستمهای محتوا محور نیاز به تکنیکی جهت نمایش خصوصیات اقلام، ایجاد نمایه از کاربر بر اساس علاقه مندیهایش و یک استراتژی جهت مقایسه نمایه کاربر با خصوصیات اقلام میباشد.
۳-۲- روند کار روش محتوا محور
روند کار سیستمهای محتوا محور به این صورت است که ابتدا براساس نحوه امتیازدهی کاربر به اقلام مختلف، نمایهای از علائق او ساخته می شود. سپس بر اساس میزان تطابق خصوصیات اقلام با نمایه ساخته شده از کاربر، پیشنهادها به کاربر ارائه می شود.
ساختار سیستمهای پیشنهادگر محتوا محور در شکل زیر نشان داده شده است.
شکل شماره ۱۱: روند کار روش محتوا محور [۲۴]
همانگونه که در شکل بالا قابل مشاهده است روند کار در متد محتوا محور متشکل از سه مرحله به شرح زیر می باشد [۲۴]:
۳-۲-۱- تحلیلگر محتوا (Content Analyzer)
در این مرحله محتوای اقلام نشان داده می شود. بدین منظور معمولا از تکنیکهای بازیابی اطلاعات استفاده می شود. اطلاعات توصیفی سازماندهی نشده مربوط به اقلام از قسمت منبع اطلاعات (Information Source) استخراج شده و در این مرحله سازماندهی می شود. یعنی هر قلم توسط اطلاعات سازماندهی شده نمایش داده می شود. مثلا اگر سیستم پیشنهادگر مربوط به فیلم باشد هر فیلم می تواند توسط ویژگیهای مربوط به بازیگران، کارگردانان و…. نمایش داده شود. یا اگر سیستم پیشنهادگر مربوط به صفحه وب باشد هر صفحه وب می تواند توسط برداری از کلمات کلیدی نمایش داده شود. به این صورت که ریشه کلمات به عنوان خصوصیات و مقدار tf/idf مربوط به هر ریشه به عنوان مقدار آن در نظر گرفته شود.
نتیجه حاصل شده از این مرحله در قسمت اقلام نمایش داده شده
(Represented Items) ذخیره می شود.
۳-۲-۲- یاد گیرنده نمایه (Profile Learner)
در این مرحله بر اساس عکس العملی که کاربر در برابر اقلام مختلف نشان داده و در قسمت بازخورد (Feedback) ذخیره شده است، نمایهای از علائق او ساخته می شود. این کار معمولا توسط تکنیکهای موجود در حوزه یادگیری ماشین انجام می شود.
عکس العملی که کاربر در مقابل اقلام از خود نشان میدهد به دو صورت صریح و ضمنی میباشد. عکس العمل صریح به این صوت است که کاربر علاقه یا عدم علاقه خود نسبت به اقلام را توسط امتیازدهی یا توصیفی کوتاه نشان دهد. در عکس العمل ضمنی کاربر هیچ دخالتی ندارد و خود سیستم توسط کنترل و تحلیل رفتار و فعالیتهای کاربر، علائق او را استخراج می کند.
با توجه به اینکه سلیقه افراد در طول زمان تغییر می کند، نمایه ساخته شده از کابر نیز باید با توجه به این تغییرات به روز شود. برای این منظور ابراز علاقه و یا عدم علاقه کاربر به اقلامی که در لیست به او پیشنهاد شده اند به عنوان باز خورد ذخیره و برای به روز کردن نمایه او استفاده می شود.
درست است که سایت پیشنهادگر آمازون بر اساس روش فیلترینگ اشتراکی است. ولی همانطور که در شکل شماره ۱۲ قابل مشاهده است در این نمونه صفحه از سایت آمازون گزینهای به نام Youre Favoites وجود دارد که با بهره گرفتن از این گزینه قسمتی از نمایه کاربر می تواند بر اساس روش محتوا محور ساخته شود. همانگونه که در شکل شماره ۱۳ قابل مشاهده است در این صفحه انواع کتابهایی که مطابق با علائق کاربر است نمایش داده شده است. انواعی که در این قسمت قابل مشاهده است یا به صورت ضمنی بر گرفته شده، مانند بررسی اقلامی که کاربر تا کنون خریداری کرده است، یا به صورت دستی توسط خود کاربر وارد شده است. این قسمت توسط کاربر قابل ویرایش و تطبیق پذیر با سلایق و علائق او میباشد.
شکل شماره ۱۲ : نمونه صفحهای از سایت آمازون
شکل شماره ۱۳ : استفاده از روش محتوا محور در سایت آمازون
۳-۲-۳- جزء فیلترینگ (filtering component )
در این مرحله میزان شباهت پروفایل ساخته شده از کاربر با اطلاعات توصیفی سازماندهی شده اقلام مورد نظر سنجیده می شود. این کار می تواند توسط یکی از معیارهای اندازه گیری شباهت مانند معیار اندازه گیری کسینوس صورت گیرد. بر این اساس مشخص می شود که کدام یک از این اقلام مورد علاقه کاربر است. نتیجه حاصل شده از این مرحله یک لیست پیشنهادی از اقلام میباشد که بر اساس علائق کاربر مرتب شده است.
۳-۳- مزایای روش محتوا محور
فرم در حال بارگذاری ...
[شنبه 1400-08-22] [ 04:09:00 ب.ظ ]
|