۲-۹-۲- استفاده از امتیازهای نرمال شده
(۸)
توسط فرمول بالا این مسئله در نظر گرفته می­ شود که کاربران مختلف ممکن است بازه­های امتیازدهی متفاوتی برای نشان دادن یک درجه­ اهمیت داشته باشند. در فیلترینگ اشتراکی مبتنی بر کاربر به طور استاندارد از این فرمول برای پیش ­بینی استفاده می­ شود .[۷]
دانلود پروژه
۲-۱۰- مشکلات فیلترینگ اشتراکی
فیلترینگ اشتراکی علاوه بر کاربرد وسیع آن و مزایایی که از آن برخوردار است شامل معایبی نیز می­باشد که در ادامه به توضیح تعدادی از آنها می­پردازیم.
۲-۱۰-۱- پراکنده بودن داده[۵۰]
وقتی ماتریس کاربران - اقلام پراکنده و سایز آن بزرگ باشد این مشکل به وجود می ­آید. کاربرانی هستند که به همه­ اقلام امتیاز نداده­اند و تنها به تعداد کمی از آنها امتیاز داده­اند. بنابراین اقلامی وجود دارند که به اندازه­ کافی امتیاز­دهی نشده­اند. در این حالت اندازه ­گیری شباهت روی تعداد امتیازهای ابراز شده­ اندکی صورت می­پذیرد که قابل اعتماد نمی ­باشد. یکی از مشکلاتی که به دلیل پراکنده بودن داده به وجود می ­آید شروع سرد است. یعنی برای کاربری که به تازگی وارد سیستم شده و به اندازه­ کافی امتیازی به اقلام نداده است نمی­ توان پیشنهاد قابل اعتمادی ارائه کرد. همچنین قلم جدیدی که وارد سیستم می­ شود نیز همین مشکل را دارد. اقلامی که به اندازه کافی امتیاز دریافت نکرده ­اند برای پیشنهاد قابل اعتماد نمی­باشند. به عنوان مثال Movielens برای اجتناب از بروز چنین مشکلی برای کاربران جدید شرط امتیاز دهی به حداقل ۱۵ قلم را در نظر گرفته است.
پژوهش­های زیادی برای رفع این مشکل انجام شده است. که بسیاری از آنها از روش­های موجود در مدل محتوا محور برای پر کردن خانه­های بدون رتبه­ ماتریس امتیازدهی استفاده می­ کنند .[۳۹,۴۰,۴۱,۴۲,۴۳]
۲-۱۰-۲- مقیاس پذیری[۵۱]
با زیاد شدن تعداد کاربران و اقلام منابع محاسباتی برای برطرف کردن درخواست­های جدید با کمبود مواجه می­ شود.
۲-۱۰-۳- اقلام مشابه[۵۲]
بعضی اقلام شبیه به هم هستند ولی به دلیل تفاوت در نامشان سیستم پیشنهادگر یکسان بودن آنها را نمی­تواند تشخیص دهد. بنابراین با آنها به طور متفاوت برخورد می­ کند.
۲-۱۰-۴- گری شیپ[۵۳]
کاربرانی هستند که سلیقه­شان موافق یا مخالف با هیچ گروه از کاربران نمی ­باشد. بنابراین سیستم پیشنهادگر فیلترینگ اشتراکی نمی­تواند هیچ منفعتی به آنها برساند.
۲-۱۱- بررسی چگونگی کارکرد و تولید پیشنهاد سایت آمازون
سایت آمازون یکی از معروف­ترین سایت­های تجارت الکتونیک می­باشد که در سال ۱۹۹۵ فعالیت خود را با فروش بر خط کتاب شروع کرد و اکنون در آن محصولاتی مانند ساعت، کتاب، سی دی، تلویزیون و… به فروش می­رسد.
آمازون از متد فیلترینگ اشتراکی استفاده می­ کند و پیشنهادات را بر اساس اقلام تولید می­ کند. زیرا تعداد اقلام از تعداد کاربران به نسبت کمتر است. روند کار آمازون به این صورت است که لیست اقلام دیده شده توسط هر کاربر در یک ماتریس ذخیره می­ شود. سپس با بهره گرفتن از معیار شباهت کسینوس میزان شبیه بودن بردارهای اقلام در این ماتریس محاسبه می­گردد. بعد از آن شبیه­ترین اقلام به اقلامی که کاربر تا کنون دیده است به او پیشنهاد می­ شود. نسخه­ ساده­ای از چگونگی تولید پیشنهاد در (شکل شماره­ ۸) قابل مشاهده می­باشد.
شکل شماره­ ۸: روند تولید پیشنهاد در آمازون [۴۴]
همانطور که مشاهده می­کنید کاربر ۳ اخیرا به سیستم وارد شده و قلمA را مشاهده کرده است. سیستم میزان شباهت بردار قلم َA را با سایر اقلام BوC و D با بهره گرفتن از معیار کسینوس به دست می ­آورد و شبیه­ترین اقلام که در اینجا B و C می­باشند­ را به او پیشنهاد می­ کند.
در (شکل شماره­ ۹) صفحه­ای از سایت آمازون قابل مشاهده است. در این صفحه کاربر می ­تواند با کلیک روی لینک Your Recommendation وارد صفحه­ای شود که می ­تواند پیشنهاداتی که به او ارائه می­ شود را توسط موضوع و خط تولید مورد دلخواهش فیلتر کند. همچنین می ­تواند محصولاتی که قبلا خریداری نموده یا به او پیشنهاد شده است را امتیازدهی کند[۴۵] .
شکل شماره­ ۹ : نمونه صفحه­ای از سایت آمازون[۴۵]
(شکل شماره­ ۱۰) ارائه­ پیشنهاد بر اساس کارت خرید مشتری را نشان می­دهد. یعنی بر اساس محصولاتی که تا کنون خریداری نموده است برای او پیشنهاد تولید می­ شود [۴۵].
شکل شماره ­۱۰: ارائه­ پیشنهاد بر اساس کارت خرید مشتری [۴۵]
فصل سوم
روش محتوا محور
۳- روش محتوا محور
۳-۱-پیشگفتار
در این پایان نامه از روش محتوا محور جهت ارتقاء روش فیلترینگ اشتراکی استفاده شده است. روش محتوا محور بر اساس ویژگی­های اقلام تعریف می­ شود. این روش بررسی می­ کند که اقلام مورد علاقه کاربر دارای چه خصوصیاتی بوده ­اند، سپس اقلام دارای خصوصیات مشابه را به او پیشنهاد می­ کند. محتوای اقلام بر حسب نوع آنها می ­تواند متفاوت باشد. مثلا ژانر فیلم، نوع کتاب و مختصات جغرافیایی رستوران را به ترتیب به عنوان محتوای اقلام فیلم، کتاب یا رستوران در نظر گرفت. به عنوان مثال اگر اکثر فیلم­هایی که کاربر دیده است متعلق به ژانر مستند باشند بدین معناست که او به این گونه فیلم­ها علاقه­مند است.
سیستم­های محتوا محور نیاز به تکنیکی جهت نمایش خصوصیات اقلام، ایجاد نمایه از کاربر بر اساس علاقه ­مندی­هایش و یک استراتژی جهت مقایسه نمایه کاربر با خصوصیات اقلام می­باشد.
۳-۲- روند کار روش محتوا محور
روند کار سیستم­های محتوا محور به این صورت است که ابتدا براساس نحوه­ امتیازدهی کاربر به اقلام مختلف، نمایه­ای از علائق او ساخته می­ شود. سپس بر اساس میزان تطابق خصوصیات اقلام با نمایه ساخته شده از کاربر، پیشنهادها به کاربر ارائه می­ شود.
ساختار سیستم­های پیشنهادگر محتوا محور در شکل زیر نشان داده شده است.
شکل شماره ۱۱: روند کار روش محتوا محور [۲۴]
همانگونه که در شکل بالا قابل مشاهده است روند کار در متد محتوا محور متشکل از سه مرحله به شرح زیر می باشد [۲۴]:
۳-۲-۱- تحلیل­گر محتوا (Content Analyzer)
در این مرحله محتوای اقلام نشان داده می­ شود. بدین منظور معمولا از تکنیک­های بازیابی اطلاعات استفاده می­ شود. اطلاعات توصیفی سازمان­دهی نشده مربوط به اقلام از قسمت منبع اطلاعات (Information Source) استخراج شده و در این مرحله سازمان­دهی می­ شود. یعنی هر قلم توسط اطلاعات سازمان­دهی شده نمایش داده می­ شود. مثلا اگر سیستم پیشنهادگر مربوط به فیلم باشد هر فیلم می ­تواند توسط ویژگی­های مربوط به بازیگران، کارگردانان و…. نمایش داده شود. یا اگر سیستم پیشنهادگر مربوط به صفحه وب باشد هر صفحه وب می ­تواند توسط برداری از کلمات کلیدی نمایش داده شود. به این صورت که ریشه کلمات به عنوان خصوصیات و مقدار tf/idf مربوط به هر ریشه به عنوان مقدار آن در نظر گرفته شود.
نتیجه حاصل شده از این مرحله در قسمت اقلام نمایش داده شده
(Represented Items) ذخیره می­ شود.
۳-۲-۲- یاد گیرنده نمایه (Profile Learner)
در این مرحله بر اساس عکس العملی که کاربر در برابر اقلام مختلف نشان داده و در قسمت بازخورد (Feedback) ذخیره شده است، نمایه­ای از علائق او ساخته می­ شود. این کار معمولا توسط تکنیک­های موجود در حوزه یادگیری ماشین انجام می­ شود.
عکس العملی که کاربر در مقابل اقلام از خود نشان می­دهد به دو صورت صریح و ضمنی می­باشد. عکس العمل صریح به این صوت است که کاربر علاقه یا عدم علاقه خود نسبت به اقلام را توسط امتیازدهی یا توصیفی کوتاه نشان دهد. در عکس العمل ضمنی کاربر هیچ دخالتی ندارد و خود سیستم توسط کنترل و تحلیل رفتار و فعالیت­های کاربر، علائق او را استخراج می­ کند.
با توجه به اینکه سلیقه افراد در طول زمان تغییر می­ کند، نمایه ساخته شده از کابر نیز باید با توجه به این تغییرات به روز شود. برای این منظور ابراز علاقه و یا عدم علاقه کاربر به اقلامی که در لیست به او پیشنهاد شده ­اند به عنوان باز خورد ذخیره و برای به روز کردن نمایه او استفاده می­ شود.
درست است که سایت پیشنهادگر آمازون بر اساس روش فیلترینگ اشتراکی است. ولی همانطور که در شکل شماره ۱۲ قابل مشاهده است در این نمونه صفحه از سایت آمازون گزینه­ای به نام Youre Favoites وجود دارد که با بهره گرفتن از این گزینه قسمتی از نمایه کاربر می ­تواند بر اساس روش محتوا محور ساخته شود. همانگونه که در شکل شماره ۱۳ قابل مشاهده است در این صفحه انواع کتاب­هایی که مطابق با علائق کاربر است نمایش داده شده است. انواعی که در این قسمت قابل مشاهده است یا به صورت ضمنی بر گرفته شده، مانند بررسی اقلامی که کاربر تا کنون خریداری کرده است، یا به صورت دستی توسط خود کاربر وارد شده است. این قسمت توسط کاربر قابل ویرایش و تطبیق پذیر با سلایق و علائق او می­باشد.
شکل شماره ۱۲ : نمونه صفحه­ای از سایت آمازون
شکل شماره ۱۳ : استفاده از روش محتوا محور در سایت آمازون
۳-۲-۳- جزء فیلترینگ (filtering component )
در این مرحله میزان شباهت پروفایل ساخته شده از کاربر با اطلاعات توصیفی سازماندهی شده اقلام مورد نظر سنجیده می­ شود. این کار می ­تواند توسط یکی از معیارهای اندازه گیری شباهت مانند معیار اندازه گیری کسینوس صورت گیرد. بر این اساس مشخص می­ شود که کدام یک از این اقلام مورد علاقه کاربر است. نتیجه حاصل شده از این مرحله یک لیست پیشنهادی از اقلام می­باشد که بر اساس علائق کاربر مرتب شده است.
۳-۳- مزایای روش محتوا محور

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...