عملي هو الامتياز. التقييمات. قصص النجاح. أفكار. العمل و التعليم
بحث الموقع

نظام التوصيات. سهولة الاستخدام المطلقة

عندما بدأ تطبيق أنظمة التوصية بشكل مخفي على الموارد المختلفة، بدا الأمر بمثابة إضافة رائعة للعملية بحث مستقل. عندما يكون اختيار المنتجات أو أي محتوى كبيرًا بدرجة كافية، يتحول البحث إلى رحلة مسليةمع نتائج غير متوقعة في كثير من الأحيان. على سبيل المثال، لم أكن مهتمًا أبدًا بأفلام الرعب، مفضلاً الأفلام ذات الاتجاه المختلف قليلاً، ولكن بفضل البحث العشوائي في المحتوى، عثرت ذات يوم على فيلم كلاسيكي هيلرايزر، مشاهدة تركت لي انطباعًا قويًا لا يمحى. أنا متأكد من أن كل قارئ قد تم إثراءه مرة واحدة على الأقل بالمعنى الثقافي أو الجمالي على وجه التحديد بفضل البحث العشوائي والإجراءات العشوائية. من ناحية أخرى، اكتشفت الكثير من الأشياء المثيرة للاهتمام بمساعدة التوصيات التي توفرها لي الموارد المواضيعية. أصبحت العديد من الأفلام أو الكتب أو الموسيقى أو المنتجات معروفة بالنسبة لي (ومثيرة للاهتمام) فقط بسبب التشغيل الناجح لنظام التوصيات. ما هو نموذجي هو أنني الآن أعتمد دائمًا على التوصيات وأبحث عن شيء ما بمفردي في كثير من الأحيان أقل بكثير، لأنه ببساطة لم يتبق وقت للأخير!

يتفاقم هذا الوضع بسبب حقيقة أنني أرى إلى أي مدى بدأت خوارزميات التوصية في فهمي. إذا لم تحدث الزيارات الناجحة سابقًا في كثير من الأحيان، فإن اليوم على الأقل نصف الأشياء الموصى بها تثير اهتمامي بدرجة أو بأخرى. وعندما ما زلت أحاول، بدلاً من قبول ما يُعرض عليّ بلا مبالاة، أن أجد شيئًا جديرًا بالاهتمام بمفردي، فإنني أستسلم بسرعة تحت ضغط الوفرة المذهلة وغير المسبوقة. وكلما ذهبت أبعد، كلما ظهرت صورة للمستقبل غير البعيد بشكل أوضح، عندما يتكيف الواقع المحيط باستمرار مع شخصيتك، ويتحول ويتعلم باستمرار. لم يحدث من قبل في تاريخ البشرية أن كانت الراحة مطلقة إلى هذا الحد الخطير. ولم يحدث من قبل أن تم سحب الثغرات الخاصة بالاكتشافات العشوائية المذهلة من الاستخدام بهذه السرعة وبشكل قاطع.

بقبول المستقبل القادم كما هو، يجدر بنا أن نتعلم كيفية تقييمه بشكل نقدي، وتحديد الجوانب المشكوك فيها أو حتى المظلمة بنفس الحماس الذي نسعى به لاستخدام الابتكارات في الحياة اليومية التي تجعل أمورنا أسهل. دعونا نحاول فهم موضوع حديثنا اليوم.

طرق التصفية المستخدمة في أنظمة التوصية

تصفية التعاونية

يتم استخدام التصفية التعاونية على نطاق واسع، لأسباب ليس أقلها سهولة التنفيذ النسبية. مبدأ عملها بسيط بالفعل، على الرغم من أنه يمكن تقسيمها إلى نهجين مختلفين.

يأخذ النهج القائم على مطابقة المستخدم (المعروف عمومًا باسم "المعتمد على المستخدم") في الاعتبار تشابه مستخدم معين مع المستخدمين الآخرين المشاركين في النظام. على سبيل المثال، إذا قام فاسيلي بتقييم Lady Gaga وOasis وLed Zeppelin بشكل إيجابي، فيمكن أن تحاول Anastasia، التي تحب Lady Gaga وLed Zeppelin، اقتراح Oasis.

على العكس من ذلك، فإن مفهوم مقارنة الكائنات (على أساس العناصر)، يحلل الأشياء نفسها ويكشف عن تشابهها مع تلك التي أحبها فاسيلي ذات يوم. في الممارسة العملية، يبدو الأمر كما يلي: أحب فاسيلي ذات مرة Radiohead وBlur، فلماذا لا نقدم له Oasis أيضًا؟

تتيح لك التصفية التعاونية الحصول على توصيات دقيقة للغاية وذات صلة بناءً على تحليل ومقارنة الاختلافات بين المستخدمين ذوي السلوك المماثل.

فاسيلي وأناستازيا: توصيات تلقائية متبادلة بناءً على الاختلافات في التفضيلات.

تصفية المحتوى

يبني تصفية المحتوى إتصال داخليبين المنتجات المعروضة أو أي محتوى. يتجلى هذا المبدأ البسيط في التوصية للمستخدم بأشياء مشابهة لتلك التي اختارها مسبقًا. على سبيل المثال، إذا قمت بشراء دليل حول العزف على الجيتار من متجر لبيع الكتب، فسيتم تلقائيًا تقديم برامج تعليمية أو كتيبات إرشادية شائعة أخرى من قبل نفس المؤلف. من المزايا الكبيرة لأنظمة التوصية التي تستخدم مبدأ تصفية المحتوى هي القدرة على إثارة اهتمام المستخدم الجديد بالعروض حرفيًا منذ خطواته الاستهلاكية الأولى. لا تحتاج إلى جمع بيانات حول تفضيلات الشخص لفترة طويلة، يمكنك تضمين الزائر على الفور في العمل مع المورد. ومن المزايا المهمة أيضًا لتصفية المحتوى القدرة على توصية المستخدم بالكائنات التي لم يتم تقييمها وتم تجاوزها من قبل المستخدمين الآخرين. آخر لحظةيحدث غالبًا عند استخدام أسلوب تعاوني.

تتجاهل تصفية المحتوى تمامًا آراء المستخدمين حول كائنات معينة. من خلال بناء اتصالات بحتة بين الكائنات نفسها، لدينا الفرصة على الفور، دون جمع التقييمات والمعلومات الشخصية الإضافية، لتقديم شيء مشابه للموقف الذي يثير اهتمامه. من خلال استبعاد تجربة المستخدم من نظام التوصيات باعتبارها مادة أساسية، يبدو أننا حلنا المشكلة المزعومة. "البداية الباردة"، عندما يمنع تناثر بيانات المستخدم النظام من تطوير توصيات مخصصة. لكن الجانب الخلفيتتكون تصفية المحتوى من توصيات غير مناسبة تمامًا وأحيانًا سخيفة مثل "هل اشتريت سيارة Toyota RAV4؟ قد تكون مهتمًا أيضًا بسيارة تويوتا هايلاندر!

هناك صعوبة أخرى مرتبطة باستخدام مبدأ تصفية المحتوى وهي مقدار العمل المذهل الذي يتطلبه بناء الاتصالات بين جميع الكائنات في النظام. لكن العيب الرئيسي لهذه الطريقة يتم التعبير عنه بضربة منخفضة للغاية ومشروطة في بعض الأحيان على الهدف. تصفية المحتوى لا يعني درجة عاليةالتخصيص، وبالتالي فإن دقة التوصيات منخفضة نسبيًا.

التصفية القائمة على المعرفة (معرفةقائم على أنظمة)

تستخدم الأنظمة من هذا النوع على نطاق واسع في المتاجر عبر الإنترنت. في جوهرها، تشبه التوصيات القائمة على المعرفة الطريقة السابقة لتصفية المحتوى، ومع ذلك، تستخدم هذه الخوارزميات تحليلًا أعمق للكائنات، وبناء الروابط بينها ليس وفقًا لمعايير التشابه المبتذلة، ولكن بناءً على الترابط بين مجموعات معينة من السلع .

من الناحية العملية، يبدو الأمر هكذا - عند شراء هاتف ذكي، على سبيل المثال، يقدم لك الموقع ملحقات مناسبة للاستخدام مع جهازك الجديد. يمكن أن تكون هذه حافظات وسماعات رأس وبطاقات ذاكرة وكل شيء من هذا القبيل. يمكنك أيضًا تحفيز المشتري من خلال تقديم خصومات على الملحقات، والتي يمكن أن تكون مفيدة جدًا عند شراء جهاز جديد.

وتظهر التوصيات القائمة على المعرفة نتائج جيدة، مما يزيد من معدل دوران الشبكات الكبيرة منصات التداولبعشرات المئة. بالإضافة إلى ذلك، على عكس تصفية المحتوى، فإن هذا النوع من التوصيات دقيق للغاية، حيث يقترح على المستخدم ما قد يحتاجه بالفعل.

إذا كنت مهتمًا بالتوصيات الدقيقة، فيجب عليك بالتأكيد التفكير في تنفيذ نظام قائم على المعرفة على موقع الويب الخاص بك. مثل تصفية المحتوى، يقوم نظام التوصيات القائم على المعرفة بدراسة وتحليل العلاقات بين الأشياء (المنتجات)، ولكنه بالإضافة إلى ذلك، يأخذ في الاعتبار عددًا من الخيارات الإضافية المتعلقة بالخصائص الفردية لمستخدم معين.

أ) رغبات المستخدم. موقف مألوف لدى الجميع - الموقع يطلب من المستخدم الإشارة إلى الخصائص المطلوبة، وبعد ذلك يعرض المنتجات المطابقة للطلب.

Yandex.Market ومربعات الاختيار الخاصة به ناجحة و مثال ساطعنظام التوصيات الذي يسترشد بمتطلبات المستخدم.

ب) الخصائص الديموغرافية.في الواقع، يتم استخدام البيانات الديموغرافية من قبل شبكات التواصل الاجتماعي الكبرى مثل Facebook وLinkedIn وVKontakte وغيرها لتقديم التوصيات.

بالطبع، لتنفيذ مثل هذا النظام، تحتاج إلى العمل الجاد - سيتعين عليك جمع ومعالجة كمية هائلة من البيانات.

الترشيح الهجين

الأداة الأقوى والأصعب في التنفيذ. من الواضح أن المستقبل يكمن في الجمع بين آليات التوصية المختلفة في خوارزمية واحدة قوية. سيتم تحقيق تلك الراحة المطلقة والواقع الشخصي الذي تحدثنا عنه في بداية المقال على وجه التحديد بمساعدة مزيج من أكثر طرق فعالةتوصيات.

ويتجلى هذا المثال في شركة Netflix، التي يتم تحسين وتحديث نظامها المختلط المعقد للتوصية، والذي يظهر دقة فريدة من نوعها. ويرجع تطوير مثل هذه الخوارزمية القوية إلى حد كبير إلى التمويل السخي للأبحاث في هذا المجال من قبل شركة نتفليكس نفسها، والتي عرضت في عام 2006 مليون دولار لتحسين نظام التوصيات الخاص بها بنسبة 10%.

فريق تطوير BellKor's Pragmatic Chaos الذي تمكن من تحسين الخوارزميةنيتفليكسبنسبة 10.09%.

بضع كلمات عن الخطوات العملية كخاتمة

خيار نوع خاص أو معينتعتمد التصفية أو الجمع بين عدة طرق بشكل مباشر على عاملين - مدى تعقيد مشروعك ومقدار تمويله. على سبيل المثال، يعد إنشاء خوارزمية لنظام من المدونات المواضيعية التي تتقاطع مع بعضها البعض مهمة بسيطة نسبيًا ومكلفة إلى حد ما. تتطلب المشاريع الأكبر حجمًا والأكثر تنوعًا، مثل المتاجر عبر الإنترنت، تكاليف أكبر، خاصة إذا كان الهدف هو زيادة التحويل بمبالغ كبيرة حقًا. كقاعدة عامة، في مثل هذه المشاريع، لا يمكن قصر أنفسنا على نوع واحد فقط من خوارزمية التوصية، ومن الضروري استخدام التصفية المختلطة، ونتيجة لذلك تزداد تكلفة وتعقيد التطوير حسب الحجم.

لإنشاء خوارزمية هجينة وتنفيذها وتصحيح أخطائها، ستحتاج إلى فريق كامل من المطورين ذوي الخبرة الذين يدركون جيدًا ماهية الجبر الخطي والجبر العلائقي، ولديهم أيضًا مجموعة من المهارات التي تجعل منشئي خوارزميات التوصية مهنة منفصلة تقريبًا.

بطريقة أو بأخرى، عند تطوير مشروع يوفر للمستخدم الفرصة لاختيار كائنات محددة من مجموعة عامة، من الضروري مراعاة التقدم السريع في سهولة الاستخدام في جميع المجالات تمامًا الحياة البشرية- بدءًا من تحسين النوم باستخدام الأجهزة التي تحلل جميع العمليات التي تحدث أثناء النوم وإصدار توصيات لتحسينه، وحتى الاختيار التلقائي السلع اليوميةبناء على الاحتياجات الحالية للمستخدم. كما تعلمون، فإن الشرط الذي لا غنى عنه لنجاح أي مشروع هو توافقه الدقيق مع روح العصر.

في 28 أبريل 2016، أعلنا رسميًا عن إطلاق أول دورة تدريبية تكيفية على موقع Stepic.org، والتي تختار مسائل بايثون وفقًا لمستوى الطالب. قبل ذلك، قمنا أيضًا بتنفيذ الدروس الموصى بها على المنصة، حتى لا ينسى الطلاب ما أكملوه بالفعل، ويكتشفون موضوعات جديدة قد تهمهم.

تحت الخفض هناك موضوعان رئيسيان:

  • حول التعليم عبر الإنترنت، إيجابيات/سلبيات/المزالق؛
  • تصنيف أنظمة التوصية، إمكانية تطبيقها في التعليم، أمثلة.

نبذة عن التعليم عبر الإنترنت، إيجابياته وسلبياته ومزالقه

هذا الجزء في معظمه تمهيدي، ويتناول التعليم عبر الإنترنت، وتفاصيل مثيرة لأنظمة التوصية تحت الصورة التالية :)

في العالم الحديثأصبح التعليم عبر الإنترنت أكثر شعبية تدريجياً. فرصة للتعلم من كبار الأساتذة المؤسسات التعليميةودراسة مجالات جديدة، واكتساب المعرفة اللازمة للعمل دون مغادرة المنزل، يجذب عددًا كبيرًا من الناس.

واحدة من أكثر أشكال التعلم عبر الإنترنت شيوعًا هي الدورات التدريبية المفتوحة عبر الإنترنت (MOOCs، الدورات الضخمة المفتوحة عبر الإنترنت). غالبًا ما تتضمن مقاطع فيديو وشرائح و محتوى النص، التي يعدها المعلم، بالإضافة إلى مهام اختبار المعرفة، والتي عادة ما يتم فحصها تلقائيًا، ولكن من الممكن أيضًا للطلاب التحقق من عمل بعضهم البعض. يمكن تقديم مجموعة واسعة من أنواع المهام كمهام: من اختيار بسيطالإجابة الصحيحة قبل كتابة المقال وحتى، كما نفعل في Stepik، برمجة المهام مع التحقق التلقائي.

يتميز التعليم عبر الإنترنت بخصائصه الخاصة التي تميزه عن التعليم التقليدي غير المتصل بالإنترنت. من بين المزايا، أولا، ما سبق ذكره أعلاه إمكانية الوصول إلى كل من لديه حق الوصول إلى الإنترنت. ثانيًا، تتمتع بقابلية تطوير غير محدودة تقريبًا: بفضل التحقق الآلي من المهام، يمكن لآلاف الأشخاص الدراسة في نفس الوقت في الدورة، وهو ما لا يمكن مقارنته بالدورات التقليدية في الفصول الدراسية. ثالثًا، يمكن لكل طالب اختيار الوقت والسرعة المناسبين لاستكمال المادة. رابعًا، يتمتع المعلمون بإمكانية الوصول إلى ثروة من البيانات حول كيفية إكمال المستخدمين لدوراتهم التدريبية، والتي يمكنهم استخدامها لتحليل موادهم وتحسينها.

وفي الوقت نفسه، هناك أيضًا عيوب للتعلم عبر الإنترنت. على عكس التعليم التقليدي، حيث يتم تحفيز الطالب دائمًا من خلال تقييم أدائه الأكاديمي، في حالة الدورات عبر الإنترنت، لا توجد عقوبة للرسوب في الدورة. ولهذا السبب، نادرًا ما تتجاوز نسبة أولئك الذين أكملوا الدورة التدريبية للمشاركين فيها 10٪ (في ستيبيك، كانت دورة أناتولي كاربوف "أساسيات الإحصاء" هي الأفضل وفقًا لجوائز EdCrunch لعام 2015؛ وهو رقم قياسي بلغ 17٪ من أولئك الذين قاموا بالتسجيل اجتازوا الإطلاق الأول، ولكن هذا استثناء). بالإضافة إلى ذلك، وبسبب العدد الكبير من الطلاب، لا تتاح للمعلم فرصة الاهتمام الفردي بكل طالب بما يتوافق مع مستواه وقدراته.


لقد وضعنا لأنفسنا مهمة إنشاء نظام توصيات يمكنه تقديم المشورة للطالب بشأن المحتوى الذي يثير اهتمامه ويأخذ في الاعتبار مستوى إعداده والفجوات المعرفية. بالإضافة إلى ذلك، يجب أن يكون النظام قادرًا على تقييم مدى تعقيد المحتوى. يعد هذا ضروريًا، على وجه الخصوص، للتوصيات التكيفية التي ستساعد المستخدم على دراسة المادة، والتكيف معها بمرونة، وتقديم المحتوى الذي يحتاجه الآن للتعلم بالضبط. سيفيد مثل هذا النظام المستخدمين بتوصيات الدروس المخصصة التي يمكن أن تساعدهم على تعلم موضوع معين أو تقديم شيء جديد.

بشكل عام، يجب أن يصبح التعلم أكثر إثارة للاهتمام!

أحد الأمثلة الأولى لنظام التوصية الحديث هو موقع movielens.org، الذي يقترح أفلامًا على المستخدمين بناءً على تفضيلاتهم. تعتبر هذه الخدمة مثيرة للاهتمام لأنها توفر للجميع مجموعة واسعة من البيانات حول الأفلام والتقييمات المقدمة لهم من قبل المستخدمين. تم استخدام مجموعة البيانات هذه في الكثير من الأبحاث في مجال أنظمة التوصية على مدار العقدين الماضيين.

  • الأنظمة القائمة على تصفية المحتوى. تقدم مثل هذه الأنظمة للمستخدمين محتوى مشابهًا لما سبق أن درسوه. يتم حساب التشابه باستخدام خصائص الكائنات التي تتم مقارنتها. على سبيل المثال، يمكن استخدام تقارب النوع أو فريق التمثيل للتوصية بالأفلام. يُستخدم هذا الأسلوب في خدمة تصنيف الأفلام والبحث عنها والتوصية بها في قاعدة بيانات الأفلام على الإنترنت.
  • الأنظمة التي تستخدم التصفية التعاونية. في هذه الحالة، يُعرض على المستخدم محتوى يثير اهتمام المستخدمين المماثلين. تعتمد توصيات خدمة MovieLens على وجه التحديد على هذا النهج.
  • أنظمة هجينة تجمع بين النهجين السابقين. يُستخدم هذا النوع من النظام في Netflix، وهي خدمة لمشاهدة الأفلام والمسلسلات التلفزيونية عبر الإنترنت.

لقد أنشأنا نظامًا مختلطًا مع استخدام أكثر نشاطًا لتصفية المحتوى واستخدام أقل نشاطًا للتصفية التعاونية.

هناك الكثير من الأبحاث حول أنظمة التوصية للتعلم المعزز بالتكنولوجيا. تضيف خصوصية المهمة في هذه الحالة اتجاهات جديدة لتطوير نظام التوصية.


ما هي مميزات نظام التوصية للمشروع التعليمي؟

أولاً، من الممكن بناء نظام توصيات متكيف يتكيف مع احتياجات المستخدم في لحظة معينة ويقدم له أفضل الطرق لدراسة المادة. في هذا التنسيق، يمكن تنفيذ العديد من أجهزة المحاكاة، على سبيل المثال، في الرياضيات أو بعض لغات البرمجة، والتي تحتوي على العديد من المهام متفاوتة التعقيد، والتي ستكون مختلفة منها مناسبة للطلاب المختلفين في أي وقت.

ثانيًا، من الممكن استخلاص التبعيات بين المواد التدريبية من البيانات المتعلقة بكيفية إكمال المستخدمين لها.

يمكن أن تساعد هذه البيانات في استخلاص موضوعات فردية في المواد، والروابط بين هذه المواضيع، وعلاقاتها في التعقيد.

تستخدم Coursera وEdX وUdacity (منصات التعلم عبر الإنترنت) أنظمة التوصية الخاصة بهم للتوصية بالدورات التدريبية للمستخدمين الذين قد يثيرون اهتمامهم. عيب هذه التوصيات هو أنها لا يمكنها تقديم سوى الدورة التدريبية بأكملها، ولكن ليس جزءًا منها، حتى لو كان المستخدم مهتمًا بهذا الجزء فقط. كما أن النظام المبني بهذه الطريقة لا يمكن أن يساعد المستخدم في دراسة المقرر الذي اختاره.

على العكس من ذلك، يعمل نظام توصية الموارد MathsGarden مع أصغر أجزاء المحتوى - المهام الفردية. وهو محاكاة للحساب الابتدائي للطلاب مدرسة إبتدائيةوالتي تقدم للطالب المهام التي تناسبه على النحو الأمثل هذه اللحظةالوقت وفقا للتعقيد.
للقيام بذلك، يقوم النظام بحساب الخصائص النسبية لمعرفة الطالب وتغييرها ديناميكيًا، بالإضافة إلى خاصية تعقيد المهام، ولكن المزيد عن هذا لاحقًا.

في المقالات التالية، سنتحدث بمزيد من التفاصيل حول جهاز Stepic.org وتنفيذ نظام التوصية، ونحدد ما هو نظام التوصية التكيفي، ونحلل النتائج التي تم الحصول عليها بالتفصيل. سيكون ممتعا:)

لنبدأ بتحديد ماهية أنظمة التوصية. هذه هي البرامج والخدمات التي تحاول تحديد ما يريد المستخدمون رؤيته وتقديمه لهم (أو التوصية به، ومن هنا الاسم). ربما واجه كل واحد منا تقنيات مماثلة في مواقع مختلفة. سنصف اليوم أنواع هذه البرامج ومبادئ تشغيلها، وسنقدم أيضًا أمثلة على هذه الخوارزميات أثناء العمل. اقرأ حتى النهاية، سيكون الأمر مثيرًا للاهتمام!

لقد وصفنا أعلاه ماهية أنظمة التوصية، والآن سنخبرك بمزيد من التفاصيل حول أهميتها. لقد قامت هذه البرامج بتحسين طريقة تفاعل الموقع والزائر لأنه بدلاً من تقديم معلومات ثابتة، يتلقى المستخدم تجربة تفاعلية.

يتم إنشاء التوصيات بشكل منفصل لكل شخص، بناءً على إجراءاته السابقة على مورد ويب محدد أو بناءً على النشاط السابق. بالإضافة إلى ذلك، فإن سلوك المشاركين السابقين في العملية مهم أيضًا.

بالنسبة للمتاجر عبر الإنترنت، تعد هذه وظيفة مهمة من حيث المبدأ، وبالنسبة للكتالوجات الكبيرة مثل أمازون، فهي إحدى الطرق القليلة للعمل بكفاءة. طريقة التوصية في هذه الحالة ليست خيارًا إضافيًا عاديًا، فهي توفر سهولة تنقل المستخدم عبر مورد الويب. لو الكتالوج الرقمييحتوي على أكثر من 20.000 منتج، ويبدو التوجيه بالفعل صعبًا للغاية، فماذا يمكننا أن نقول إذا كان هناك ملايين المنتجات؟

ما مدى إرهاق المشتري المحتمل للتفاعل مع مثل هذا الموقع؟ الجواب واضح. وتأتي أداة للبحث عن المنتجات المشابهة بصريًا للمنتج الذي تبحث عنه، أو التي تنتمي إلى نفس مجموعة المنتجات، أو المنتجات التكميلية (عندما يُعرض عليك اختيار حقيبة يد لزوج من الأحذية، على سبيل المثال). إلى الإنقاذ. لا يؤدي هذا الحل إلى زيادة عدد المشاهدات فحسب، بل له تأثير إيجابي على التحويل.

كما تبين الممارسة، لا تستخدم المتاجر عبر الإنترنت هذه التقنية فقط. وسائل التواصل الاجتماعيكما أنهم لا يتخلفون عن الركب. فيما يلي مثال من فكونتاكتي.

كما يمكن رؤية تقنيات مماثلة بسهولة على مختلف المنصات الاجتماعية، والبوابات المخصصة للأدب، والسفر، وموارد الأخبار، والمتاجر عبر الإنترنت، في كلمة واحدة - في كل مكان تقريبًا. هذه التقنية تحظى بشعبية كبيرة حقًا. يعد مورد الويب Kinopoisk مثالًا آخر يمكن الوصول إليه.

تقنيات

لذا، النوع الأول هو جمع البيانات الصريحة. كما يمكنك تخمين الاسم، يوفر المستخدم نفسه المواد اللازمة للعمل. على سبيل المثال، عندما تطلب أنظمة التوصية في Yandex أو محركات البحث الأخرى من شخص ما تقييم عناصر مختلفة، أو إنشاء قائمة بالمفضلات في منطقة معينة، أو الإجابة على عدة أسئلة. إذا رفض الشخص تقديم معلومات بشكل مستقل، فستكون التقنية التالية ذات صلة.

النوع الثاني هو جمع البيانات الضمنية. نسبيًا، هذه مهمة تجسس يتم بموجبها تسجيل تصرفات أحد المشاركين في العملية بواسطة برنامج لمزيد من المعالجة والتطبيق. ماذا تحتاج لهذا؟ يتعرف البرنامج على عمليات الشراء والتقييمات على المواقع ويجمع معلومات عن المشاهدات والتعليقات. وبطبيعة الحال، فإن اختيار مثل هذه التقنية ينطوي على بعض المشاكل الأخلاقية، لأن حماية البيانات الشخصية هي أحد المتطلبات الرئيسية التي يضعها المستخدم على محركات البحث. لكن في الوقت الحالي، تبقى الحقيقة أن نوعًا ما من المراقبة أمر ممكن، ولا يستطيع زوار الموقع العاديون التحقق مما إذا كانت مثل هذه الأحداث تحدث بالفعل.

التقنية الأساسية الأولى تسمى التصفية التعاونية. يتم تقديم التوصيات باستخدام هذه التقنية بناءً على الخصائص السلوكية لشخص واحد أو مجموعة من الأشخاص، وهذا الأخير أكثر فعالية. تجمع المجموعات الأشخاص المتشابهين في السلوك والخصائص.

دعونا نعطي مثالا لتسهيل فهم المعلومات. يتم إنشاء موقع ويب حيث سيتم التوصية بالأعمال الموسيقية للجمهور. كيف ستعمل خدمات التوصية القائمة على المنهجية التعاونية في هذه الحالة؟ وفقًا لهذا المبدأ: سيتم اتخاذ مجتمع واحد كأساس، حيث يضيف المشاركون مسارات من نفس النوع إلى قائمة التشغيل. بعد ذلك، يتم تحديد المقطوعات الموسيقية الأكثر شيوعًا والتوصية بها لمستخدم واحد من المجموعة لم يستمع بعد إلى هذا اللحن.

ويسمى النهج الثاني التصفية على أساس المحتوى. هنا يتم تشكيل التوصية على أساس السلوك البشري. يمكن أن يأخذ هذا الأسلوب أيضًا سجل التصفح الخاص بمشارك معين كأساس.

هذه المرة سنقدم مثالاً على المجلات المواضيعية عبر الإنترنت. لذلك، في حالة قيام شخص ما بقراءة محتوى حول ركوب الدراجات الجبلية مسبقًا والتعليق بانتظام على مقالات المدونة التي تحتوي على هذا المحتوى، فإن طريقة تصفية المحتوى ستستخدم هذه المعلومات السابقة لتحديد الموارد المماثلة واقتراحها عليه كتوصية لهذا المستخدم .

هناك أيضًا طرق مختلطة يتم من خلالها تطوير نظام التوصيات.

النهج المختلط هو مزيج من التعاون وتصفية المحتوى. وكما نعلم، فإن المزيد هو الأفضل، لذا فإن الجمع بين هذين الأسلوبين يزيد من كفاءة أنظمة التوصية، أي زيادة دقة التنبؤات بشكل كبير لأشخاص محددين.

الخوارزميات

إرتباط بيرسون

تتيح لك هذه الخوارزمية الاختيار الخصائص العامةبين عدة مستخدمين. كيف؟ استخدام الرياضيات البسيطة، وهي تحديد العلاقة الخطية بين عنصرين. نقطة مهمة- هذه التقنية ليست مناسبة لمجتمع من الناس.

تجمع

يعتمد مبدأ تشغيل أنظمة التوصية على تحديد أوجه التشابه بين العناصر (المستخدمين) عن طريق حساب قربها من بعضها البعض فيما يسمى بمساحة الميزة. العلامات هي تلك العناصر التي تتلاقى عليها مصالح بعض المشاركين في العملية (بالنسبة للموارد الموسيقية، فهي مسارات، لبوابات الأفلام - الأفلام). يتم دمج المستخدمين ذوي الخصائص المتشابهة في ما يسمى بالمجموعات.

خوارزمية التصفية التعاونية

يمكن استبدال التجميع الصلب بخوارزمية أخرى، تعمل وفق صيغة معقدة إلى حد ما، ومثل كل الخوارزميات السابقة، تعتمد على سلوك المستخدمين من مجموعتها. ومع ذلك، فإن هذه التقنية لها عدة عيوب كبيرة إلى حد ما. أولاً، من الصعب على المستخدمين الجدد أو غير التقليديين (أولئك الذين لا يشكلون مجموعات) العثور على توصيات. ثانياً، ما يسمى بـ "البداية الباردة"، عندما لا تدخل كائنات جديدة إلى أنظمة التوصية.

خوارزمية تصفية المحتوى

الخوارزمية متماثلة مع الخوارزمية السابقة، ولكن إذا بدأنا في الحالة الأولى من افتراض أن المستخدم سيحب الكائن لأن "زملائه في الفصل" يحبونه، فسنوصي هنا بناءً على الكائنات المماثلة التي لاحظها بالفعل نفسه. وهنا، تقليديا، يمكن تحديد العديد من المشاكل. نفس "البداية الباردة" وحقيقة أن التوصيات غالبًا ما تكون عادية.

بدلا من الاستنتاج

لذلك، قدمنا ​​كافة المعلومات التي يجب أن يعرفها المبتدئ أو الشخص العادي حول أنظمة التوصية. لنكن صادقين، الخوارزميات صعبة إلى حد ما بالنسبة لشخص غير مدرب، لذلك لا تحتوي هذه المقالة على صيغ رياضية، على الرغم من أن الخوارزميات تعتمد عليها.

تعد برامج التوصية خدمات مفيدة لكل من مستخدمي الإنترنت العاديين والباحثين ورجال الأعمال عبر الإنترنت. يجب على أولئك الذين يرغبون في زيادة التحويلات وعدد المشاهدات الانتباه إلى هذه التقنية والتأكد من تنفيذها لزيادة كفاءة مورد الويب، وخاصة المتجر عبر الإنترنت.