ธุรกิจของฉันคือแฟรนไชส์ การให้คะแนน เรื่องราวความสำเร็จ ไอเดีย การทำงานและการศึกษา
ค้นหาไซต์

ระบบแนะนำ. ใช้งานได้จริง

เมื่อระบบการแนะนำเพิ่งเริ่มนำมาใช้กับทรัพยากรต่างๆ อย่างสงบเสงี่ยม ดูเหมือนว่าจะเป็นส่วนเสริมที่ดีสำหรับกระบวนการนี้ การค้นหาที่เป็นอิสระ. เมื่อตัวเลือกผลิตภัณฑ์หรือเนื้อหาใดๆ มีขนาดใหญ่เพียงพอ การค้นหาจะเปลี่ยนเป็น การเดินทางที่สนุกสนานกับผลลัพธ์ที่คาดเดาไม่ได้บ่อยครั้ง ตัวอย่างเช่น ฉันไม่เคยสนใจหนังสยองขวัญเลย โดยเลือกหนังที่มีทิศทางแตกต่างออกไปเล็กน้อย อย่างไรก็ตาม ด้วยการสุ่มค้นหาเนื้อหา วันหนึ่งฉันก็ได้พบกับภาพยนตร์คลาสสิก พวกเฮลไรเซอร์การรับชมแบบสบายๆ ทำให้ฉันประทับใจและประทับใจไม่รู้ลืม ฉันมั่นใจว่าผู้อ่านแต่ละคนได้รับการเติมเต็มในความรู้สึกทางวัฒนธรรมหรือสุนทรียภาพอย่างแม่นยำอย่างน้อยหนึ่งครั้งด้วยการค้นหาแบบสุ่มและการกระทำแบบสุ่ม ในทางกลับกัน ฉันค้นพบสิ่งที่น่าสนใจมากมายด้วยความช่วยเหลือจากคำแนะนำที่แหล่งข้อมูลเฉพาะเรื่องมอบให้ฉัน ฉันรู้จักภาพยนตร์ หนังสือ เพลงหรือผลิตภัณฑ์จำนวนมาก (และน่าสนใจ) เพียงเพราะระบบการแนะนำประสบความสำเร็จเท่านั้น สิ่งที่เป็นเรื่องปกติคือตอนนี้ฉันมักจะพึ่งพาคำแนะนำและมองหาบางสิ่งบางอย่างด้วยตัวเองไม่บ่อยนักเพราะไม่มีเวลาเหลือสำหรับอย่างหลัง!

สถานการณ์นี้รุนแรงขึ้นจากการที่ฉันเห็นขอบเขตที่อัลกอริธึมการแนะนำเริ่มเข้าใจฉันแล้ว หากความนิยมที่ประสบความสำเร็จก่อนหน้านี้ไม่เกิดขึ้นบ่อยนัก วันนี้อย่างน้อยครึ่งหนึ่งของสิ่งที่แนะนำก็ทำให้ฉันสนใจไม่ทางใดก็ทางหนึ่ง และเมื่อฉันยังคงพยายาม แทนที่จะยอมรับสิ่งที่เสนอให้ฉันอย่างไม่แยแส เพื่อค้นหาสิ่งที่คุ้มค่าด้วยตัวเอง ฉันก็ยอมแพ้อย่างรวดเร็วภายใต้แรงกดดันของความอุดมสมบูรณ์อันเหลือเชื่อและไม่เคยปรากฏมาก่อน และยิ่งคุณก้าวไปไกลเท่าไร ภาพของอนาคตอันไม่ไกลก็ชัดเจนขึ้นเท่านั้น เมื่อความเป็นจริงโดยรอบจะปรับให้เข้ากับบุคลิกภาพของคุณอย่างต่อเนื่อง เปลี่ยนแปลงและเรียนรู้อยู่ตลอดเวลา ไม่เคยมีมาก่อนในประวัติศาสตร์ของมนุษยชาติที่ความสะดวกสบายเป็นสิ่งที่น่ากลัวอย่างยิ่ง และไม่เคยมีช่องโหว่สำหรับการค้นพบแบบสุ่มอันเหลือเชื่อที่ถูกถอนออกจากการใช้งานอย่างรวดเร็วและเด็ดขาดขนาดนี้มาก่อน

การยอมรับอนาคตที่กำลังจะมาถึงอย่างที่เป็นอยู่ เป็นสิ่งที่ควรค่าแก่การเรียนรู้ที่จะประเมินมันอย่างมีวิจารณญาณ ระบุด้านที่น่าสงสัยหรือแม้แต่ด้านมืดด้วยความกระตือรือร้นแบบเดียวกับที่เรามุ่งมั่นที่จะใช้นวัตกรรมในชีวิตประจำวันที่ทำให้งานของเราง่ายขึ้นมาก เรามาลองทำความเข้าใจหัวข้อการสนทนาของเรากันวันนี้

วิธีการกรองที่ใช้ในระบบการแนะนำ

การกรองการทำงานร่วมกัน

การกรองแบบทำงานร่วมกันมีการใช้กันอย่างแพร่หลาย ไม่ใช่อย่างน้อยก็เนื่องจากความง่ายในการใช้งาน หลักการทำงานของมันนั้นเรียบง่ายจริงๆ แม้ว่าจะสามารถแบ่งออกเป็นสองแนวทางที่แตกต่างกันก็ตาม

แนวทางที่อิงตามการจับคู่ผู้ใช้ (รู้จักกันทั่วไปว่าอิงตามผู้ใช้) คำนึงถึงความคล้ายคลึงกันของผู้ใช้รายหนึ่งกับผู้ใช้รายอื่นที่เกี่ยวข้องกับระบบ ตัวอย่างเช่น หาก Vasily ประเมิน Lady Gaga, Oasis และ Led Zeppelin ในเชิงบวก ดังนั้น Anastasia ผู้รัก Lady Gaga และ Led Zeppelin ก็สามารถลองแนะนำ Oasis ได้

แนวคิดของการเปรียบเทียบวัตถุ (ตามรายการตามลำดับ) ตรงกันข้ามจะวิเคราะห์วัตถุและเผยให้เห็นความคล้ายคลึงกับวัตถุที่ Vasily เคยชอบ ในทางปฏิบัติดูเหมือนว่า Vasily เคยชอบ Radiohead และ Blur ทำไมเราไม่เสนอ Oasis ให้เขาด้วยล่ะ?

การกรองร่วมกันช่วยให้คุณได้รับคำแนะนำที่แม่นยำและเกี่ยวข้องสูง โดยอิงจากการวิเคราะห์และการเปรียบเทียบความแตกต่างระหว่างผู้ใช้ที่มีพฤติกรรมคล้ายกัน

Vasily และ Anastasia: คำแนะนำอัตโนมัติร่วมกันโดยพิจารณาจากความแตกต่างในการตั้งค่า

การกรองเนื้อหา

การสร้างการกรองเนื้อหา การสื่อสารภายในระหว่างผลิตภัณฑ์ที่นำเสนอหรือเนื้อหาใดๆ หลักการง่ายๆ นี้แสดงให้เห็นในการแนะนำวัตถุให้กับผู้ใช้ที่คล้ายกับวัตถุที่เขาเลือกไว้ก่อนหน้านี้ ตัวอย่างเช่น หากคุณซื้อคู่มือการเล่นกีตาร์ในร้านหนังสือ คุณจะได้รับคำแนะนำหรือคู่มือยอดนิยมอื่นๆ จากผู้เขียนคนเดียวกันโดยอัตโนมัติ ข้อได้เปรียบที่สำคัญของระบบการแนะนำที่ใช้หลักการกรองเนื้อหาคือความสามารถในการดึงดูดผู้ใช้ใหม่ในข้อเสนอตั้งแต่ก้าวแรกของผู้บริโภค คุณไม่จำเป็นต้องรวบรวมข้อมูลเกี่ยวกับการตั้งค่าของบุคคลเป็นเวลานาน คุณสามารถรวมผู้เยี่ยมชมให้ทำงานกับทรัพยากรได้ทันที นอกจากนี้ข้อดีที่สำคัญของการกรองเนื้อหาคือความสามารถในการแนะนำออบเจ็กต์ที่ไม่ได้รับการจัดอันดับและส่งต่อให้กับผู้ใช้แก่ผู้ใช้ ช่วงเวลาสุดท้ายมักเกิดขึ้นเมื่อใช้วิธีการทำงานร่วมกัน

การกรองเนื้อหาจะเพิกเฉยต่อความคิดเห็นของผู้ใช้เกี่ยวกับวัตถุบางอย่างโดยสิ้นเชิง ด้วยการสร้างการเชื่อมต่อระหว่างวัตถุเพียงอย่างเดียว เรามีโอกาสที่จะเสนอสิ่งที่คล้ายกับตำแหน่งที่เขาสนใจได้ทันทีโดยไม่ต้องรวบรวมการให้คะแนนและข้อมูลส่วนบุคคลเพิ่มเติม ด้วยการแยกประสบการณ์ผู้ใช้ออกจากระบบการแนะนำเป็นเนื้อหาพื้นฐาน ดูเหมือนว่าเราจะแก้ไขปัญหาที่เรียกว่าได้ “cold start” เมื่อข้อมูลผู้ใช้กระจัดกระจายทำให้ระบบไม่สามารถพัฒนาคำแนะนำส่วนบุคคลได้ อย่างไรก็ตาม ด้านหลังการกรองเนื้อหาประกอบด้วยคำแนะนำที่ไม่เหมาะสมอย่างยิ่งและบางครั้งก็ไร้สาระเช่น "คุณซื้อ Toyota RAV4 หรือไม่? คุณอาจสนใจ Toyota Highlander เช่นกัน!”

ปัญหาอีกประการหนึ่งที่เกี่ยวข้องกับการใช้หลักการกรองเนื้อหาคืองานจำนวนมากที่เกี่ยวข้องกับการสร้างการเชื่อมต่อระหว่างอ็อบเจ็กต์ทั้งหมดในระบบ แต่ข้อเสียเปรียบหลักของวิธีนี้แสดงออกมาในการโจมตีเป้าหมายที่ต่ำมากและบางครั้งก็ค่อนข้างมีเงื่อนไข การกรองเนื้อหาไม่ได้หมายความถึง ระดับสูงการปรับเปลี่ยนในแบบของคุณ ดังนั้นความถูกต้องของคำแนะนำจึงค่อนข้างต่ำ

การกรองตามความรู้ (ความรู้ซึ่งเป็นรากฐาน ระบบ)

ระบบประเภทนี้ใช้กันอย่างแพร่หลายในร้านค้าออนไลน์ โดยพื้นฐานแล้ว คำแนะนำตามความรู้นั้นคล้ายคลึงกับวิธีการกรองเนื้อหาก่อนหน้านี้ อย่างไรก็ตามอัลกอริธึมดังกล่าวใช้การวิเคราะห์วัตถุในเชิงลึกยิ่งขึ้น สร้างการเชื่อมโยงระหว่างวัตถุเหล่านั้นไม่เป็นไปตามเกณฑ์ซ้ำ ๆ ของความคล้ายคลึงกัน แต่ขึ้นอยู่กับความเชื่อมโยงระหว่างกันของสินค้าบางกลุ่ม .

ในทางปฏิบัติจะมีลักษณะเช่นนี้ - เมื่อซื้อสมาร์ทโฟน ไซต์จะเสนออุปกรณ์เสริมที่เหมาะกับการใช้งานกับอุปกรณ์ใหม่ของคุณ สิ่งเหล่านี้อาจเป็นเคส หูฟัง การ์ดหน่วยความจำ และอะไรทำนองนั้น คุณสามารถกระตุ้นผู้ซื้อเพิ่มเติมได้ด้วยการมอบส่วนลดสำหรับอุปกรณ์เสริมซึ่งจะมีประโยชน์มากเมื่อเชื่อมต่อกับการซื้ออุปกรณ์ใหม่

คำแนะนำตามองค์ความรู้แสดงให้เห็นผลลัพธ์ที่ดี เพิ่มการหมุนเวียนของเครือข่ายขนาดใหญ่ แพลตฟอร์มการซื้อขายสิบเปอร์เซ็นต์ นอกจากนี้ คำแนะนำประเภทนี้แตกต่างจากการกรองเนื้อหาตรงที่มีความแม่นยำสูง โดยแนะนำผู้ใช้ถึงสิ่งที่เขาอาจต้องการจริงๆ

หากคุณสนใจคำแนะนำที่ถูกต้อง คุณควรพิจารณาใช้ระบบฐานความรู้บนเว็บไซต์ของคุณอย่างแน่นอน เช่นเดียวกับการกรองเนื้อหา ระบบการแนะนำตามความรู้จะศึกษาและวิเคราะห์ความสัมพันธ์ระหว่างออบเจ็กต์ (ผลิตภัณฑ์) แต่ยังคำนึงถึงตัวเลือกเพิ่มเติมจำนวนหนึ่งที่เกี่ยวข้องกับคุณสมบัติแต่ละอย่างของผู้ใช้รายใดรายหนึ่งด้วย

ก) ความปรารถนาของผู้ใช้. สถานการณ์ที่ทุกคนคุ้นเคย - ไซต์ขอให้ผู้ใช้ระบุลักษณะที่ต้องการหลังจากนั้นจะนำเสนอผลิตภัณฑ์ที่ตรงกับคำขอ

Yandex.Market และช่องทำเครื่องหมายสำเร็จและ ตัวอย่างที่ส่องแสงระบบแนะนำที่แนะนำตามความต้องการของผู้ใช้

b) คุณลักษณะทางประชากรในความเป็นจริง ข้อมูลประชากรถูกใช้โดยโซเชียลเน็ตเวิร์กหลักๆ เช่น Facebook, LinkedIn, VKontakte และอื่นๆ เพื่อให้คำแนะนำ

แน่นอนว่าในการใช้ระบบดังกล่าวคุณต้องทำงานหนัก - คุณจะต้องรวบรวมและประมวลผลข้อมูลจำนวนมหาศาล

การกรองแบบไฮบริด

เครื่องมือที่ทรงพลังและใช้งานยากที่สุด เห็นได้ชัดว่าอนาคตอยู่ที่การรวมกลไกการแนะนำต่างๆ ไว้ในอัลกอริธึมอันทรงพลังเพียงตัวเดียว ความสะดวกสบายอย่างแท้จริงและความเป็นจริงส่วนบุคคลที่เราพูดถึงในตอนต้นของบทความจะได้รับการตระหนักรู้อย่างแม่นยำด้วยความช่วยเหลือของลูกผสมที่มากที่สุด วิธีการที่มีประสิทธิภาพคำแนะนำ

ตัวอย่างดังกล่าวแสดงให้เห็นโดย Netflix ซึ่งมีการปรับปรุงและปรับปรุงระบบการแนะนำแบบผสมที่ซับซ้อนซึ่งแสดงให้เห็นความแม่นยำที่เป็นเอกลักษณ์อย่างต่อเนื่อง การพัฒนาอัลกอริธึมที่ทรงพลังดังกล่าวส่วนใหญ่เกิดจากการให้ทุนสนับสนุนการวิจัยในด้านนี้โดย Netflix เอง ซึ่งในปี 2549 เสนอเงิน 1,000,000 ดอลลาร์สหรัฐฯ เพื่อปรับปรุงระบบการแนะนำ 10%

ทีมพัฒนา Pragmatic Chaos ของ BellKor ซึ่งสามารถปรับปรุงอัลกอริทึมได้เน็ตฟลิกซ์10.09%

คำไม่กี่คำเกี่ยวกับขั้นตอนการปฏิบัติเป็นข้อสรุป

ทางเลือก ประเภทเฉพาะการกรองหรือการรวมกันของวิธีการต่างๆ ขึ้นอยู่กับปัจจัยสองประการโดยตรง - ความซับซ้อนของโครงการของคุณและจำนวนเงินทุน ตัวอย่างเช่น การสร้างอัลกอริทึมสำหรับระบบบล็อกเฉพาะเรื่องที่ตัดกันเป็นงานที่ค่อนข้างง่ายและมีราคาแพงพอสมควร โครงการขนาดใหญ่และมีความหลากหลายมากขึ้น เช่น ร้านค้าออนไลน์ ต้องใช้ต้นทุนมากขึ้น โดยเฉพาะอย่างยิ่งหากเป้าหมายคือการเพิ่มคอนเวอร์ชันด้วยจำนวนที่มีนัยสำคัญอย่างแท้จริง ตามกฎแล้วในโครงการดังกล่าว เป็นไปไม่ได้ที่จะจำกัดตัวเองให้ใช้อัลกอริธึมการแนะนำเพียงประเภทเดียว และจำเป็นต้องใช้การกรองแบบไฮบริด ซึ่งส่งผลให้ต้นทุนและความซับซ้อนของการพัฒนาเพิ่มขึ้นตามลำดับความสำคัญ

ในการสร้าง ใช้งาน และแก้ไขข้อบกพร่องของอัลกอริธึมไฮบริด คุณจะต้องมีทีมนักพัฒนาที่มีประสบการณ์ทั้งทีม ซึ่งตระหนักดีว่าพีชคณิตเชิงเส้นและพีชคณิตเชิงสัมพันธ์คืออะไร และยังมีทักษะมากมายที่ทำให้ผู้สร้างอัลกอริธึมการแนะนำกลายเป็นอาชีพที่แยกจากกัน

ไม่ทางใดก็ทางหนึ่งเมื่อพัฒนาโครงการที่ให้โอกาสผู้ใช้ในการเลือกวัตถุเฉพาะจากชุดทั่วไปจำเป็นต้องคำนึงถึงความก้าวหน้าอย่างรวดเร็วของการใช้งานในทุกด้านอย่างแน่นอน ชีวิตมนุษย์ตั้งแต่การเพิ่มประสิทธิภาพการนอนหลับโดยใช้อุปกรณ์ที่วิเคราะห์กระบวนการทั้งหมดที่เกิดขึ้นในการนอนหลับและออกคำแนะนำในการปรับปรุง ไปจนถึงการเลือกอัตโนมัติ สินค้าในชีวิตประจำวันตามความต้องการปัจจุบันของผู้ใช้ ดังที่คุณทราบ เงื่อนไขที่ขาดไม่ได้สำหรับความสำเร็จของการดำเนินการใดๆ คือการสอดคล้องกับจิตวิญญาณแห่งยุคสมัย

เมื่อวันที่ 28 เมษายน 2016 เราได้ประกาศเปิดตัวหลักสูตรการปรับตัวครั้งแรกอย่างเป็นทางการบน Stepic.org ซึ่งเลือกปัญหา Python ขึ้นอยู่กับระดับของนักเรียน ก่อนหน้านี้ เรายังนำบทเรียนที่แนะนำมาใช้งานบนแพลตฟอร์ม เพื่อให้นักเรียนไม่ลืมสิ่งที่พวกเขาทำไปแล้ว และจะได้ค้นพบหัวข้อใหม่ๆ ที่อาจจะสนใจ

ภายใต้การตัดมีสองหัวข้อหลัก:

  • เกี่ยวกับการศึกษาออนไลน์ ข้อดี/ข้อเสีย/ข้อผิดพลาด
  • การจำแนกประเภทของระบบผู้แนะนำ การนำไปใช้ในการศึกษา ตัวอย่าง

เกี่ยวกับการศึกษาออนไลน์ ข้อดี ข้อเสีย และข้อผิดพลาด

ส่วนนี้ส่วนใหญ่เป็นการแนะนำลักษณะการศึกษาออนไลน์ รายละเอียดที่น่าตื่นเต้นของระบบการแนะนำใต้ภาพต่อไปนี้ :)

ใน โลกสมัยใหม่การศึกษาออนไลน์กำลังได้รับความนิยมมากขึ้นเรื่อยๆ โอกาสในการเรียนรู้จากอาจารย์ชั้นนำ สถาบันการศึกษาศึกษาพื้นที่ใหม่ๆ ได้ความรู้ที่จำเป็นสำหรับการทำงานโดยไม่ต้องออกจากบ้าน ดึงดูดผู้คนจำนวนมาก

รูปแบบหนึ่งของการเรียนรู้ออนไลน์ที่พบบ่อยที่สุดคือหลักสูตรออนไลน์แบบเปิดขนาดใหญ่ (MOOCs, Massive Open Online Courses) ส่วนใหญ่มักประกอบด้วยวิดีโอ สไลด์ และ เนื้อหาข้อความจัดเตรียมโดยอาจารย์ตลอดจนงานทดสอบความรู้ซึ่งปกติจะมีการตรวจสอบโดยอัตโนมัติแต่นักเรียนก็สามารถตรวจสอบงานของกันและกันได้เช่นกัน สามารถเสนอประเภทงานได้หลากหลายประเภทเป็นงาน: จาก ทางเลือกง่ายๆคำตอบที่ถูกต้องก่อนเขียนเรียงความ และเช่นเดียวกับที่เราทำใน Stepik คือการเขียนโปรแกรมงานด้วยการตรวจสอบอัตโนมัติ

การศึกษาออนไลน์มีลักษณะเฉพาะของตัวเองที่แตกต่างจากการศึกษาแบบออฟไลน์ทั่วไป ข้อดีประการแรกคือทุกคนที่สามารถเข้าถึงอินเทอร์เน็ตได้ดังกล่าวข้างต้น ประการที่สอง มีความสามารถในการปรับขนาดได้เกือบไม่จำกัด: ต้องขอบคุณการตรวจสอบงานโดยอัตโนมัติ ทำให้ผู้คนหลายพันคนสามารถเรียนในหลักสูตรไปพร้อมๆ กัน ซึ่งเทียบไม่ได้กับหลักสูตรทั่วไปใน ห้องเรียน. ประการที่สาม นักเรียนแต่ละคนสามารถเลือกเวลาและจังหวะที่สะดวกในการกรอกสื่อการสอนได้ ประการที่สี่ นักการศึกษาสามารถเข้าถึงข้อมูลมากมายเกี่ยวกับวิธีการที่ผู้ใช้เรียนจบหลักสูตร ซึ่งพวกเขาสามารถนำไปใช้ในการวิเคราะห์และปรับปรุงสื่อการสอนของตนได้

ในขณะเดียวกันการเรียนรู้ออนไลน์ก็มีข้อเสียเช่นกัน แตกต่างจากการศึกษาแบบดั้งเดิมที่นักเรียนจะได้รับแรงจูงใจจากการประเมินผลการเรียนของเขาเสมอ ในกรณีของหลักสูตรออนไลน์จะไม่มีโทษหากไม่ผ่านหลักสูตร ด้วยเหตุนี้ ส่วนแบ่งของผู้ที่จบหลักสูตรของผู้ที่ลงทะเบียนหลักสูตรนี้จึงแทบจะไม่เกิน 10% (ในหลักสูตร Stepik ของเรา หลักสูตร "ความรู้พื้นฐานทางสถิติ" ของ Anatoly Karpov เป็นหลักสูตรที่ดีที่สุดตาม EdCrunch Awards 2015; บันทึก 17% ของ ผู้ที่ลงทะเบียนผ่านการเปิดตัวครั้งแรก แต่นี่ค่อนข้างเป็นข้อยกเว้น) นอกจากนี้เนื่องจากมีนักเรียนจำนวนมากครูจึงไม่มีโอกาสให้ความสนใจนักเรียนแต่ละคนเป็นรายบุคคลตามระดับและความสามารถของเขา


เรากำหนดหน้าที่ของตัวเองในการสร้างระบบการแนะนำที่สามารถแนะนำนักเรียนเกี่ยวกับเนื้อหาที่น่าสนใจสำหรับเขา และคำนึงถึงระดับการเตรียมตัวและช่องว่างในความรู้ของเขาด้วย นอกจากนี้ระบบจะต้องสามารถประเมินความซับซ้อนของเนื้อหาได้ นี่เป็นสิ่งจำเป็นโดยเฉพาะอย่างยิ่งสำหรับคำแนะนำแบบปรับเปลี่ยนได้ซึ่งจะช่วยให้ผู้ใช้ศึกษาเนื้อหา ปรับให้เข้ากับเนื้อหาได้อย่างยืดหยุ่น โดยนำเสนอเนื้อหาที่เขาต้องการเพื่อการเรียนรู้ในตอนนี้ ระบบดังกล่าวจะเป็นประโยชน์ต่อผู้ใช้ด้วยคำแนะนำบทเรียนส่วนบุคคลที่สามารถช่วยให้พวกเขาเรียนรู้หัวข้อเฉพาะหรือเสนอสิ่งใหม่ ๆ

โดยทั่วไปแล้ว การเรียนรู้ควรจะน่าสนใจยิ่งขึ้น!

ตัวอย่างแรกๆ ของระบบการแนะนำสมัยใหม่คือ movielens.org ซึ่งแนะนำภาพยนตร์ให้กับผู้ใช้ตามความต้องการ บริการนี้น่าสนใจเพราะมอบชุดข้อมูลมากมายเกี่ยวกับภาพยนตร์และเรตติ้งที่ผู้ใช้มอบให้พวกเขา ชุดข้อมูลนี้ถูกนำมาใช้ในการวิจัยจำนวนมากในด้านระบบผู้แนะนำในช่วงสองทศวรรษที่ผ่านมา

  • ระบบที่ใช้การกรองเนื้อหา ระบบดังกล่าวนำเสนอเนื้อหาที่คล้ายกับสิ่งที่พวกเขาได้ศึกษาก่อนหน้านี้ ความคล้ายคลึงกันคำนวณโดยใช้ลักษณะของวัตถุที่กำลังเปรียบเทียบ ตัวอย่างเช่น ความเกี่ยวข้องประเภทหรือนักแสดงอาจใช้เพื่อแนะนำภาพยนตร์ วิธีการนี้ใช้ในการให้บริการจัดอันดับ ค้นหา และแนะนำภาพยนตร์ ฐานข้อมูลภาพยนตร์ทางอินเทอร์เน็ต
  • ระบบที่ใช้การกรองร่วม ในกรณีนี้ ผู้ใช้จะได้รับเนื้อหาที่เป็นที่สนใจของผู้ใช้ที่คล้ายกัน คำแนะนำของบริการ MovieLens ขึ้นอยู่กับแนวทางนี้โดยเฉพาะ
  • ระบบไฮบริดผสมผสานสองแนวทางก่อนหน้านี้ ระบบประเภทนี้ใช้ใน Netflix ซึ่งเป็นบริการสำหรับการชมภาพยนตร์และละครโทรทัศน์แบบออนไลน์

เราสร้างระบบไฮบริดที่มีการใช้งานการกรองเนื้อหามากขึ้น และการใช้งานการกรองร่วมกันน้อยลง

มีงานวิจัยมากมายเกี่ยวกับระบบผู้แนะนำสำหรับการเรียนรู้ที่เน้นเทคโนโลยีมากขึ้น ความเฉพาะเจาะจงของงานในกรณีนี้จะเพิ่มทิศทางใหม่สำหรับการพัฒนาระบบผู้แนะนำ


คุณสมบัติของระบบการแนะนำของโครงการการศึกษามีอะไรบ้าง?

ประการแรก คุณสามารถสร้างระบบการแนะนำแบบปรับเปลี่ยนได้ซึ่งจะปรับให้เข้ากับความต้องการของผู้ใช้ในช่วงเวลาหนึ่งๆ และเสนอวิธีที่ดีที่สุดในการศึกษาเนื้อหาให้กับเขา ในรูปแบบนี้ สามารถใช้เครื่องจำลองต่างๆ ได้ เช่น ในวิชาคณิตศาสตร์หรือภาษาโปรแกรมบางภาษา ซึ่งมีงานหลายอย่างที่มีความซับซ้อนต่างกันออกไป ซึ่งงานที่แตกต่างกันจะเหมาะกับนักเรียนที่แตกต่างกันในเวลาใดก็ตาม

ประการที่สอง เป็นไปได้ที่จะแยกการพึ่งพาระหว่างสื่อการฝึกอบรมจากข้อมูลที่เกี่ยวกับวิธีการที่ผู้ใช้ดำเนินการให้เสร็จสิ้น

ข้อมูลนี้สามารถช่วยแยกแต่ละหัวข้อในเนื้อหา การเชื่อมต่อระหว่างหัวข้อเหล่านี้ และความสัมพันธ์ในความซับซ้อน

Coursera, EdX, Udacity (แพลตฟอร์มการเรียนรู้ออนไลน์) ใช้ระบบการแนะนำเพื่อแนะนำหลักสูตรให้กับผู้ใช้ที่อาจเป็นที่สนใจ ข้อเสียของคำแนะนำเหล่านี้คือสามารถเสนอได้เฉพาะหลักสูตรทั้งหมดเท่านั้น แต่ไม่ใช่บางส่วน แม้ว่าผู้ใช้จะสนใจเฉพาะในส่วนนั้นก็ตาม นอกจากนี้ระบบที่สร้างขึ้นในลักษณะนี้ไม่สามารถช่วยให้ผู้ใช้เรียนหลักสูตรที่เขาเลือกได้

ในทางกลับกัน ระบบการแนะนำทรัพยากรของ MathsGarden ทำงานร่วมกับเนื้อหาที่เล็กที่สุด - งานแต่ละงาน เป็นเครื่องจำลองคณิตศาสตร์ระดับประถมศึกษาสำหรับนักเรียน โรงเรียนประถมซึ่งเสนองานของนักเรียนที่เหมาะกับเขาอย่างเหมาะสมที่สุด ช่วงเวลานี้เวลาตามความซับซ้อน
เมื่อต้องการทำเช่นนี้ ระบบจะคำนวณและเปลี่ยนแปลงคุณลักษณะสัมพัทธ์ของความรู้ของนักเรียนแบบไดนามิก รวมถึงลักษณะของความซับซ้อนของงาน แต่จะเพิ่มเติมในภายหลัง

ในบทความต่อไปนี้ เราจะพูดถึงรายละเอียดเพิ่มเติมเกี่ยวกับอุปกรณ์ Stepic.org และการใช้งานระบบผู้แนะนำ กำหนดว่าระบบผู้แนะนำแบบปรับเปลี่ยนคืออะไร และวิเคราะห์ผลลัพธ์ที่ได้รับโดยละเอียด มันจะสนุก:)

เริ่มต้นด้วยการกำหนดว่าระบบผู้แนะนำคืออะไร นี่คือโปรแกรมและบริการที่พยายามกำหนดว่าผู้ใช้ต้องการดูอะไรและมอบให้พวกเขา (หรือแนะนำ จึงเป็นที่มาของชื่อ) เราแต่ละคนคงเคยพบเทคนิคที่คล้ายกันในไซต์ต่างๆ วันนี้เราจะอธิบายประเภทและหลักการทำงานของโปรแกรมดังกล่าว และยกตัวอย่างการทำงานของอัลกอริทึมเหล่านี้ด้วย อ่านให้จบจะน่าสนใจ!

ข้างต้นเราได้อธิบายไปแล้วว่าระบบผู้แนะนำคืออะไร ตอนนี้เราจะบอกคุณในรายละเอียดเพิ่มเติมเกี่ยวกับความสำคัญของระบบเหล่านั้น โปรแกรมเหล่านี้ได้ปรับปรุงวิธีการโต้ตอบระหว่างไซต์และผู้เยี่ยมชม เนื่องจากแทนที่จะให้ข้อมูลคงที่ ผู้ใช้จะได้รับประสบการณ์เชิงโต้ตอบ

คำแนะนำจะถูกสร้างขึ้นแยกกันสำหรับแต่ละบุคคล ตามการกระทำก่อนหน้านี้ของเขาในแหล่งข้อมูลบนเว็บที่เฉพาะเจาะจง หรือตามกิจกรรมที่ผ่านมา นอกจากนี้ พฤติกรรมของผู้เข้าร่วมก่อนหน้านี้ในกระบวนการก็มีความสำคัญเช่นกัน

โดยหลักการแล้ว นี่คือฟังก์ชันที่สำคัญสำหรับร้านค้าออนไลน์ และสำหรับแคตตาล็อกขนาดใหญ่ เช่น Amazon นี่เป็นหนึ่งในไม่กี่วิธีในการทำงานอย่างมีประสิทธิภาพ วิธีการแนะนำในกรณีนี้ไม่ใช่ตัวเลือกเพิ่มเติมปกติ แต่ให้ความสะดวกในการนำทางผู้ใช้ผ่านทรัพยากรบนเว็บ ถ้า แคตตาล็อกดิจิทัลมีผลิตภัณฑ์มากกว่า 20,000 รายการ การปฐมนิเทศดูเหมือนจะยากลำบากแล้ว เราจะว่าอย่างไรหากมีผลิตภัณฑ์นับล้าน?

มันเหนื่อยแค่ไหนที่ผู้ซื้อที่มีศักยภาพจะต้องโต้ตอบกับไซต์ดังกล่าว? คำตอบนั้นชัดเจน และวิดเจ็ตสำหรับค้นหาผลิตภัณฑ์ที่มีลักษณะคล้ายกับผลิตภัณฑ์ที่คุณกำลังมองหาหรืออยู่ในกลุ่มผลิตภัณฑ์เดียวกันหรือผลิตภัณฑ์เสริม (เมื่อคุณถูกเสนอให้เลือกกระเป๋าถือสำหรับรองเท้าคู่หนึ่ง) มา ช่วยเหลือ. โซลูชันนี้ไม่เพียงเพิ่มจำนวนการดูเท่านั้น แต่ยังส่งผลดีต่อคอนเวอร์ชันอีกด้วย

ตามที่แสดงในทางปฏิบัติ ไม่เพียงแต่ร้านค้าออนไลน์เท่านั้นที่ใช้เทคนิคนี้ สื่อสังคมก็ไม่ล้าหลังเช่นกัน ด้านล่างนี้เป็นตัวอย่างจาก VKontakte

นอกจากนี้ เทคนิคที่คล้ายกันสามารถเห็นได้ง่ายบนแพลตฟอร์มโซเชียลต่างๆ พอร์ทัลสำหรับวรรณกรรม การท่องเที่ยว แหล่งข่าว ร้านค้าออนไลน์ หรือพูดง่ายๆ ก็คือเกือบทุกที่ เทคนิคนี้เป็นที่นิยมมากจริงๆ ทรัพยากรบนเว็บ Kinopoisk เป็นอีกตัวอย่างหนึ่งที่สามารถเข้าถึงได้

เทคนิค

ดังนั้นประเภทแรกคือการรวบรวมข้อมูลที่ชัดเจน ดังที่คุณอาจเดาได้จากชื่อ ผู้ใช้เองก็เตรียมวัสดุที่จำเป็นสำหรับการทำงานเอง ตัวอย่างเช่น เมื่อระบบการแนะนำ Yandex หรือเครื่องมือค้นหาอื่น ๆ ขอให้บุคคลให้คะแนนองค์ประกอบต่าง ๆ สร้างรายการโปรดในบางพื้นที่ หรือตอบคำถามหลายข้อ หากบุคคลปฏิเสธที่จะให้ข้อมูลด้วยตนเอง เทคนิคต่อไปนี้จะเกี่ยวข้อง

ประเภทที่สองคือการรวบรวมข้อมูลโดยนัย ในทางกลับกันนี่เป็นภารกิจสายลับซึ่งการกระทำของผู้เข้าร่วมในกระบวนการจะถูกบันทึกโดยโปรแกรมเพื่อการประมวลผลและการใช้งานต่อไป คุณต้องการอะไรสำหรับสิ่งนี้? โปรแกรมจดจำการซื้อ การให้คะแนนบนเว็บไซต์ รวบรวมข้อมูลการดูและความคิดเห็น แน่นอนว่าการเลือกเทคนิคดังกล่าวก่อให้เกิดปัญหาด้านจริยธรรมเนื่องจากการปกป้องข้อมูลส่วนบุคคลเป็นหนึ่งในข้อกำหนดหลักที่ผู้ใช้กำหนดไว้ในเครื่องมือค้นหา แต่สำหรับตอนนี้ ความจริงยังคงอยู่ว่าการเฝ้าระวังบางประเภทเป็นไปได้ และผู้เยี่ยมชมเว็บไซต์ทั่วไปไม่สามารถตรวจสอบได้ว่าเหตุการณ์ดังกล่าวเกิดขึ้นจริงหรือไม่

เทคนิคพื้นฐานแรกเรียกว่าการกรองร่วมกัน คำแนะนำในการใช้เทคนิคนี้จัดทำขึ้นตามลักษณะพฤติกรรมของบุคคลหนึ่งหรือกลุ่มคนซึ่งอย่างหลังจะมีประสิทธิภาพมากกว่า กลุ่มรวบรวมคนที่มีพฤติกรรมและลักษณะคล้ายคลึงกัน

ขอยกตัวอย่างเพื่อให้ข้อมูลเข้าใจง่ายขึ้น กำลังสร้างเว็บไซต์เพื่อแนะนำผลงานดนตรีแก่ผู้ชม บริการแนะนำตามวิธีการทำงานร่วมกันจะทำงานอย่างไรในกรณีนี้ ตามหลักการนี้: ชุมชนหนึ่งจะถูกนำมาใช้เป็นพื้นฐานโดยที่ผู้เข้าร่วมจะเพิ่มแทร็กประเภทเดียวกันลงในเพลย์ลิสต์ ต่อไปจะพิจารณาและแนะนำเพลงที่ได้รับความนิยมสูงสุดจากกลุ่มทั้งหมดให้กับผู้ใช้หนึ่งรายจากกลุ่มที่ยังไม่ได้ฟังทำนองนี้

แนวทางที่สองเรียกว่าการกรองตามเนื้อหา คำแนะนำนี้สร้างขึ้นจากพฤติกรรมของมนุษย์ วิธีการนี้ยังสามารถนำประวัติการเข้าชมของผู้เข้าร่วมรายใดรายหนึ่งเป็นพื้นฐานได้อีกด้วย

คราวนี้เราจะยกตัวอย่างนิตยสารออนไลน์ที่มีเนื้อหาเฉพาะเรื่อง ดังนั้นในกรณีที่บุคคลเคยอ่านเนื้อหาเกี่ยวกับจักรยานเสือภูเขาและแสดงความคิดเห็นในบทความในบล็อกที่มีเนื้อหาดังกล่าวเป็นประจำ วิธีการกรองเนื้อหาจะใช้ข้อมูลที่ผ่านมานี้เพื่อระบุแหล่งข้อมูลที่คล้ายกันและแนะนำให้เขาเป็นคำแนะนำสำหรับผู้ใช้นั้น .

นอกจากนี้ยังมีแนวทางที่หลากหลาย ซึ่งใช้ในการพัฒนาระบบข้อเสนอแนะ

แนวทางแบบผสมผสานคือการผสมผสานระหว่างการทำงานร่วมกันและการกรองเนื้อหา ดังที่เราทราบ ยิ่งมากก็ยิ่งดี ดังนั้นการผสมผสานเทคนิคทั้งสองนี้เข้าด้วยกันจึงเพิ่มประสิทธิภาพของระบบการแนะนำ กล่าวคือ เพิ่มความแม่นยำในการทำนายสำหรับบุคคลที่เฉพาะเจาะจงได้อย่างมาก

อัลกอริทึม

ความสัมพันธ์แบบเพียร์สัน

อัลกอริทึมนี้ให้คุณเลือกได้ ลักษณะทั่วไประหว่างผู้ใช้หลายคน ยังไง? การใช้คณิตศาสตร์อย่างง่าย คือ การกำหนดความสัมพันธ์เชิงเส้นระหว่างสององค์ประกอบ จุดสำคัญ- เทคนิคนี้ไม่เหมาะกับคนในชุมชน

การจัดกลุ่ม

หลักการทำงานของระบบผู้แนะนำนี้ขึ้นอยู่กับการระบุความคล้ายคลึงกันระหว่างองค์ประกอบ (ผู้ใช้) โดยการคำนวณความใกล้เคียงกันในพื้นที่ที่เรียกว่าคุณลักษณะ สัญญาณคือองค์ประกอบเหล่านั้นซึ่งความสนใจของผู้เข้าร่วมบางคนในกระบวนการมาบรรจบกัน (สำหรับแหล่งข้อมูลเพลงนี่คือแทร็กสำหรับพอร์ทัลภาพยนตร์ - ภาพยนตร์) ผู้ใช้ที่มีลักษณะคล้ายกันจะถูกรวมเข้าเป็นกลุ่มที่เรียกว่าคลัสเตอร์

อัลกอริธึมการกรองการทำงานร่วมกัน

การทำคลัสเตอร์แบบฮาร์ดสามารถถูกแทนที่ด้วยอัลกอริธึมอื่น ซึ่งทำงานตามสูตรที่ค่อนข้างซับซ้อน และเช่นเดียวกับสูตรก่อนหน้าทั้งหมด ขึ้นอยู่กับพฤติกรรมของผู้ใช้จากกลุ่มของมัน อย่างไรก็ตาม เทคนิคนี้มีข้อเสียค่อนข้างสำคัญหลายประการ ประการแรก เป็นเรื่องยากสำหรับผู้ใช้ใหม่หรือผู้ใช้ที่ไม่ปกติ (ผู้ที่ไม่ได้สร้างกลุ่ม) เพื่อค้นหาคำแนะนำ ประการที่สองสิ่งที่เรียกว่า "การเริ่มเย็น" เมื่อวัตถุใหม่ไม่เข้าสู่ระบบการแนะนำ

อัลกอริธึมการกรองเนื้อหา

อัลกอริธึมมีความสมมาตรกับอันก่อนหน้า แต่ถ้าในกรณีแรกเราเริ่มต้นจากสมมติฐานที่ว่าผู้ใช้จะชอบวัตถุเพราะ "เพื่อนร่วมชั้น" ของเขาชอบ จากนั้นเราจะแนะนำที่นี่โดยอิงจากวัตถุที่คล้ายกันที่เขาบันทึกไว้แล้ว ตัวเขาเอง. และตามธรรมเนียมแล้วสามารถระบุปัญหาหลายประการได้ "การเริ่มเย็น" แบบเดียวกันและความจริงที่ว่าคำแนะนำมักเป็นเรื่องธรรมดา

แทนที่จะได้ข้อสรุป

ดังนั้นเราจึงได้ให้ข้อมูลทั้งหมดที่ผู้เริ่มต้นหรือคนธรรมดาควรรู้เกี่ยวกับระบบการแนะนำ บอกตามตรงว่าอัลกอริทึมค่อนข้างยากสำหรับผู้ที่ไม่ได้รับการฝึกฝน ดังนั้นบทความนี้จึงไม่มีสูตรทางคณิตศาสตร์ แม้ว่าอัลกอริทึมจะขึ้นอยู่กับสูตรเหล่านั้นก็ตาม

โปรแกรมแนะนำเป็นบริการที่เป็นประโยชน์สำหรับทั้งผู้ใช้อินเทอร์เน็ตทั่วไป นักวิจัย และนักธุรกิจออนไลน์ ผู้ที่ต้องการเพิ่มคอนเวอร์ชั่นและจำนวนการดูควรใส่ใจกับเทคนิคนี้ และต้องแน่ใจว่าได้นำไปใช้เพื่อเพิ่มประสิทธิภาพของทรัพยากรบนเว็บ โดยเฉพาะร้านค้าออนไลน์