การสร้างข้อมูลลูกค้าทั่วโลกเพิ่มขึ้นในอัตราที่ไม่เคยมีมาก่อน บริษัทต่างๆ ใช้ประโยชน์จาก AI และการเรียนรู้ของเครื่องเพื่อใช้ข้อมูลนี้ในรูปแบบที่สร้างสรรค์ ระบบคำแนะนำที่ขับเคลื่อนด้วย ML สามารถใช้ข้อมูลลูกค้าได้อย่างมีประสิทธิภาพเพื่อปรับเปลี่ยนประสบการณ์ของผู้ใช้ให้เป็นส่วนตัว เพิ่มการมีส่วนร่วมและการรักษาลูกค้า และเพิ่มยอดขายในที่สุด

ตัวอย่างเช่น ในปี 2021 Netflix รายงานว่าระบบแนะนำช่วยเพิ่มรายได้ 1 พันล้านดอลลาร์ต่อปี Amazon เป็นอีกหนึ่งบริษัทที่ได้รับประโยชน์จากการให้คำแนะนำเฉพาะบุคคลแก่ลูกค้า ในปี 2021 Amazon รายงานว่าระบบคำแนะนำช่วยเพิ่มยอดขายได้ถึง 35%

ใน บทความนี้เราจะสำรวจระบบคำแนะนำโดยละเอียดและให้กระบวนการทีละขั้นตอนสำหรับการสร้างระบบคำแนะนำโดยใช้แมชชีนเลิร์นนิง

ระบบคำแนะนำคืออัลกอริทึมที่ใช้การวิเคราะห์ข้อมูลและเทคนิคการเรียนรู้ของเครื่องเพื่อแนะนำข้อมูลที่เกี่ยวข้อง (ภาพยนตร์ วิดีโอ รายการ) สำหรับผู้ใช้ที่พวกเขาอาจพบว่าน่าสนใจ

ระบบเหล่านี้วิเคราะห์ข้อมูลจำนวนมากเกี่ยวกับพฤติกรรม ความชอบ และความสนใจในอดีตของผู้ใช้โดยใช้อัลกอริทึมแมชชีนเลิร์นนิง เช่น การจัดกลุ่ม การกรองร่วมกัน และเครือข่ายนิวรัลเชิงลึกเพื่อสร้างคำแนะนำเฉพาะบุคคล

Netflix, Amazon และ Spotify เป็นตัวอย่างที่รู้จักกันดีของระบบคำแนะนำที่มีประสิทธิภาพ Netflix ให้คำแนะนำเกี่ยวกับภาพยนตร์ในแบบของคุณ Amazon แนะนำผลิตภัณฑ์ตามการซื้อและประวัติการเข้าชมในอดีต และ Spotify ให้คำแนะนำเกี่ยวกับเพลย์ลิสต์และเพลงในแบบของคุณโดยอิงตามประวัติการฟังและความชอบ

1. การระบุปัญหาและการกำหนดเป้าหมาย

ขั้นตอนแรกคือการกำหนดปัญหาให้ชัดเจนซึ่งระบบคำแนะนำจะแก้ไข ตัวอย่างเช่น เราต้องการสร้างระบบคำแนะนำแบบ Amazon ที่แนะนำผลิตภัณฑ์ให้กับลูกค้าโดยพิจารณาจากการซื้อที่ผ่านมาและประวัติการเรียกดู

เป้าหมายที่ชัดเจนช่วยในการกำหนดข้อมูลที่จำเป็น การเลือกเครื่องที่เหมาะสม-แบบจำลองการเรียนรู้และการประเมินประสิทธิภาพของระบบผู้แนะนำ

2. การรวบรวมข้อมูลและการประมวลผลล่วงหน้า

ขั้นตอนต่อไปคือการรวบรวมข้อมูลเกี่ยวกับพฤติกรรมของลูกค้า เช่น การซื้อที่ผ่านมา ประวัติการเข้าชม บทวิจารณ์ และการให้คะแนน ในการประมวลผลข้อมูลธุรกิจจำนวนมาก เราสามารถใช้ Apache Hadoop และ Apache Spark

หลังจากการรวบรวมข้อมูล วิศวกรข้อมูลจะประมวลผลล่วงหน้าและวิเคราะห์ข้อมูลนี้ ขั้นตอนนี้เกี่ยวข้องกับการล้างข้อมูล การลบรายการที่ซ้ำกัน และการจัดการค่าที่ขาดหายไป นอกจากนี้ วิศวกรข้อมูลยังแปลงข้อมูลนี้เป็นรูปแบบที่เหมาะสมสำหรับอัลกอริทึมการเรียนรู้ของเครื่อง

ต่อไปนี้คือไลบรารีการประมวลผลข้อมูลล่วงหน้าที่ใช้ Python ซึ่งเป็นที่นิยม:

Pandas: จัดเตรียมวิธีการจัดการ การแปลง และการวิเคราะห์ข้อมูลNumPy: จัดเตรียมการคำนวณเชิงตัวเลขที่มีประสิทธิภาพสำหรับอาร์เรย์และ เมทริกซ์

3. การวิเคราะห์ข้อมูลเชิงสำรวจ

การวิเคราะห์ข้อมูลเชิงสำรวจ (EDA) ช่วยให้เข้าใจการกระจายข้อมูลและความสัมพันธ์ระหว่างตัวแปร ซึ่งสามารถใช้เพื่อสร้างคำแนะนำที่ดีขึ้นได้

ตัวอย่างเช่น คุณสามารถนึกภาพได้ว่ารายการใดบ้าง ขายได้มากที่สุดในไตรมาสที่แล้ว หรือรายการใดจะขายได้มากขึ้นเมื่อลูกค้าซื้อสินค้าเฉพาะ เช่น ไข่จะขายได้มากขึ้นพร้อมกับขนมปังและเนย

ต่อไปนี้เป็นไลบรารี่ Python ที่เป็นที่นิยมสำหรับการวิเคราะห์ข้อมูลเชิงสำรวจ:

Matplotlib: นำเสนอวิธีการแสดงข้อมูลเพื่อสร้างพล็อตต่างๆ เช่น ฮิสโตแกรม แผนภาพกระจาย แผนภูมิวงกลม ฯลฯSeaborn: นำเสนอวิธีการสร้างการแสดงภาพขั้นสูง เช่น แผนที่ความร้อนและแผนภาพคู่โปรไฟล์ Pandas: สร้างรายงานด้วยสถิติเชิงพรรณนาและการแสดงภาพสำหรับแต่ละตัวแปรในชุดข้อมูล

4. วิศวกรรมคุณลักษณะ

วิศวกรรมคุณลักษณะเกี่ยวข้องกับการเลือกคุณลักษณะที่เหมาะสมที่สุดเพื่อฝึกฝนโมเดลแมชชีนเลิร์นนิงของคุณ ขั้นตอนนี้เกี่ยวข้องกับการสร้างคุณลักษณะใหม่หรือการเปลี่ยนแปลงคุณลักษณะที่มีอยู่เพื่อให้เหมาะสมกับระบบคำแนะนำมากขึ้น

ตัวอย่างเช่น ภายในข้อมูลลูกค้า คุณลักษณะต่างๆ เช่น การให้คะแนนผลิตภัณฑ์ ความถี่ในการซื้อ และข้อมูลประชากรของลูกค้ามีความเกี่ยวข้องมากกว่าสำหรับ สร้างระบบคำแนะนำที่แม่นยำ

ต่อไปนี้คือไลบรารี Python ที่ได้รับความนิยมบางส่วนสำหรับการทำวิศวกรรมคุณลักษณะ:

Scikit-learn

Scikit-learn

: รวมเครื่องมือสำหรับการเลือกคุณลักษณะและการแยกคุณลักษณะ เช่น Principal Component Analysis (PCA) และ Feature Agglomerationตัวเข้ารหัสหมวดหมู่: ระบุวิธีการเข้ารหัสตัวแปรหมวดหมู่ เช่น การแปลงตัวแปรหมวดหมู่เป็นคุณสมบัติตัวเลข

5. การเลือกรุ่น

เป้าหมายของการเลือกรุ่นคือการเลือกอัลกอริทึมการเรียนรู้ของเครื่องที่ดีที่สุด ซึ่งสามารถคาดการณ์ได้อย่างแม่นยำถึงผลิตภัณฑ์ที่ลูกค้ามีแนวโน้มที่จะซื้อหรือภาพยนตร์ที่พวกเขาน่าจะรับชมโดยพิจารณาจากพฤติกรรมที่ผ่านมา

อัลกอริทึมบางส่วนได้แก่:

i. การกรองร่วมกัน

การกรองร่วมกันเป็นเทคนิคการแนะนำที่ได้รับความนิยม ซึ่งถือว่าผู้ใช้ที่มีความชอบคล้ายกันมักจะซื้อผลิตภัณฑ์ที่คล้ายกัน หรือผลิตภัณฑ์ที่มีคุณลักษณะคล้ายกันมักจะถูกซื้อโดยลูกค้า

ii. การกรองตามเนื้อหา

แนวทางนี้เกี่ยวข้องกับการวิเคราะห์แอตทริบิวต์ของผลิตภัณฑ์ เช่น แบรนด์ ประเภท หรือราคา และแนะนำผลิตภัณฑ์ที่ตรงกับความต้องการของผู้ใช้

iii. การกรองแบบผสมผสาน

การกรองแบบผสมผสานผสมผสานการกรองแบบทำงานร่วมกันและเทคนิคการกรองตามเนื้อหาเพื่อเอาชนะข้อจำกัดโดยใช้ประโยชน์จากจุดแข็งเพื่อให้คำแนะนำที่แม่นยำยิ่งขึ้น

6. การฝึกโมเดล

ขั้นตอนนี้เกี่ยวข้องกับการแบ่งข้อมูลออกเป็นชุดการฝึกและการทดสอบ และใช้อัลกอริทึมที่เหมาะสมที่สุดในการฝึกโมเดลผู้แนะนำ อัลกอริทึมการฝึกอบรมระบบคำแนะนำที่ได้รับความนิยม ได้แก่

i. การแยกตัวประกอบเมทริกซ์

เทคนิคนี้ทำนายค่าที่ขาดหายไปในเมทริกซ์กระจัดกระจาย ในบริบทของระบบคำแนะนำ Matrix Factorization จะคาดการณ์การให้คะแนนของผลิตภัณฑ์ที่ผู้ใช้ยังไม่ได้ซื้อหรือให้คะแนน

ii. การเรียนรู้เชิงลึก

เทคนิคนี้เกี่ยวข้องกับการฝึกโครงข่ายประสาทเทียมเพื่อเรียนรู้รูปแบบและความสัมพันธ์ที่ซับซ้อนในข้อมูล ในระบบคำแนะนำ การเรียนรู้เชิงลึกสามารถเรียนรู้ปัจจัยที่มีอิทธิพลต่อความชอบหรือพฤติกรรมของผู้ใช้

iii. Association Rule Mining

เป็นเทคนิคการขุดข้อมูลที่สามารถค้นพบรูปแบบและความสัมพันธ์ระหว่างรายการต่างๆ ในชุดข้อมูล ในระบบคำแนะนำ การขุดกฎสมาคมสามารถระบุกลุ่มของผลิตภัณฑ์ที่ซื้อร่วมกันบ่อย และแนะนำผลิตภัณฑ์เหล่านี้ให้กับผู้ใช้

อัลกอริทึมเหล่านี้สามารถนำไปใช้ได้อย่างมีประสิทธิภาพโดยใช้ไลบรารี เช่น เซอร์ไพรส์, Scikit-learn, TensorFlow และ PyTorch

7. การปรับไฮเปอร์พารามิเตอร์

เพื่อเพิ่มประสิทธิภาพการทำงานของระบบผู้แนะนำ ไฮเปอร์พารามิเตอร์ เช่น อัตราการเรียนรู้ ความแรงของการทำให้เป็นมาตรฐาน และจำนวนเลเยอร์ที่ซ่อนอยู่ในโครงข่ายประสาทเทียม เทคนิคนี้เกี่ยวข้องกับการทดสอบชุดค่าผสมต่างๆ ของไฮเปอร์พารามิเตอร์ และเลือกชุดค่าผสมที่ให้ประสิทธิภาพสูงสุด

8. การประเมินแบบจำลอง

การประเมินแบบจำลองเป็นสิ่งสำคัญเพื่อให้แน่ใจว่าระบบข้อเสนอแนะมีความถูกต้องและมีประสิทธิภาพในการสร้างข้อเสนอแนะ เมตริกการประเมิน เช่น ความแม่นยำ การเรียกคืน และคะแนน F1 สามารถวัดความแม่นยำและประสิทธิผลของระบบได้

9. การปรับใช้โมเดล

เมื่อระบบคำแนะนำได้รับการพัฒนาและประเมินแล้ว ขั้นตอนสุดท้ายคือการปรับใช้ในสภาพแวดล้อมการผลิตและทำให้ลูกค้าพร้อมใช้งาน

การปรับใช้สามารถทำได้โดยใช้ใน-เซิร์ฟเวอร์ในบ้านหรือแพลตฟอร์มบนระบบคลาวด์ เช่น Amazon Web Services (AWS), Microsoft Azure และ Google Cloud

ตัวอย่างเช่น AWS ให้บริการต่างๆ เช่น Amazon S3, Amazon EC2 และ Amazon Machine Learning ซึ่งสามารถใช้ในการปรับใช้และปรับขนาดระบบคำแนะนำ นอกจากนี้ ควรทำการบำรุงรักษาและอัปเดตเป็นประจำตามข้อมูลลูกค้าล่าสุดเพื่อให้แน่ใจว่าระบบยังคงทำงานได้อย่างมีประสิทธิภาพเมื่อเวลาผ่านไป

By Henry Taylor

ฉันทำงานเป็นนักพัฒนาส่วนหลัง พวกคุณบางคนอาจเคยเห็นฉันที่การประชุมนักพัฒนาซอฟต์แวร์ เมื่อเร็ว ๆ นี้ฉันได้ทำงานในโครงการโอเพ่นซอร์ส