Understanding Textual Embeddings: Applications in Retrieval and Recommendation

หน้าแรก

Exclusive Content

: Understanding Textual Embeddings: Applications in Retrieval and Recommendation

Categories: Exclusive

Understanding Textual Embeddings: Applications in Retrieval and Recommendation

SCBX Unlocking AI EP 9: Advancing ThaiLLM Development and Applications

2,089

19/07/2024

หัวข้อในหน้านี้

เคยสงสัยไหมว่า เว็บไซต์ประกาศรับสมัครงาน

ดร.เอกพล บอกว่ามนุษย์เรามี

สำหรับเทคนิคในการเรียนรู้

ทั้ง Sparse และ Dense Embedbings

เคยสงสัยไหมว่า เว็บไซต์ประกาศรับสมัครงานอย่าง JobTopGun หาวิธีช่วยให้ผู้สมัครงานได้งานที่ใช่ได้อย่างไร คำตอบอยู่ในงาน SCBX Unlocking AI EP 9: Advancing ThaiLLM Development and Applications ที่ผ่านมานั่นเอง!

อ.ดร.เอกพล ช่วงสุวนิช จากภาควิชาวิศวกรรมคอมพิวเตอร์ คณะวิศวกรรมศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย มาบรรยายเรื่อง Understanding Textual Embeddings: Applications in Retrieval and Recommendation และเล่าประสบการณ์ที่เคยฝึกฝนและพัฒนา LLM อย่างไรบ้าง โดยมีกรณีศึกษาคือ JobTopGun นั่นเอง

ดร.เอกพล บอกว่ามนุษย์เรามีความสามารถในการตีความ เรารู้ว่า ประโยคไหนมีความหมายเหมือนหรือใกล้เคียงกับประโยคไหนบ้าง เช่น A Little Girl Seems to be Very Sad มีความหมายใกล้เคียงกับ The Little Child is Far From Being Happy

แต่เมื่อจะพัฒนา LLM ก็ถือเป็นความท้าทายเหมือนกันว่า เราจะต้องป้อนข้อมูลอย่างไรให้คอมพิวเตอร์เข้าใจความหมายของประโยคที่เขียนไม่เหมือนกัน แต่ความหมายเหมือนหรือใกล้เคียงกันได้ด้วย

ดร.เอกพล ยกตัวอย่างว่า เขาเคยฝึกระบบของ JobTopGun เว็บไซต์ประกาศหางานที่เปิดโอกาสให้ผู้คนเอาเรซูเม่สมัครงานมาอัปโหลดในเว็บไซต์ หน้าที่ของเขาคือทำอย่างไรก็ได้เพื่อหาทางจับคู่เรซูเม่ต่างๆ ให้เจอตำแหน่งงานที่เหมาะสมให้ได้

เขาจึงฝึกให้ปัญญาประดิษฐ์อ่านเรซูเม่ของผู้สมัครงาน และ Job Description ของแต่ละงานจากแต่ละองค์กร จนมันรู้จักลักษณะงานที่เหมาะสมของแต่ละคน จนเข้าใจว่าถ้าเจอว่าประวัติของคนๆ นี้ต้องไปทำงานแบบไหน กับบริษัทใด

สำหรับเทคนิคในการเรียนรู้ที่ใบ้สอนปัญญาประดิษฐ์คร่าวๆ จะมี 2 แนวคือ Sparse Embeddings และ Dense Embedbings

1. Sparse Embeddings หมายถึงการให้ Machine Learning อ่านหนังสือแล้วนับว่าหนังสือเหล่านี้มี Keyword อะไร เยอะแค่ไหนบ้าง เช่น หนังสือของวิลเลียม เชกสเปียร์ มีคำว่า Battle กี่คำ หรือมีคำว่า Soilder กี่คำ เป็นต้น แล้วเอาผลที่ได้ไปวิเคราะห์ต่อ

ข้อดีของ Sparse Embeddings คือใช้งานง่าย เข้าใจง่าย แต่ก็มีข้อควรระวัง เช่น บางกรณีอาจไม่เจอคำที่ต้องการให้นับ และบ่อยครั้งคอมพิวเตอร์อาจมองข้ามคำที่มีความหมายเดียวกัน แต่ไม่ใช่คำเดียวกัน ดังนั้นอาจต้องเปลี่ยนจากการนับจำนวนครั้ง เป็นการนับเปอร์เซ็นต์ หรือความถี่แทนว่าเจอคำนี้บ่อยแค่ไหน

2. Dense Embedbings ป้อนข้อมูล หรือ Input สำหรับ Deep Learning แล้วแปลงค่าสิ่งต่างๆ ออกมาเป็นตัวเลข หากเลขไหนเหมือนกัน หรือใกล้เคียงกัน หมายความว่าสามารถจับคู่สิ่งๆ นั้นกันได้ง่าย

ดร.เอกพล เล่าว่านี่คือวิธีการที่เขาสอนให้ Machine Learning ของ JobTopGun ได้เรียนรู้วิธีอ่านเรซูเม่ของผู้สมัครงาน โดย AI จะแปลงค่าเรซูเม่, Job Description หรือประกาศรับสมัครงานออกมาเป็นตัวเลข แล้วหากเลขนั้นเทียบกันแล้วได้ค่าใกล้เคียงกันหรือเท่ากัน ก็บ่งชี้ว่าเรซูเม่ของผู้สมัครงานเหมาะกับงานนั้นที่เปิดรับสมัครไว้นั่นเอง

ทั้ง Sparse และ Dense Embedbings ต่างมีข้อดีและข้อเสียแตกต่างกันไป ก่อนใช้ต้องดูว่ากรณีไหนที่ควรใช้ Sparse กรณีไหนควรใช้ Dense หรือจะนำมาใช้ร่วมกัน เพื่อดึงข้อดีของทั้ง 2 วิธีออกมาให้เต็มที่

ขอเพียงเข้าใจคอนเซ็ปต์ และวิธีการทำงาน ดร.เอกพลมั่นใจว่า เราจะสามารถพัฒนาสิ่งที่น่าสนใจได้อีกมากมาย เพื่อยกระดับการทำงานของตัวเองและองค์กรต่อไป

ผู้เขียน:

SCBX contributor

Tags :

AI LLM Machine Learning R&D Textual Embedding

More Insights for you

ติดตามเนื้อหาล่าสุดของเรา

More Insights for you

Stay up to date with our latest content

ดูเนื้อหา
Categories: Exclusive
Standard
Tags: Cloud, CTO, Cybersec, Security
การยกระดับความปลอดภัยบนคลาวด์: มุมมองเชิงลึกจาก CTO แห่ง SCBX
ในงาน CYBERSEC ASIA x Thailand International Cyber Week 2025
244
05/03/2025
244
05/03/2025

ดูเนื้อหา
Categories: Exclusive
Standard
Tags: AI driven, SCBX, strategy
SCBX เผยกลยุทธ์เสริมความแข็งแกร่งองค์กรด้วย AI พร้อมชู 5 กล้ามเนื้อหลักขับเคลื่อนธุรกิจ
“Building Corporate AI Muscles” หรือ “การสร้างกล้ามเนื้อองค์กรเพื่อรองรับ AI” ซึ่งกลุ่ม SCBX ได้เรียนรู้และสามารถช่วยขับเคลื่อนองค์กรด้วย AI
1,366
03/12/2024
1,366
03/12/2024

ดูเนื้อหา
Categories: Exclusive
Standard
Tags: SCBX, Token X
Token X เข้าร่วมโครงการริเริ่มระดับโลก “ซื้อขายโทเคนดิจิทัลข้ามพรมแดน” เชื่อมต่อตลาดสินทรัพย์ดิจิทัล
บริษัท โทเคน เอกซ์ จำกัด (“Token X”) บริษัทภายใต้ SCBX กลุ่มเทคโนโลยีการเงินชั้นนำของประเทศไทย ได้ก้าวขึ้นมาเป็นผู้เล่นสำคัญในโครงการริเริ่มสำหรับการซื้อขายโทเคนดิจิทัลข้ามพรมแดนที่ล้ำสมัย
887
27/11/2024
887
27/11/2024

ดูเนื้อหา
Categories: Exclusive
Standard
Tags: Fintech, Green, SCBX
SCBX กับเส้นทางสู่การเป็นผู้นำด้านการเงินสีเขียวในภูมิภาคเอเชียตะวันออกเฉียงใต้
Banking a transitioning Asia: Digital dollars and green sense ณ งาน Singapore FinTech Festival 2024
496
27/11/2024
496
27/11/2024

ดูเนื้อหา
Categories: Exclusive
Standard
Tags: agentic AI, AI, UnlockingAI
Unlocking AI Agents: Applications and Adoption – ปลดล็อคศักยภาพ AI Agent พลิกโฉมการทำงาน พลิกธุรกิจ พลิกโลก
SCBX Unlocking AI Ep.12 - Agentic AI: A New Era of Autonomy - Panel Discussion
1,880
09/10/2024
1,880
09/10/2024

ดูเนื้อหา
Categories: Exclusive, SCBX Insight
Standard
Tags: agentic AI, AI, UnlockingAI
Autonomous Agents: The Future of Enterprise AI จาก Salesforce กับการพัฒนา Autonomous Agents
SCBX Unlocking AI Ep.12 - Agentic AI: A New Era of Autonomy - ตัวช่วยสารพัดประโยชน์สำหรับองค์กรสุดไฮเทค
1,039
09/10/2024
1,039
09/10/2024

ดูบทความทั้งหมด

Find out more

2025-03-26T10:52:50+07:00

SCBX อัปเดท

ธุรกิจของ SCBX

ความยั่งยืน

ร่วมงานกับ SCBX

เกี่ยวกับ SCBX

ค้นหาใน SCBX

Understanding Textual Embeddings: Applications in Retrieval and Recommendation

Understanding Textual Embeddings: Applications in Retrieval and Recommendation

Understanding Textual Embeddings: Applications in Retrieval and Recommendation

SCBX Unlocking AI EP 9: Advancing ThaiLLM Development and Applications

หัวข้อในหน้านี้

ผู้เขียน:

Tags :

More Insights for you

More Insights for you

Join Our Community

ติดตาม SCBX

SCBX อัปเดต

ห้องข่าว

Spotlight

ธุรกิจของ SCBX

บริษัทใน SCBX

ความยั่งยืน

เส้นทางความยั่งยืนของเอสซีบีเอกซ์

ความมุ่งมั่น

ผลการดำเนินงานที่สำคัญ

รายงานและการเปิดเผยข้อมูล

ร่วมงานกับเรา

ทีม SCBX

ชีวิตใน SCBX

เกี่ยวกับ SCBX

รู้จัก SCBX

ผู้บริหาร SCBX

การกำกับดูแลกิจการ

นักลงทุนสัมพันธ์

ติดต่อเรา

SCBX อัปเดท

ธุรกิจของ SCBX

ความยั่งยืน

ร่วมงานกับ SCBX

เกี่ยวกับ SCBX

ค้นหาใน SCBX

Understanding Textual Embeddings: Applications in Retrieval and Recommendation

Understanding Textual Embeddings: Applications in Retrieval and Recommendation

Understanding Textual Embeddings: Applications in Retrieval and Recommendation

SCBX Unlocking AI EP 9: Advancing ThaiLLM Development and Applications

หัวข้อในหน้านี้

ผู้เขียน:

Tags :

More Insights for you

More Insights for you

Join Our Community

ติดตาม SCBX

ห้องข่าว

Spotlight

เส้นทางความยั่งยืนของเอสซีบีเอกซ์

ความมุ่งมั่น

ทีม SCBX

ชีวิตใน SCBX

รู้จัก SCBX

ผู้บริหาร SCBX

การกำกับดูแลกิจการ

You’re leaving SCBX’s website to enter

คุณได้ติดตามรับ Insight ใหม่จาก SCBX เรียบร้อยแล้ว

แชร์คอนเทนต์นี้

การใช้และการจัดการคุกกี้

You’re leaving SCBX’s website
to enter

คุณได้ติดตามรับ
Insight ใหม่จาก SCBX
เรียบร้อยแล้ว