Advancing LLM R&D in Southeast Asia: Bridging Innovation and Collaboration

หน้าแรก

Exclusive Content

: Advancing LLM R&D in Southeast Asia: Bridging Innovation and Collaboration

Categories: 05 Exclusive, SCBX อินไซด์

Advancing LLM R&D in Southeast Asia: Bridging Innovation and Collaboration

SCBX Unlocking AI EP 9: Advancing ThaiLLM Development and Applications

1,851

19/07/2024

หัวข้อในหน้านี้

จากที่โลกนี้มีกำแพงด้านภาษา

ศ.ดร.สรณะ นุชอนงค์ Director of VISTEC-depa

ประเทศในแถบเอเชียตะวันออกเฉียงใต้

รัฐบาลสิงคโปร์เข้าใจปัญหา

จากที่โลกนี้มีกำแพงด้านภาษาขวางกั้น การจะสื่อสารกับชาวต่างชาติต้องใช้ความรู้และสั่งสมประสบการณ์นานพอตัว แต่การมาถึงของ Generative AI และการพัฒนาอย่างก้าวกระโดดของ LLM ทำลายกำแพงทางภาษาอย่างราบคาบ

จนตอนนี้ไม่แค่ในสหรัฐอเมริกา หรือในยุโรปเท่านั้นที่กำลังพัฒนา LLM ที่ฉลาดและล้ำสมัย แต่ในเอเชีย โดยเฉพาะในภูมิภาคเอเชียตะวันออกเฉียงใต้นั้นก็กำลังพัฒนาเช่นกัน แถมหลายประเทศยังร่วมมือกันอย่างน่าจับตามองด้วย

ศ.ดร.สรณะ นุชอนงค์ Director of VISTEC-depa หนึ่งในผู้บุกเบิกด้าน LLM ในไทย มาบรรยายเรื่อง Advancing LLM R&D in Southeast Asia: Bridging Innovation and Collaboration ในงาน SCBX Unlocking AI EP 9: Advancing ThaiLLM Development and Applications เพื่ออธิบายว่าการศึกษา วิจัย และพัฒนาด้าน LLM ในแถบเอเชียตะวันออกเฉียงใต้ตอนนี้รุดหน้าไปไกลเพียงใด

หนึ่งในโครงการที่เด่นมากอยู่ที่ประเทศสิงคโปร์ ชื่อว่า SEALD (Southeast Asian Languages in One Network Data) หรือเรียกง่ายๆ ว่า AI Singapore เป็นโครงการที่เชิญชวนนักวิจัยในประเทศเพื่อนบ้านมาร่วมมือกันสร้าง LLM ที่โดดเด่นด้านภาษาท้องถิ่นของเอเชีย

เนื่องจากประเทศในแถบเอเชียตะวันออกเฉียงใต้ล้วนมีภาษาหลักของแต่ละประเทศอยู่แล้ว ไม่เพียงแค่นั้นยังมีภาษาถิ่น หรือภาษารอง อีกนับพันภาษา การที่โครงการมุ่งพัฒนา LLM ที่มีข้อมูลของภาษาต่างๆ ในภูมิภาคนี้ ถือเป็นการใช้ความหลากหลาย หรือ Diversity ให้เกิดประโยชน์นั่นเอง

ทั้งนี้ หากนักวิจัยจะทำ R&D พัฒนา LLM อย่างมีประสิทธิภาพ จะต้องมีการวัดผลที่ดีด้วย แต่ปัญหาของการพัฒนา LLM ทุกวันนี้คือยังวัดผลได้ยาก ไม่แค่เฉพาะในแถบเอเชีย แต่แม้กระทั่ง LLM ภาษาอังกฤษเองก็ยังมีปัญหานี้อยู่

โดย ศ.ดร.สรณะ แจกแจงว่ามี 4 อุปสรรคสำคัญในการวัดผลดังนี้

Sparse Evaluation Data – มีเพียงไม่ถึง 10 ภาษาเท่านั้น ที่ถูกนำมาใช้พัฒนาและให้ AI เรียนรู้
Resource Gap – ในจำนวน 1,308 ภาษาในแถบเอเชียตะวันออกเฉียงใต้ มี 700 ภาษาที่มีข้อมูลหรือ Datasets ที่ถูกต้องสำหรับใช้วัดผลน้อย แค่ 1-2 Datasets เท่านั้น
Quality of Resources คุณภาพของข้อมูลที่อยู่ในอินเทอร์เน็ต ยังไม่ได้รับการยืนยันว่าถูกต้องเพียงพอจะนำไปใช้งานต่อได้
Cultural Relevance ข้อมูล หรือศัพท์เฉพาะเกี่ยวกับภาษารองหลายภาษา แปลมาจากภาษาอังกฤษอีกที อาจไม่สอดคล้องกับวัฒนธรรมหรือบริบทจริงๆ ของพื้นที่นั้น

ทั้งนี้รัฐบาลสิงคโปร์เข้าใจปัญหานี้ดี จึงพัฒนาโครงการ SEACrowd ขึ้นมาเพื่อรวบรวม Datasets ของประเทศในแถบเอเชียตะวันออกเฉียงใต้อย่างเป็นทางการ และมีนักวิจัยของ Vistec เข้าไปมีร่วมในโครงการด้วย

ศ.ดร.สรณะ คาดหวังว่า SEACrowd จะเป็น Benchmark ที่ดีที่ช่วยให้มั่นใจว่า Data ที่ได้มาจะนำเสนอถึงความเป็นภูมิภาคเอเชียตะวันออกเฉียงใต้ได้จริงๆ ไม่ใช่การคิดไปเอง หรือแปลมาจากแหล่งข้อมูลของประเทศตะวันตกอีกที

เพราะอย่าลืมว่าการพัฒนา LLM แล้ววัดผลด้วย Benchmark ที่ถูกต้อง ใช้งานได้จริง มีผลอย่างยิ่งต่อการตีพิมพ์หรือไม่ได้ตีพิมพ์งานวิจัย ไปจนถึงการพัฒนาต่อเป็นผลงานที่ใช้ได้จริงด้วย จะช่วยนำทางนักวิจัยไปสู่เป้าหมาย และทำให้นักวิจัยรู้ว่าปัญหาไหนที่ต้องแก้ไข ปัญหาไหนไม่ต้องแก้ไขอะไรแล้ว สิ่งไหนที่จะช่วยพัฒนา LLM ให้ดียิ่งขึ้นต่อไป เป็นต้น

แต่ก็มีข้อควรระวังในการวัดผลด้วยเช่นกัน ศ.ดร.สรณะ ยกตัวอย่างเปเปอร์ชื่อ Don’t Make Your LLM an Evaluation Benchmark Cheater ที่ได้ข้อสรุปว่า ให้ระวังการตั้งใจวัดผลให้ออกมามีตัวเลขที่ดูดี ดูสวยที่สุด แต่กลับไม่สามารถเอาไปใช้งานจริงได้เมื่อต้องทำงานจริง เพราะมันไม่ต่างอะไรกับนักเรียนที่ตั้งใจอ่านหนังสือเพื่อสอบให้ได้คะแนนดี แต่เอาความรู้ที่ได้มานั้นไปใช้ประโยชน์อะไรไม่ได้

ส่วนในอนาคต ศ.ดร.สรณะ ยืนยันว่าไทยจะร่วมมือกับโครงการ SEACrowd ต่อไป เพื่อนำภาษาไทยที่มีความเป็นภาษาถิ่น เข้าไปอยู่ในฐานข้อมูลกลาง ให้คนทั่วโลกได้รู้จักมากขึ้นต่อไป

ผู้เขียน:

SCBX contributor

Tags :

AI EP9 LLM R&D SCBX SEA

More Insights for you

Stay up to date with our latest content

Our interested news more

Up to date with our interested news

ดูเนื้อหา
Categories: 05 Exclusive, SCBX อินไซด์
Standard
Tags: ABACUS, AI, MoneyThunder, SCBX
ABACUS digital: เจาะลึกนวัตกรรม AI พลิกโฉมสินเชื่อออนไลน์ เปิดโอกาสทางสังคม
ABACUS digital บริษัทในกลุ่ม SCBX ที่เป็นเจ้าของแอปพลิเคชันสินเชื่อ ‘มันนี่ทันเดอร์’ จึงใช้ AI ในการฝ่ากำแพงนี้ออกไป เพื่อสร้างสินเชื่อที่มีประสิทธิภาพให้ผู้กู้
1,351
04/09/2024
1,351
04/09/2024

ดูเนื้อหา
Categories: 05 Exclusive, SCBX อินไซด์
Standard
Tags: AI, Blockchain, SCBX, Tokenization
Tokenization และ Blockchain คือตัวเปลี่ยนเกมโลกและสิ่งแวดล้อม
ความก้าวหน้าของโลกเทคโนโลยีดำเนินไปอย่างรวดเร็วจนทุกคนสัมผัสได้ นอกจาก AI ที่ถูกพัฒนาจนเป็นผู้ช่วยมนุษย์แล้ว สินทรัพย์บนโลกใบนี้ก็กำลังเปลี่ยนผ่านตัวเองไปอยู่ในรูปของสินทรัพย์ดิจิทัล หรือ Tokenization
871
04/09/2024
871
04/09/2024

ดูเนื้อหา
Categories: 05 Exclusive, SCBX อินไซด์
Standard
Tags: AI, Data solution, SCBX, TechX
SCB TechX: ยุคแห่ง Data ผสานกับ AI และ Automation ทำอย่างไรให้เกิดประสิทธิภาพในองค์กรสูงสุด
ในทุกองค์กรล้วนมีข้อมูลและอินไซต์ต่างๆ ในการดำเนินธุรกิจ แต่ปัญหาที่ทุกองค์กรพบคือ เราจะจัดเก็บข้อมูลอย่างไรให้เป็นระเบียบ ให้หยิบออกมาใช้ได้สะดวก
1,118
28/08/2024
1,118
28/08/2024

ดูเนื้อหา
Categories: 05 Exclusive, SCBX อินไซด์
Standard
Tags: AI, Net Zero, SCBX
SCB ขับเคลื่อนองค์กรด้วย AI-Driven สู่ความยั่งยืนองค์กรและความยั่งยืนระดับโลก
ความยั่งยืนเป็นเป้าหมายร่วมของทั้งโลกใบนี้ อย่าง Net Zero ที่ทั้งโลกจะปล่อยคาร์บอนเป็นศูนย์ AI เป็นอีกหนึ่งตัวแปรที่จะเติมเต็มกระบวนการเดินหน้าองค์กรอย่างยั่งยืน
1,117
27/08/2024
1,117
27/08/2024

ดูเนื้อหา
Categories: 05 Exclusive, SCBX อินไซด์
Standard
Tags: adaption, AI, Blockchain, SCB 10X, SCBX, Web3
SCB 10X: โลกกำลังเปลี่ยนไปด้วยเทคโนโลยีทั้ง AI และบล็อกเชน Web 3.0 มีอะไรที่เราต้องรู้และอะไรที่ต้องปรับตัว?
โลกกำลังหมุนไปอย่างรวดเร็ว สิ่งใหม่และเทรนด์เกิดขึ้นและเข้ามาแบบรายวัน ไม่ว่าจะเป็น AI นวัตกรรมใหม่ๆ Web 3.0 หรือเทคโนโลยีแห่งอนาคต
1,094
26/08/2024
1,094
26/08/2024

ดูเนื้อหา
Categories: 05 Exclusive, SCBX อินไซด์
Standard
Tags: AI, FINNIX, MONIX, SCBX
แอปฟินนิกซ์ (FINNIX): AI Lending – Lendsponsible สินเชื่อพลัง AI
Lendsponsible สินเชื่อพลัง AI ที่รับผิดชอบต่อสังคม ช่วยลดปัญหาความเหลื่อมล้ำและปัญหาหนี้นอกระบบในสังคมไทย
1,165
26/08/2024
1,165
26/08/2024

ดูบทความทั้งหมด

Find out more

2024-09-03T15:07:34+07:00

ค้นหาใน SCBX

Advancing LLM R&D in Southeast Asia: Bridging Innovation and Collaboration

Advancing LLM R&D in Southeast Asia: Bridging Innovation and Collaboration

Advancing LLM R&D in Southeast Asia: Bridging Innovation and Collaboration

SCBX Unlocking AI EP 9: Advancing ThaiLLM Development and Applications

หัวข้อในหน้านี้

ผู้เขียน:

Tags :

More Insights for you

Our interested news more

Join Our Community

ติดตาม SCBX

SCBX อัปเดต

ห้องข่าว

Spotlight

ธุรกิจของ SCBX

บริษัทใน SCBX

ความยั่งยืน

เส้นทางความยั่งยืนของเอสซีบี เอกซ์

ความมุ่งมั่น

ผลการดำเนินงานที่สำคัญ

รายงานและการเปิดเผยข้อมูล

ร่วมงานกับเรา

ทีม SCBX

ชีวิตใน SCBX

เกี่ยวกับ SCBX

รู้จัก SCBX

ผู้บริหาร SCBX

การกำกับดูแลกิจการ

นักลงทุนสัมพันธ์

ติดต่อเรา

ค้นหาใน SCBX

Advancing LLM R&D in Southeast Asia: Bridging Innovation and Collaboration

Advancing LLM R&D in Southeast Asia: Bridging Innovation and Collaboration

Advancing LLM R&D in Southeast Asia: Bridging Innovation and Collaboration

SCBX Unlocking AI EP 9: Advancing ThaiLLM Development and Applications

หัวข้อในหน้านี้

ผู้เขียน:

Tags :

More Insights for you

Our interested news more

Join Our Community

ติดตาม SCBX

ห้องข่าว

Spotlight

เส้นทางความยั่งยืนของเอสซีบี เอกซ์

ความมุ่งมั่น

ทีม SCBX

ชีวิตใน SCBX

รู้จัก SCBX

ผู้บริหาร SCBX

การกำกับดูแลกิจการ

You’re leaving SCBX’s website to enter

คุณได้ติดตามรับ Insight ใหม่จาก SCBX เรียบร้อยแล้ว

แชร์คอนเทนต์นี้

การใช้และการจัดการคุกกี้

You’re leaving SCBX’s website
to enter

คุณได้ติดตามรับ
Insight ใหม่จาก SCBX
เรียบร้อยแล้ว