ACL & LLM Roadmap in Thailand

: ACL & LLM Roadmap in Thailand

ACL & LLM Roadmap in Thailand

SCBX Unlocking AI EP 9: Advancing ThaiLLM Development and Applications

กลับมาอีกครั้งกับงาน SCBX Unlocking AI คราวนี้กลับมาใน EP 9 ภายใต้หัวข้อ Advancing ThaiLLM Development and Applications เพื่อนำเสนอเรื่องราวเกี่ยวกับ AI และ LLM ที่กำลังอยู่ในความสนใจของผู้คนทั่วโลกนับตั้งแต่ ChatGPT ถือกำเนิดขึ้น

งานนี้มีหัวข้อเสวนาน่าสนใจหลายหัวข้อ โดยเริ่มแรกได้ ดร.เทพชัย ทรัพย์นิธิ Vice President, AiAT & Director of Artificial Intelligence Research จากศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (National Electronics and Computer Technology Center : NECTEC หรือเนคเทค) มาบรรยายเรื่อง ACL & LLM Roadmap in Thailand

แต่ก่อนจะอธิบายเรื่อง LLM ดร.เทพชัย เกริ่นถึงสิ่งที่เรียกว่า ACL ก่อนว่าคืออะไร และสำคัญอย่างไรกับโลก AI และ LLM

โดย ACL นั้นมี 2 ความหมายดังนี้

  1. Annual Meeting on Computational Lingustics หรือการจัดประชุมวิชาการของเหล่านักภาษาศาสตร์คอมพิวเตอร์ ซึ่งเป็นงานที่เก่าแก่ จัดมาตั้งแต่ปี 1962 แต่เดิมเคยใช้ชื่อ Association on Machine Translation and Computation Linguistics
  2. Association on Computauinal Linguistics หรือผู้ที่ดูแลและจัดงานประชุมนี้ขึ้นมานั่นเอง หากขาดงานนี้และคณะผู้จัดไป อาจส่งผลให้ความตื่นตัวในแวดวง AI เปลี่ยนจากหน้ามือเป็นหลังมือ

ดร.เทพชัย ให้ข้อมูลเพิ่มเติมว่าการประชุม ACL จัดขึ้นที่สหรัฐอเมริกามาตลอด จนกระทั่งปี 1996 ที่เริ่มไปจัดประเทศอื่นบ้าง เช่นที่แคนาดา สเปน ก่อนจะมาจัดที่เอเชียครั้งแรกที่ฮ่องกงเมื่อปี 2000

และเดือนสิงหาคม 2024 นี้ประเทศไทยก็จะเป็นเจ้าภาพจัดประชุมด้วย ซึ่งเขาเองก็จะไปร่วมงานเช่นกัน หลังเข้าร่วมงาน ACL มาตั้งแต่ปี 2009 แล้ว

ดร.เทพชัย มองว่าวันนี้เราเห็นประโยชน์ของ AI และ LLM ที่เป็นรูปธรรมมากขึ้น เหตุผลก็เพราะการถือกำเนิดของ ChatGPT ในเวลาไม่กี่ปียังเกิด LLM ที่เป็น Multilingual ทั้งของ Google, Microsoft, Meta, Apple และ OpenAI ซึ่งเน้นภาษาอังกฤษ มี LLM ที่ประเทศจีนพัฒนาขึ้นโดย Baidu, Huawei และ Qwen

ส่วนประเทศไทยก็มี LLM ภาษาไทยเช่นกัน เช่น OpenThaiGPT และ Typhoon เป็นต้น

ดร.เทพชัย ยังบอกว่าไทยวาง Roadmap มียุทธศาสตร์เป้าหมาย และผลลัพธ์ตามแผนปฏิบัติการด้าน AI จำนวน 5 ข้อ โดยยุทธศาสตร์ด้าน LLM อยู่ในด้านที่ 2 ด้วย ซึ่งแสดงให้เห็นว่าประเทศไทยให้ความสำคัญกับเรื่องนี้มาก และน่าจะเป็นประโยชน์ต่อการเอาไปใช้ในเชิงธุรกิจ หรือการศึกษาวิจัยในอนาคต

โดยตอนนี้ เขาและทีม NECTEC ได้รับคำเรียกร้องจากทั้งหน่วยงานรัฐและเอกชนเยอะมาก เพื่อให้ช่วยสร้าง LLM ที่มีความเฉพาะด้าน เอามาช่วยงานที่มีความเฉพาะเจาะจงกับแต่ละองค์กร ซึ่งต้องมาติดตามกันต่อไปว่า จะพัฒนาและนำมาใช้งานอย่างไร

อีกงานสำคัญคือการจับมือกับสำนักงานการวิจัยแห่งชาติ (วช.) กระทรวงการอุดมศึกษา วิทยาศาสตร์ วิจัยและนวัตกรรม และกระทรวงดิจิทัลเพื่อเศรษฐกิจและสังคม เพื่อสร้าง LLM 3 โมเดลคือ

  1. Pretrained LLM เป็น Base Model ที่เก่งกาจในการใช้ภาษาไทย ซึ่งทุกคนสามารถใช้งานร่วมกันได้
  2. Fine Tuning Model เพื่อรองรับงานด้านการท่องเที่ยว การแพทย์ และสิ่งแวดล้อม
  3. Opensourced Model ที่องค์กรเอกชนจะสามารถนำไปพัฒนาและต่อยอดให้กับอุตสาหกรรมอื่นๆ ที่ตนเองทำงานอยู่ได้

อีกสิ่งที่กำลังทำอยู่คือ Chatbot Arena หรือการเอา Chatbot แต่ละตัวมาคุยกันเอง เพื่อให้ทราบว่า ข้อมูลจาก Bot ตัวไหนถูกต้อง ใช้งานง่าย ใช้งานได้จริงกว่ากัน

อีกสิ่งที่ดร.เทพชัยเน้นย้ำคือ การเอา AI มาใช้จะต้องมีความปลอดภัยและไว้ใจได้ จึงเกิดโครงการพัฒนา Trustworthy AI Framework ขึ้นมา เป็นการเอา LLM แต่ละตัวมาศึกษาว่ามันเข้าข่ายความปลอดภัยจากเรื่องบ้าง เช่น ความรุนแรง การละเมิดกฎหมาย ความลามกอนาจาร รวมถึงเป็นมิตรต่อสุขภาพจิต และดีต่อสังคมและวัฒนธรรมไทยหรือไม่ เป็นต้น

สุดท้าย ดร.เทพชัย ยังกาง Roadmap ที่ทาง NECTEC ได้วางแผนไว้คร่าวๆ ไว้ว่าภายใน 5 ปีจากนี้จะพัฒนา OpenThaiGPT ที่พัฒนามากขึ้น โดยปี 2028 จะพัฒนา OpenThaiLLM และ Multimodel OpenThaiLLM เวอร์ชั่น 3.0.0 สำหรับใช้งานงาน 3D World Instruction ให้ได้

หากทุกอย่างเป็นไปตามแผนที่วางไว้ เราน่าจะได้เห็นความท้าทาย ความแปลกใหม่ และสิ่งที่น่าตื่นตาตื่นใจเกิดขึ้นแก่ประเทศไทยอีกมากมายตามมาแน่นอน

Writer:

SCBX contributor
SCBX contributor

More Insights for you

Stay up to date with our latest content

Our interested news more

Up to date with our interested news