“รศ.ดร.วิโรจน์ อรุณมานะกุล” ผู้พัฒนาคลังข้อมูลภาษาไทยแห่งชาติ

เวทีวิจัย

วช. เปิดตัวนักวิจัยดีเด่น ด้านปรัชญา  “รศ.ดร.วิโรจน์ อรุณมานะกุล” ผู้พัฒนาคลังข้อมูลภาษาไทย และคลังภาษาต่าง  ๆ เพื่อเป็นเครื่องมือสำคัญในการสืบค้นข้อมูล กับผู้ที่ทำการศึกษาค้นคว้าวิจัย

วันที่ 5 เมษายน 2566 สำนักงานการวิจัยแห่งชาติ (วช.) กระทรวงการอุดมศึกษา วิทยาศาสตร์ วิจัยและนวัตกรรม (อว.) จัดงานแถลงข่าว “NRCT Talk : นักวิจัยดีเด่นแห่งชาติ ประจำปี 2566 ครั้งที่ 3” เปิดตัว “รองศาสตราจารย์ ดร.วิโรจน์ อรุณมานะกุล” อาจารย์ประจำภาควิชาภาษาศาสตร์ คณะอักษรศาสตร์ และผู้อำนวยการสถาบันภาษาไทยสิรินธร จุฬาลงกรณ์มหาวิทยาลัย นักวิจัยดีเด่นแห่งชาติ สาขาปรัชญา ประจำปี 2566 โดย ดร.วิภารัตน์ ดีอ่อง ผู้อำนวยการสำนักงานการวิจัยแห่งชาติ ได้มอบหมายให้ นายเอนก บำรุงกิจ รองผู้อำนวยการสำนักงานการวิจัยแห่งชาติ เป็นประธานเปิดงาน ณ ศูนย์ข้อมูลสารสนเทศกลางด้านวิทยาศาสตร์ วิจัยและนวัตกรรมของประเทศ อาคาร วช.8 สำนักงานการวิจัยแห่งชาติ กรุงเทพฯ

นายเอนก บำรุงกิจ รองผู้อำนวยการสำนักงานการวิจัยแห่งชาติ กล่าวว่า  วช. ภายใต้กระทรวง อว. มีภารกิจที่สำคัญในการยกย่อง เชิดชู ประกาศเกียรติคุณหรือยกย่องบุคคลหรือหน่วยงานด้านการวิจัยและนวัตกรรม โดยเป็นผลงานที่เป็นประโยชน์ต่อวงวิชาการส่วนรวม ซึ่งในปีนี้ วช. ได้มอบรางวัลนักวิจัยดีเด่นแห่งชาติ สาขาปรัชญา ประจำปี 2566 ให้แก่ รองศาสตราจารย์ ดร.วิโรจน์ อรุณมานะกุล แห่งสถาบันภาษาไทยสิรินธร จุฬาลงกรณ์มหาวิทยาลัย เป็นผู้พัฒนาคลังข้อมูลภาษาไทยแห่งชาติ รวมถึงคลังข้อมูลในภาษาต่างประเทศ เพื่อเป็นประโยชน์แก่ผู้ที่ทำการศึกษาค้นคว้าในการทำงานวิจัย ซึ่งถือเป็นเครื่องมือสำคัญที่ช่วยให้นักวิจัย รวมไปถึงนักศึกษาสามารถใช้เป็นเครื่องมือในการสืบค้นข้อมูลที่ต้องการได้ วช. จึงจัดให้มีการมอบรางวัลนักวิจัยดีเด่นแห่งชาติ เพื่อเป็นกำลังใจและเชิดชูเกียรติ ให้นักวิจัยไทยมืออาชีพที่ได้อุทิศตนให้กับการสร้างผลงานวิจัยที่มีคุณประโยชน์ต่อประชาชน สังคมและประเทศชาติจนเป็นที่ประจักษ์ และที่สำคัญต้องเป็นผู้ที่ได้รับการยอมรับยกย่องว่ามีจริยธรรมของนักวิจัย สมควรเป็นแบบอย่างแก่นักวิจัยผู้อื่นได้ต่อไป

รองศาสตราจารย์ ดร.วิโรจน์ อรุณมานะกุล นักวิจัยดีเด่นแห่งชาติ กล่าวว่า ภาษาเป็นเครื่องมือที่สำคัญและจำเป็นสำหรับการสื่อสารของมนุษย์ ดังนั้นในการสื่อสารที่สัมฤทธิ์ผล ผู้ใช้ภาษาจำเป็นต้องมีความรู้ความเข้าใจ และสามารถเลือกใช้ภาษาได้อย่างถูก การวิเคราะห์โครงสร้างของประโยค คอมพิวเตอร์ กับ ภาษา ทำอย่างไรให้คอมพิวเตอร์เข้าใจภาษาของมนุษย์ การสร้าง กฎ หรือ โมเดลจำลองรูปแบบความรู้นั้น นำไปสู่การพัฒนาคลังข้อมูลภาษาไทยแห่งชาติ คลังข้อมูลภาษาต่าง ๆ ที่สร้างขึ้นเป็นประโยชน์ในเชิงวิชาการเพราะเป็นแหล่งข้อมูลกลางที่นักวิจัยและนักศึกษาสามารถใช้สืบค้นหาข้อมูลที่ต้องการในงานวิจัยของตนเองได้ เครื่องมือหรือโปรแกรมที่เผยแพร่ มีบริษัทเอกชนและหน่วยงานต่าง ๆ ตลอดจนนักพัฒนาระบบจำนวนหนึ่งได้ใช้ประโยชน์จากทรัพยากรและเครื่องมือเหล่านี้มานานกว่า 10 ปีแล้ว ซึ่งผู้วิจัยได้ทำหน้าที่ออกแบบคลังข้อมูลและพัฒนาโปรแกรม Thai Language  Toolkit เครื่องมือที่ใช้ในการตัดคำ กำกับ ข้อมูลตัวบทและจัดเก็บคลังข้อมูล

นอกจากคลังข้อมูลภาษาไทยแล้ว ผู้วิจัยยังได้ร่วมกับอาจารย์ผู้เชี่ยวชาญภาษาอังกฤษในการพัฒนาและสร้างคลังข้อมูลเทียบบทภาษาไทยและภาษาอังกฤษอีกด้วย เพื่อให้นักวิจัย นักศึกษา หรือผู้ที่สนใจสามารถสืบค้น เข้าถึงข้อมูล และตัวอย่างการแปลได้ ซึ่งคลังข้อมูลดังกล่าวได้เปิดให้บริการในรูปแบบสาธารณะ อาทิ โปรแกรมถอดอักษรไทยเป็นอักษรโรมัน โปรแกรมตัดคำภาษาไทย โปรแกรมถ่ายเสียงภาษาไทยเป็นสัทอักษร (Thai to IPA) โปรแกรมกำกับหมวดคำ โปรแกรมตัดหน่วยปริจเฉทพื้นฐาน หรือโปรแกรมเว็กเตอร์คำไทย (Thai word2vec) ปัจจุบันโปรแกรมต่าง ๆ ที่พัฒนาได้รวมเป็นส่วนหนึ่งของ Python Package TLTK  (Thai Language Toolkit) ที่คนทั่วไปสามารถติดตั้งและเลือกใช้งานโมดูลที่ต้องการได้และยังมีการพัฒนาเพิ่มเติมโมดูลการประมวลผลภาษาไทยต่าง ๆ อยู่อย่างต่อเนื่อง

ทั้งนี้ วช. ได้มีการจัดงาน NRCT Talk ขึ้นอย่างต่อเนื่อง โดยในครั้งนี้เป็นการจัดเรื่องนักวิจัยดีเด่นแห่งชาติ ครั้งที่ 3 ประจำปี 2566 เพื่อเป็นเวทีให้นักวิจัยได้นำเสนอผลงานวิจัยและนวัตกรรมผ่านสื่อมวลชนและยังเป็นการเชิดชูนักวิจัยทางด้านสาขาปรัชญา ที่มีคุณค่า สร้างแรงจูงใจ และกระตุ้นให้นักวิจัยยกระดับงานวิจัยและนวัตกรรมสร้างองค์ความรู้พื้นฐานทางวิชาการต่อสังคมและเศรษฐกิจส่วนหนึ่งของผลงานวิจัยดังกล่าวจะนำไปสู่การพัฒนาและเปลี่ยนแปลงโลกแห่งอนาคต สู่การพัฒนาคุณภาพชีวิตของคนไทยและขับเคลื่อนเศรษฐกิจของประเทศ