ผมเคยมีแนวคิดเหมือนคุณสมพรในเรื่องการพัฒนาปัญญาประดิษฐ์เพื่อแปลภาษาเพราะอย่างเรื่อง one to many เป็นแค่ประเด็นเดียวที่ใช้ในเรื่องของความหมาย แต่ในฐานะนักภาษาศาสตร์ มัน มีอีกหลายประเด็นที่ยากแก้การรับมือของระบบต่างๆเช่นการ conjugation (การเปลี่ยนรูปของศัพท์เดิมเพื่อโครงสร้างที่มีความหมาย) แบบ ธรรมดา จน ถีงซับซ้อนมากเช่น
It is good.
It has been good.
It would be better.
นี่เฉพาะของ verb to be ซึ่งไม่ได้แปลตัวเดียว แต่ต้อง matching กับตัวอื่นๆจึงแปลได้ เช่น ตัวอย่าง has been, ก็มี have been และมี have to be, has to be, had been doing นี้เฉพาะ be แต่อันนี้อาจจะใช้ML หรือการจับคู่ประโยคของคุณวีร์ได้ แต่กรณีที่เป็นการ synthesis กับศัพท์ใหม่ๆ ก็คงไม่มีทาง match ง่ายๆ ผมเห็น เนคเทคพยายาม math ประโยคอยู่ไม่รู้เหมือนกันว่าทำได้ไหม เพื่อนผมเคยบอกว่ามีโปรแกรมชื่อเดจาวู จะเป็นแบบเราแปลลงใน software แล้ว software จะเก็บงานเรามา match แสดงว่ายิ่งแปลก็จะถูกต้องขึ้น แต่ผมไม่มีหรอกนะครับ ผมแปลงานผ่านสุภาษิตแบบแก้ทีละประโยค เพราะต้องการถูกต้องร้อยเปอร์เซนต์ ผมว่าเป็นงานที่มึนหัวมากต้องค่อยๆทำ ผมสนใจการsupport คนแปลมากกว่าผมเคยเห็นที่พอเอาลูกศรชี้ที่ตัวไหนความหมายย่อๆ ก็ปรากฎให้เราเลือกก่อนแปล ส่วน text to speech
เคยใช้ของภาษาอังกฤษกับภาษาจีน ภาษาจีนเหมือนไทยมีปัญหาเรื่อง tone (วรรณยุกต์)ครับคือพูดแล้วมันตลกๆน่ารักดี ผมเคยมีโปรแกรมครับต้องไปหาดูก่อนครับ
Khun Mr_Jod
หวัดดีครับ ยินดีที่ได้รู้จักครับ
กรณี verb to be เขียนกฎเอาก็ได้? ไม่น่ายากเย็นมาก
ศัพท์ใหม่หมายถึงอะไรเหรอครับ? ถ้าในคู่ประโยคตัวอย่างมีศัพท์ใหม่ก็พอจะ match ได้นะครับ แต่ถ้าไม่ประโยคตัวอย่างมี และใน dictionary ไม่มี ก็ไม่ได้ครับ :-P
ถ้าแบบที่คุณ chatchai อยากได้สงสัยจะเป็น computer assisted translation tools ซึ่งมีเยอะกว่า machine translation อีกครับ ส่วนมากจะใช้ translation memory (หน่วยความจำการแปล) ช่วย เช่นถ้ามีประโยคไหนที่เราแปล ไปแล้ว และเหมือนหรือคล้ายประโยค ที่เรากำลังจะแปล TM ก็สามารถดึงขึ้นมาได้ ทำให้เสียเวลาแปลน้อยลง มากไปกว่า TM ยังเอาของแต่ละคนมา share กันได้ด้วย
ท่านึงที่ใช้จัดการกับ verb to be หรือการผันอื่นๆ นะครับ โปรแกรมสามารถเปลี่ยน verb to be ให้อยู่ใน base form แล้วเพิ่ม attribute ต่างๆ เข้าไปเพื่อง่ายต่อการประมวลผลต่อ เช่น
ตำราบางเล่มอย่าง Doing grammar ของ Max Morenberg ให้ภาษา อังกฤษมี 2 tense เท่านั้นคือ past กับ present ที่เหลืออธิบาย ด้วย aspect และ mood
อย่างเช่น It has been good.
has been มันก็คือ be ที่มี tense เป็น present, mood เป็น indicative และ aspect เป็น perfect
indicative mood กับ present tense เวลาแปลเป็นภาษาไทย ก็ไม่ต้องทำอะไร แต่ว่า perfect aspect ก็อาจจะแปลเป็นคำว่า "ยัง" ... "อยู่" (ถูกปะ?)
ท่าพวกนี้ก็น่าจะเอาไปใช้กับ verb อื่นได้ด้วย :-)
<< ผมสนใจการsupport คนแปลมากกว่าผมเคยเห็นที่พอเอาลูกศรชี้ที่ตัวไหนความหมายย่อๆ ก็ปรากฎให้เราเลือกก่อนแปล >>
อันนี้ก็มักจะรวมอยู่ใน computer assisted translation tools (CAT) ด้วยครับ ตาม link ไปก็มีหลายโปรแกรมอยู่ครับ
Nectec ก็เคยทำ CAT นะครับ present ในงาน SNLP 2005 แต่ว่าไม่รู้ไปถึงไหนแล้ว
ขอบคุณมากครับ ผมเจอรายชื่อโปรแกรมที่คุณ link มาให้แล้ว จะลองศึกษาดู ครับ