<<ที่บ่งบอกถึงคุณลักษณะพิเศษของภาษาไทย ด้วยโครงสร้างของภาษาไทยพิเศษกว่าภาษาอังกฤษ ทำให้การแปลความสัมพันธ์ แบบ one to many ซึ่งไม่เป็นฟังก์ชัน ทำได้ไม่ง่ายครับ>>

มันอาจจะไม่ใช่ว่า ภาษาไหนพิเศษกว่าภาษาไหน แต่ที่มันยากมีอยู่ 2 ปัญหาหลักๆ คือ

 

1. ภาษาแต่ละภาษาต่างกัน (Divergence) สามารถอ่านเพิ่มเติมได้ที่ paper นี้ครับ อธิบายได้น่าประทับใจมาก

2. ภาษาแต่ละภาษากำกวม บางครั้งเครื่องก็ตีความผิด

"เป็น ฉัน รู้ สึก เดิน มา ไป โรงเรียน ฉัน เห็น ที่ snake" ใช้ statistical mt แปลมา จะคิดว่าเป็น machine learning ด้วยก็ได้ เพราะว่าขั้นตอน คือ train แล้ว เอาไปใช้งานเหมือนกัน 

แต่ก็มีปัญหาว่าเวลา train ต้องการใช้ ตัวอย่างคู่ประโยค ภาษาไทยกับภาษาอังกฤษ แต่ทว่าหายากมาก Philipp Koehn บอกว่าต้องใช้สัก 10 ล้านคู่ !!! คู่ภาษาในยุโรปก็พอจะมี arabic-english ก็พอมี chinese-english ก็พอมี