วันนี้เรามาคุยเรื่องการแปลกันนะครับ เคยสงสัยไหมครับว่าทำไมเรามีโปรแกรมแปลอังกฤษเป็นไทยมากมายแต่ก็ไม่เวิร์ค สักทีที่ไม่เวิร์คเพราะมันแปลไม่ได้ ร้อยเปอร์เซนต์ บางทีก็อ่านไม่รู้เรื่องเลย ปัญหาหนึ่งคือ ความหมายของศัพท์ครับ คือภาษาอังกฤษนี่ คำหนึ่งมันมี หลายความหมาย เช่นคำว่า as อาจแปลว่าดังเช่น I do it as you.
ผมทำเหมือนคุณ หรือ แปลว่า ขณะที่ As I was walking to school, I saw a snake. ขณะที่ผมกำลังเดินไปโรงเรียนผมเห็นงู แต่ซอฟแวร์ของเราอาจแปลว่า ดังเช่นผมกำลังเดินไปโรงเรียน ผมเห็นงู นี่แค่ประโยคโครงสร้างไม่ซับซ้อนนะครับถ้าซับซ้อนคงยิ่งไม่รู้เรื่องกันใหญ่
คุณหละครับคิดอย่างไรกับซอฟแวร์ที่ใช้แปลถ้ามีซอฟแวร์ดีๆหรือเว็บดีๆก็ ช่วยบอกหน่อยนะครับ ตอนนี้ผมใช้สุภาษิตอยู่แต่ต้องแปลผ่านเน็ต
ผมคิดว่าโปรแกรมแปลภาษา ตอนนี้ยังห่างไกล จากใช้คนแปลจริงๆ มากนัก (มันสามารถมาแปลแทนคนได้)
แต่ว่ามันจะมีประโยชน์ต่อเมื่อ
1. เราอ่านภาษาที่จะแปลไม่ออก (หรือออกนิดหน่อย) แปลมาแย่ๆ ก็ยังดีว่าไม่มีอะไรเลย สำหรับผมแล้ว ภาษาญี่ปุ่น ฝรั่งเศส อาจจะเข้าข่าย แต่ไม่ใช่ อังกฤษ
2. แปลอัตโนมัติเพื่อลดเวลาที่นักแปลใช้ทำงานทั้งหมด แต่ก็คงใช้ได้กับพวกคู่มือ หรืออะไรทำนองนั้น ไม่ใช่ แปลนิยาม ฯลฯ
ขอบคุณ ความคิดเห็นของคุณวีร์ จากที่เคยแปลมาโปรแกรมแปล น่าจะใช้กับพวกข้อความในชิวิตประจำวันเช่นจดหมาย หรือ บทสนทนา ส่วน textbook Journal หรือ บทวิจัย ก็ต้องหาผู้รู้ช่วย ครับ
<<ที่บ่งบอกถึงคุณลักษณะพิเศษของภาษาไทย ด้วยโครงสร้างของภาษาไทยพิเศษกว่าภาษาอังกฤษ ทำให้การแปลความสัมพันธ์ แบบ one to many ซึ่งไม่เป็นฟังก์ชัน ทำได้ไม่ง่ายครับ>>
มันอาจจะไม่ใช่ว่า ภาษาไหนพิเศษกว่าภาษาไหน แต่ที่มันยากมีอยู่ 2 ปัญหาหลักๆ คือ
1. ภาษาแต่ละภาษาต่างกัน (Divergence) สามารถอ่านเพิ่มเติมได้ที่ paper นี้ครับ อธิบายได้น่าประทับใจมาก
2. ภาษาแต่ละภาษากำกวม บางครั้งเครื่องก็ตีความผิด
"เป็น ฉัน รู้ สึก เดิน มา ไป โรงเรียน ฉัน เห็น ที่ snake" ใช้ statistical mt แปลมา จะคิดว่าเป็น machine learning ด้วยก็ได้ เพราะว่าขั้นตอน คือ train แล้ว เอาไปใช้งานเหมือนกัน
แต่ก็มีปัญหาว่าเวลา train ต้องการใช้ ตัวอย่างคู่ประโยค ภาษาไทยกับภาษาอังกฤษ แต่ทว่าหายากมาก Philipp Koehn บอกว่าต้องใช้สัก 10 ล้านคู่ !!! คู่ภาษาในยุโรปก็พอจะมี arabic-english ก็พอมี chinese-english ก็พอมี
ขอบคุณครับที่ให้ความคิดเห็นดีๆ
แอบรักคนมีเจ้าของ