โปรแกรมแปล


โปรแกรมแปลอังกฤษเป็นไทยมากมายแต่ก็ไม่เวิร์ค

วันนี้เรามาคุยเรื่องการแปลกันนะครับ  เคยสงสัยไหมครับว่าทำไมเรามีโปรแกรมแปลอังกฤษเป็นไทยมากมายแต่ก็ไม่เวิร์ค สักทีที่ไม่เวิร์คเพราะมันแปลไม่ได้ ร้อยเปอร์เซนต์ บางทีก็อ่านไม่รู้เรื่องเลย ปัญหาหนึ่งคือ ความหมายของศัพท์ครับ คือภาษาอังกฤษนี่ คำหนึ่งมันมี หลายความหมาย เช่นคำว่า as อาจแปลว่าดังเช่น I do it as you.

ผมทำเหมือนคุณ หรือ แปลว่า ขณะที่  As I was walking to school, I saw a snake. ขณะที่ผมกำลังเดินไปโรงเรียนผมเห็นงู  แต่ซอฟแวร์ของเราอาจแปลว่า  ดังเช่นผมกำลังเดินไปโรงเรียน ผมเห็นงู นี่แค่ประโยคโครงสร้างไม่ซับซ้อนนะครับถ้าซับซ้อนคงยิ่งไม่รู้เรื่องกันใหญ่

คุณหละครับคิดอย่างไรกับซอฟแวร์ที่ใช้แปลถ้ามีซอฟแวร์ดีๆหรือเว็บดีๆก็ ช่วยบอกหน่อยนะครับ ตอนนี้ผมใช้สุภาษิตอยู่แต่ต้องแปลผ่านเน็ต

คำสำคัญ (Tags): #โปรแกรมแปล
หมายเลขบันทึก: 87766เขียนเมื่อ 31 มีนาคม 2007 17:57 น. ()แก้ไขเมื่อ 12 มิถุนายน 2012 09:28 น. ()สัญญาอนุญาต: จำนวนที่อ่านจำนวนที่อ่าน:


ความเห็น (10)
ตอนนี้โปรแกรมที่เพื่อนผมทำเล่นอยู่แปลออกมาว่า "เป็น ฉัน รู้ สึก เดิน มา ไป โรงเรียน ฉัน เห็น ที่ snake" :-P
อย่างไรก็ตาม ถ้ามีโปรแกรมแปลตัวใหม่ๆ แล้วผมรู้ ผมจะเอามา post นะครับ :-)

ผมคิดว่าโปรแกรมแปลภาษา ตอนนี้ยังห่างไกล จากใช้คนแปลจริงๆ มากนัก (มันสามารถมาแปลแทนคนได้)

 

แต่ว่ามันจะมีประโยชน์ต่อเมื่อ 

1. เราอ่านภาษาที่จะแปลไม่ออก (หรือออกนิดหน่อย) แปลมาแย่ๆ ก็ยังดีว่าไม่มีอะไรเลย สำหรับผมแล้ว ภาษาญี่ปุ่น ฝรั่งเศส อาจจะเข้าข่าย แต่ไม่ใช่ อังกฤษ

 

2. แปลอัตโนมัติเพื่อลดเวลาที่นักแปลใช้ทำงานทั้งหมด แต่ก็คงใช้ได้กับพวกคู่มือ หรืออะไรทำนองนั้น ไม่ใช่ แปลนิยาม ฯลฯ

ขอบคุณ  ความคิดเห็นของคุณวีร์  จากที่เคยแปลมาโปรแกรมแปล น่าจะใช้กับพวกข้อความในชิวิตประจำวันเช่นจดหมาย หรือ บทสนทนา  ส่วน textbook  Journal หรือ บทวิจัย ก็ต้องหาผู้รู้ช่วย  ครับ

 

  • สวัสดีครับ น่าสนใจมากเลยทีเดียวครับ
  • นอกจาก แปลไทย แล้ว อ่านไทย ก็ไม่ได้ง่ายครับ นี่หล่ะครับ เสน่ห์ของภาษาไทยครับ
  • ที่บ่งบอกถึงคุณลักษณะพิเศษของภาษาไทย ด้วยโครงสร้างของภาษาไทยพิเศษกว่าภาษาอังกฤษ ทำให้การแปลความสัมพันธ์ แบบ one to many ซึ่งไม่เป็นฟังก์ชัน ทำได้ไม่ง่ายครับ
  • ดังนั้น ตัวแปลจะต้องมีการเรียนรู้ จะใช้พวก mapping function ทำไม่ได้ครับ นั่นเป็นเหตุให้นักวิจัยทางด้าน AI (Artificial Intelligent), ML (Machine Learning), ANN (Artificial Neural Network) และด้านอื่นที่เกี่ยวข้อง ต้องทำงานหนักมากขึ้นครับ
  • แล้วงานวิจัยด้านนี้ยังต้องใช้เวลาอีกนานครับผม ตอนนี้ผมเองสนใจเรื่องการ coding ภาษาไทยอยู่ครับ เพื่อจะวิเคราะห์ตัวอักษรอยู่ครับ
  • อีกฟิลด์ที่น่าสนใจมากๆ คือ Speech to Text, Text to Speech ของภาษาไทยครับ จะทำอย่างโดยไม่ต้องมีการเก็บฐานข้อมูลเสียงไว้
  • คงสนุกนะครับ
Chatchai: Textbook กับ Journal แอบแปลง่ายกว่า บทสนทนา ก็มีเหมือนกันนะครับ :-)

<<ที่บ่งบอกถึงคุณลักษณะพิเศษของภาษาไทย ด้วยโครงสร้างของภาษาไทยพิเศษกว่าภาษาอังกฤษ ทำให้การแปลความสัมพันธ์ แบบ one to many ซึ่งไม่เป็นฟังก์ชัน ทำได้ไม่ง่ายครับ>>

มันอาจจะไม่ใช่ว่า ภาษาไหนพิเศษกว่าภาษาไหน แต่ที่มันยากมีอยู่ 2 ปัญหาหลักๆ คือ

 

1. ภาษาแต่ละภาษาต่างกัน (Divergence) สามารถอ่านเพิ่มเติมได้ที่ paper นี้ครับ อธิบายได้น่าประทับใจมาก

2. ภาษาแต่ละภาษากำกวม บางครั้งเครื่องก็ตีความผิด

"เป็น ฉัน รู้ สึก เดิน มา ไป โรงเรียน ฉัน เห็น ที่ snake" ใช้ statistical mt แปลมา จะคิดว่าเป็น machine learning ด้วยก็ได้ เพราะว่าขั้นตอน คือ train แล้ว เอาไปใช้งานเหมือนกัน 

แต่ก็มีปัญหาว่าเวลา train ต้องการใช้ ตัวอย่างคู่ประโยค ภาษาไทยกับภาษาอังกฤษ แต่ทว่าหายากมาก Philipp Koehn บอกว่าต้องใช้สัก 10 ล้านคู่ !!! คู่ภาษาในยุโรปก็พอจะมี arabic-english ก็พอมี chinese-english ก็พอมี

ขอบคุณครับที่ให้ความคิดเห็นดีๆ

แอบรักคนมีเจ้าของ

พบปัญหาการใช้งานกรุณาแจ้ง LINE ID @gotoknow
ClassStart
ระบบจัดการการเรียนการสอนผ่านอินเทอร์เน็ต
ทั้งเว็บทั้งแอปใช้งานฟรี
ClassStart Books
โครงการหนังสือจากคลาสสตาร์ท