วุ้นแปลภาษา


บางครั้ง ผมมี Ideas หรือมีอะไรที่อยากทำ แต่ก็ไม่ได้บันทึกเอาไว้ จนเวลาผ่านเลยไป บางอย่างก็ลบเลือนหายไป ซึ่งเป็นเรื่องที่น่าเสียดาย บางครั้งก็เป็นเรื่องที่น่าสนใจ หรือผมเองก็อยากทำ แต่ก็ไม่ได้ทำ ซึ่งก็อาจมีคนอื่นผ่านมาอ่านแล้ว ก็ไอเดีย แนวคิด ก็นำไปทำได้ ซึ่งผมเองบางเรื่องก็อยากทำ แต่ไม่มีเวลาทำ หรือความรู้ไม่เพียงพอที่จะทำ จึงตั้งใจไว้ว่า หากมี ideas อะไรอีก เมื่อมีโอกาสจะนำมาบันทึกเอาไว้
สมัยเด็กๆ หลายๆคนคงเคยดูการ์ตูนเรื่อง โดราเอมอน คุณทราบไหมว่าโดเอมอนมีของวิเศษทั้งหมดกี่อย่าง? จำนวนของวิเศษที่โดเอม่อน

ใช้ในการตูนทั้งหมดนั้นมีอยู่ประมาณ 4500 ชิ้น (อ้างอิงจาก รายชื่อของวิเศษของโดราเอมอน) และหนึ่งในนั้นคือ "วุ้นแปลภาษา"

วุ้นแปลภาษา เป็นของวิเศษ ที่สามารถทำให้มนุษย์สามารถสื่อสารกับสิ่งมีชีวิตอื่นๆ ไม่ว่าจะเป็น คน สัตว์ หรือแม้แต่มนุษต์ต่างดาว (รวมพืชด้วยไหมนะ??)
ซึ่ง ของวิเศษชิ้นนี้ เป็นของที่โดเรมอนชอบนำมาใช้อยู่หลายๆ ครั้ง สิ่งที่ใช้เป็นตัวกลางในการแลกเปลี่ยนก็คือ "ภาษา" นั่นเอง จริงอยู่ว่าภาษาอังกฤษ ทุกวันนี้ถือเ็ป็นภาษาแม่ของโลก ดังนั้นเราจึงควรมีความสามารถในการใช้ภาษา แต่ไม่ใช่ทุกคนที่จะใช้ได้นี่!!


ผมจะลองแบ่งแนวทางการพัฒนาเป็น ส่วนๆ ดังนี้

Translator Service
บริการแปลภาษา ยกตัวอย่างเช่นของ google ซึ่งสามารถแปลภาษาจาก อังกฤษ ไปเป็นภาษาอราบิค, จีน, ฝรั่งเศล, เยอรมัน, อิตาเลียน, ญี่ปุ่น, เกาหลี, โปรตุเกส, รัสเซีย, สเปน (และยังแปลกลับไปได้ด้วย น่าเสียดายที่ Google ไม่มีบริการแปลเป็นภาษาไทย) บริการแปลภาษานี้ ช่วยให้เราสามารถเข้าถึงภาษาที่เราไม่รู้จักได้ บริการลักษณะนี้เมื่อพิจารณาก็ไม่ต่างกับ Online Dictionary นั่นเอง ซึ่งเป็นการแปลความหมายแบบคำต่อคำ

บริการแปลข้อความที่ advancd ขึ้นมาหน่อย ก็เห็นจะเป็นของ popthai ซึ่งแสดงผลคำแปลงได้รวดเร็ว โดยใช้วิธีแปลคำทั้งหน้าเว็บก่อน แล้วจึงแสดง

บริการลักษณะยังมีอีกแบบคือบริการที่สามารถแปลภาษาได้ทั้งประโยค เช่นบริการแปลหน้าเว็บเพจ จากภาษาอังกฤษเป็นภาษาไทยของภาษิต หรือของ google



เอาแค่นี้ก่อน ถึงตอนนี้เราก็สามารถนำไปทำวุ้นแปลภาษาได้อย่างง่ายแล้ว

case1: thai --> english
เรา chat กับ ชาวต่างชาติ(อเมริกัน) ผ่านทาง IM (MSN, ICQ, Yahoo!) โดยที่เราพิมพ์เป็นภาษาไทย แล้ว plugins ใน IM จะแปลงภาษาไทยไปเป็นภาษาอังกฤษ แล้วส่งไปตามปกติ

case2: thai <----> english <---> german
เรา chat กับชาวต่างชาติ(เยอรมัน) ผ่านทาง IM โดยที่เราพิมพ์ภาษาไทย แล้ว plugins ใน IM จะแปลงเป็น ภาษาอังกฤษ (ซึ่งเราถือว่าจะเป็นภาษากลาง) จากนั้นก็ส่งไปตามปกติ
ที่ฝั่งผู้รับ เมื่อ IM ได้รับข้อความ จะแปลงภาษาอังกฤษ ไปเป็นภาษาเยอรมัน (โดยวิธีใดๆ ที่จะรู้ได้ว่า ต้องการแปลงกลับมาเป็นภาษาอะไร) ในทางกลับกัน เมื่อผู้รับต้องการโ้ต้ตอบ เขาก็พิมพ์ภาษาเยอรมันลงไป ระบบจะแปลงไปเป็นภาษาอังกฤษ สุดท้าย เราจะได้รับข้อความกลับมาเป็นภาษาไทย (จากภาษาเยอรมัน)

 

 

 

Speech Recognition + Text to Speech
หลายคนคงเดาได้แล้วว่า ผมจะต่อยอดอะไรต่อไป....... ใช่ครับ วุ้นแปลภาษาของโดเอมอน ใช้วิธีพูดคุยกัน ไม่ใช่แค่พิมพ์ข้อความ ดังนั้นเราจะต่อยอดขึ้นมา ด้วยการพูดคุยด้วยเสียง ซึ่งผมจะแบ่งเทคโนโลยีที่ใช้เป็น 2 ส่วน

1. ระบบรู้จำเสียงพูด (Speech Recognition) กระบวนการที่จะแปลงเสียงพูดเป็นข้อความ
ตัวอย่างงานวิจัย
การรู้จำเสียงพูดตัวเลขภาษาไทยแบบหลายผู้พูดด้วยนิวรัลเน็ตเวอร์ค โดยไชยันต์ สุวรรณชีวะศิริ
iSpeech โดย โครงการวิจัยและพัฒนาระบบรู้จำเสียงพูดภาษาไทย


2. ระบบสังเคราะห์เสียงพูด (TTS - Text to Speech) เป็นกระบวนการที่จะแปลงข้อความเป็นเสียงพูด
ตัวอย่างงานวิจัย
CU VOCAL Web Service: A Text-to-speech Synthesis Web Service for Voice-enabled Web-mediated Applications
AT&T Lab Inc Research - Text-To-Speech (TTS) -- Our Demo Speaks Your Text
http://vaja.nectec.or.th/ws/vaja-webservice.html

จาก case2 (ด้านบน) เรามาเพิ่มส่วนที่จะพิมพ์ข้อความลงไป ให้สามารถแปลงเสียงเป็นข้อความแทนได้ด้วย และที่ฝั่งปลายทาง เราก็เพิ่มส่วนที่จะแสดงข้อความ ให้สามารถพูดได้ด้วย TTS

ดังนั้น เมื่อ

1. นาย A พูดว่า "สวัสดีครับ" Speech Recognition จะแปลงเสียงพูดเป็นข้อความ "สวัสดีครับ"
2. Translator Service จะแปลงคำว่า "สวัสดีครับ" ไปเป็น "Hello"
3. เมื่อทราบว่าผู้สนทนาต้องการพูดคุยเป็นฝรั่งเศล ระบบจึงเปลี่ยนคำว่า "Hello" ไปเป็น "Bonjour"
3. ข้อความ "Bonjour" ถูกส่งไปทาง IM (MSN, Yahoo!, ICQ)
4. IM ได้รับข้อความ และแสดงข้อความ "Bounjour" พร้อมกับพูดว่า Bounjour!


ใช่ครับ ที่จริง บริการแปลภาษานี่ มันควรจะไปทำที่ IM ได้นะ แต่ก็ไม่เห็นมีบริการอย่างนี้นี่!!!

ชิ้นส่วนต่างๆ (Modules) สามารถใช้บริการผ่าน WebService ได้โดยง่าย ยกเว้น Speech Recognition ซึ่งน่าจะทำในรูปแบบ WebService ได้ไม่่ง่ายนัก

ถ้าเราสามารถทำเป็น box ได้ และใช้ box นั้นเชื่อมต่อกับบริการเครือข่ายที่มีอยู่ และแต่ล่ะ box สามารถเชื่อมต่อกันเองได้ เราก็จะสามารถคุยกันผ่าน box เหล่านี้ได้ (ที่นี้เจอฝรั่งไม่ต้องวิ่งหนีแล้ว)
ฝันไปอีกหน่อย โทรศัพท์มือถือนี่แหล่ะ ก็น่าจะทำได้เหมือนกันนะ อาจจะไม่ได้ประมวลผลเอง แต่ส่งข้อมูลไปประมวลผลที่ Server แต่นั่นหมายถึงโครงสร้างเครื่อข่ายที่ต้องมีความเร็วสูง (network: wifi, wimax, 3G, 4G)



เรื่องความช้า ความเร็ว หรือเทคนิคการพัฒนานั้นยังไม่อยากพูดถึง เพราะว่าเรื่องช้า มันก็ต้องช้าอยู่แล้ว ไม่สามารถทำงานได้อย่าวรวดเร็วทันใจ


สุดท้าย เทคโนโลยีที่กล่าวมานี้ ไ่ม่ใช่เรื่องใหม่อะไร เพียงเป็นการนำเอาเทคโนโลยีที่มีอยู่ มาใช้ให้เกิดประโยชน์สูงสุด ทุกๆอย่าง ยังต้องการการวิจัยและพัฒนา เพิ่อให้ทำงานได้อย่างมีประสิทธิภาพ


Links
Speech recognition
ภาษิต
Nectec WebService
ห้องปฎิบัติการวิจัยวิทยาการมนุษยภาษา

ขอบคุณครับ นี่แหล่ะครับ วุ้นแปลภาษาของผม

คำสำคัญ (Tags): #speech recognition#translator#tts#webservice
หมายเลขบันทึก: 108780เขียนเมื่อ 5 กรกฎาคม 2007 10:29 น. ()แก้ไขเมื่อ 18 มิถุนายน 2012 20:49 น. ()สัญญาอนุญาต:


ความเห็น (1)

ต้องขออภัยที่บังอาจมาออกความคิดเห็นในที่นี่

แต่เนื่องจากชอบทั้งโดราเอมอนอยู่แล้ว และ ชอบเรื่อง Technology โดยเฉพาะทางด้าน Voice ด้วย

เราขอสนับสนุนความคิดนี้นะ มันน่าจะทำได้ มีใครอยากลองเกาะกลุ่มกันทำขึ้นมามั๊ย?

พบปัญหาการใช้งานกรุณาแจ้ง LINE ID @gotoknow
ขอแนะนำ ClassStart
ระบบจัดการการเรียนการสอนผ่านอินเทอร์เน็ต
ทั้งเว็บทั้งแอปใช้งานฟรี