รับข้อความด้วยเสียง (125)

หลายปีก่อนหากได้ดูภาพยนต์ล้ำสมัยที่สั่งเปิดปิดไฟในบ้าน สั่งเปิดปิดประตู หรือพูดคุยกับหุ่นยนต์ เราก็คงรู้สึกตื่นเต้นเหมือนดูภาพยนต์เรื่อง Star War ภาคแรก แต่ปัจจุบันเราสามารถหาซื้อหุ่นยนต์สุนัขมาเล่นที่บ้าน หรือได้เห็นหุ่นอาซิโม (ASIMO = Advanced Step in Innovative Mobility) ซึ่งเป็นหุ่นยนต์ฮิวแมนนอยด์ หรือหุ่นยนต์เลียนแบบมนุษย์ของบริษัทฮอนด้าเดินไปมาเหมือนมนุษย์บนเวที สามารถที่ตอบสนองเสียง และสภาพแวดล้อมได้อย่างชาญฉลาด เคยมีสัตว์เลี้ยงเสมือน (Virtual Pet) หรือทามาก๊อต (Tamagot) ให้มนุษย์ที่ครอบครองได้ดูแลป้อนข้าวป้อนน้ำ ถ้าดูแลไม่ดีสัตว์เลี้ยงเสมือนก็จะตายเป็นแนวคิดปัญญาประดิษฐ์ (Artificial Intelligence) ปัจจุบันการรับคำสั่งด้วยเสียง และฐานความรู้ผู้เชี่ยวชาญที่เรียนรู้พฤติกรรมในอดีตมาประกอบการกำหนดพฤติกรรมที่เหมาะสมในปัจจุบัน และเก็บข้อมูลที่เกิดขึ้นแล้วนำไปกำหนดพฤติกรรมที่ดีที่สุดในอนาคต

เครื่องคอมพิวเตอร์ตั้งโต๊ะในปัจจุบันสามารถเชื่อมต่อไมโครโฟนจากภายนอก หรือเครื่องโน๊ตบุ๊คที่มีไมโครโฟนในตัว ทำให้การรับเสียงจากมนุษย์เข้าสู่เครื่องคอมพิวเตอร์ทำได้ง่ายมาก ระบบปฏิบัติการในปัจจุบันจะเตรียมโปรแกรมสำหรับบันทึกเสียง เล่นแฟ้มเพลงได้หลายหลาย หรือแฟ้มภาพยนต์วีซีดีโดยไม่ต้องติดตั้งโปรแกรมเพิ่ม ยิ่งไปกว่านั้นเครื่องคอมพิวเตอร์ที่ติดตั้งโปรแกรมพิเศษจะรับคำสั่งด้วยเสียงจากภายนอกได้ เช่น ปิดเครื่อง เปิดเครื่อง ล๊อกเครื่อง หรือรับข้อความเสียงเข้าไปใส่ในไมโครซอฟท์เวิร์ดแทนการใช้แป้นพิมพ์ (Keyboard) เป็นต้น

การรับเสียงจากมนุษย์เข้าไปประมวลผลในเครื่องคอมพิวเตอร์ (Speech Recognition) หรือแปลงตัวอักษรในเครื่องคอมพิวเตอร์ออกมาเป็นเสียงมนุษย์ (Text to Speech) ถูกพัฒนาโดยนักวิจัยอย่างต่อเนื่องและจริงจัง เช่น งานพัฒนาระบบสังเคราะห์เสียงพูดภาษาไทยของศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (NECTEC) มีหัวหน้ากลุ่มวิจัยคือ ดร.ณัฐนันท์ ทัดพิทักษ์กุล พัฒนาระบบรับข้อความภาษาไทยแล้วแปลงเป็นเสียงมนุษย์พูดด้วยโปรแกรมวาจา (Vaja = Text to Speech Synthesis) ถ้ารับข้อความภาษาอังกฤษก็จะมีโปรแกรม Microsoft Narrator สำหรับแปลงข้อความเป็นเสียงพูด (Text to Speech) ที่มาพร้อมกับระบบปฏิบัติการ Microsoft Windows XP แต่ถ้าต้องการรับเสียงพูดเป็นภาษาอังกฤษลงไปในแฟ้มเอกสารก็ต้องติดตั้งโปรแกรม Microsoft Office XP หรือ 2003 รุ่นภาษาอังกฤษ ในอนาคตมนุษย์อาจมีการส่งความคิดผ่านอุปกรณ์ครอบศรีษะแล้วได้ออกมาเป็นเสียงพูด เป็นตัวอักษร เป็นภาพ หรือเป็นเสียงดนตรี แต่ทุกการเริ่มต้นย่อมมีข้อจำกัด เสียงมนุษย์ที่ส่งเข้าเครื่องคอมพิวเตอร์ก็มีข้อจำกัด เช่น เป็นหวัด เสียงแตกหนุ่ม สำเนียงที่แตกต่าง หรือเสียงรบกวนจากสภาพแวดล้อมที่คุมได้ยาก แม้ข้อจำกัดจะมากมายเพียงใด แต่เชื่อว่ามนุษย์สามารถแก้ไขข้อจำกัดเหล่านั้นได้ เพียงแต่ต้องใช้เวลา และหวังว่าในช่วงชีวิตของเราจะข้ามข้อจำกัดเหล่านั้นได้อย่างสมบูรณ์

ความเห็น

บทความในวันเดียวกัน