MIT ช็อกวงการ! เผยสมองส่วน "จำหน้าคน-สิ่งของ" ทำหน้าที่ "นำทาง" ได้ด้วย?

วงการประสาทวิทยาอาจต้องถึงคราวปรับตำรากันใหม่ เมื่อผลวิจัยชิ้นสำคัญจาก MIT ออกมาท้าทายความเข้าใจที่มีมานานหลายสิบปี โดยชี้ว่าเส้นทางในสมองที่เราเคยเชื่อว่าทำหน้าที่แค่ ‘จดจำวัตถุ’ เท่านั้น แท้จริงแล้วอาจมีบทบาทสำคัญในการประมวลผลข้อมูลเชิงพื้นที่ (Spatial information) หรือการรับรู้ตำแหน่งแห่งที่ต่างๆ ด้วย ความเข้าใจใหม่นี้อาจนำไปสู่การเปลี่ยนแปลงครั้งใหญ่ ตั้งแต่วิธีที่เราเรียนรู้ พัฒนาปัญญาประดิษฐ์ (AI) ไปจนถึงการดูแลสุขภาพสมอง ทั้งในระดับโลกและในบริบทของประเทศไทย

หลายปีที่ผ่านมา นักวิทยาศาสตร์ต่างเชื่อมั่นว่า เส้นทางการประมวลผลภาพส่วนล่าง (Ventral visual stream) ซึ่งเปรียบเสมือนถนนสายหลักในสมองมนุษย์นั้น มีหน้าที่เพียงอย่างเดียวคือจดจำวัตถุต่างๆ ไม่ว่าจะเป็นแก้วกาแฟสตาร์บัคส์บนรถไฟฟ้า BTS หรือหน้าตาแม่ค้าขายเงาะเจ้าประจำที่ตลาดจตุจักร แนวคิดนี้ไม่ได้ฝังรากลึกแค่ในตำราประสาทวิทยา แต่ยังเป็นรากฐานสำคัญในการพัฒนา ระบบคอมพิวเตอร์วิทัศน์ (Computer vision) ที่เราใช้กันทุกวันนี้ ตั้งแต่ในสมาร์ทโฟนไปจนถึงรถยนต์ไร้คนขับ ทว่างานวิจัยล่าสุดที่นำโดย ยูดิ เซีย (Yudi Xie) นักศึกษาปริญญาเอกแห่ง MIT กลับชี้ว่าเรื่องนี้อาจซับซ้อนกว่าที่เราคิด ผลการศึกษาของพวกเขา ซึ่งถูกนำเสนอในงานประชุมวิชาการระดับโลกอย่าง International Conference on Learning Representations เผยให้เห็นว่า เมื่อแบบจำลองการเรียนรู้เชิงลึก (Deep learning model) ถูกฝึกให้ไม่เพียงแค่จดจำวัตถุ แต่ยังต้องเข้าใจคุณสมบัติเชิงพื้นที่ เช่น ตำแหน่ง ทิศทางการหัน และขนาดด้วย แบบจำลองเหล่านี้กลับสามารถจำลองการทำงานของเซลล์ประสาทในสมองส่วน ventral stream ได้ดีไม่แพ้แบบจำลองที่ถูกฝึกมาเพื่อจดจำวัตถุเพียงอย่างเดียวเลย พูดง่ายๆ ก็คือ สมองส่วน ventral stream อาจไม่ได้ถูกออกแบบมาเพื่อจำหน้าคนหรือแยกแยะสิ่งของเท่านั้น แต่มันอาจเป็นเหมือนเครื่องมือสารพัดประโยชน์ที่ช่วยให้เรามองเห็นและตอบสนองต่อโลกรอบตัวได้อย่างครอบคลุม

แล้วการค้นพบนี้ส่งผลกระทบต่อพวกเราคนไทยอย่างไรบ้าง? ความเข้าใจเรื่องการแบ่งงานของสมองส่วนต่างๆ นี้ มีผลโดยตรงต่อวิธีที่เราวินิจฉัยและรักษาผู้ป่วยสมองบาดเจ็บ แนวทางการช่วยเหลือเด็กที่มีปัญหาการเรียนรู้ หรือแม้กระทั่งการออกแบบเทคโนโลยีที่เราใช้ในชีวิตประจำวัน ตัวอย่างเช่น เด็กนักเรียนไทยที่มีปัญหาเรื่องการคิดเชิงมิติสัมพันธ์ (Visual-spatial reasoning) อาจได้รับประโยชน์จากแนวทางการช่วยเหลือที่เดิมทีสงวนไว้สำหรับเด็กที่มีปัญหาด้านการจดจำวัตถุ และในทางกลับกัน “เรื่องนี้เปิดคำถามที่กว้างขึ้นมากว่า จริงๆ แล้วสมองส่วน ventral stream ถูกปรับให้เหมาะสมกับงานประเภทไหนกันแน่” เซียให้สัมภาษณ์กับ MIT News พร้อมชี้ให้เห็นว่าเราอาจต้องมองการประมวลผลภาพในสมองแบบองค์รวมมากขึ้น ทั้งในงานวิจัยและในห้องเรียนทั่วโลก (ที่มา: MIT News)

เพื่อให้เข้าใจความสำคัญของการค้นพบนี้ เราต้องย้อนกลับไปดูการทำงานของระบบการมองเห็นในสมอง ตั้งแต่ช่วงต้นทศวรรษ 1980 นักวิทยาศาสตร์ได้แบ่งเส้นทางการส่งข้อมูลภาพออกเป็น 2 สายหลัก คือ เส้นทาง ventral stream ทำหน้าที่ตอบคำถามว่า ‘สิ่งนี้คืออะไร?’ (What?) และเส้นทาง dorsal stream ทำหน้าที่ตอบคำถามว่า ‘สิ่งนี้อยู่ที่ไหน?’ (Where?) นักศึกษาแพทย์และนักจิตวิทยาในไทยก็ยังคงเรียน ‘สมมติฐานสองเส้นทาง’ (Two-stream hypothesis) นี้กันอยู่ ในช่วงทศวรรษที่ผ่านมา แบบจำลองคอมพิวเตอร์อันทรงพลังที่เรียกว่า โครงข่ายประสาทเทียมแบบคอนโวลูชัน (Convolutional Neural Networks หรือ CNNs) ได้ถูกพัฒนาและฝึกฝนให้เลียนแบบการทำงานของ ventral stream ซึ่งเป็นแรงขับเคลื่อนสำคัญเบื้องหลังความก้าวหน้าของคอมพิวเตอร์วิทัศน์และ AI ตั้งแต่ระบบตรวจสอบคุณภาพข้าวอัตโนมัติในโรงสีของไทย ไปจนถึงระบบจดจำใบหน้าที่ใช้ในสนามบินสุวรรณภูมิ

จนถึงปัจจุบัน CNNs เหล่านี้มักถูกออกแบบมาเพื่อทำงานด้านการจำแนกประเภทวัตถุเป็นหลัก ซึ่งสะท้อนความเชื่อเดิมๆ ที่ว่าหน้าที่หลักของ ventral stream คือการบอกว่าสิ่งต่างๆ คืออะไร แต่การทดลองใหม่ของ MIT กลับใช้วิธีที่ต่างออกไป ทีมวิจัยได้สร้างชุดข้อมูลภาพสังเคราะห์ขนาดใหญ่—เช่น รูปกาน้ำชา เครื่องคิดเลข และของใช้ในชีวิตประจำวันอื่นๆ—วางซ้อนบนพื้นหลังที่หลากหลาย พร้อมทั้งระบุข้อมูลเกี่ยวกับทิศทาง ตำแหน่ง และขนาดของวัตถุแต่ละชิ้นอย่างแม่นยำ จากนั้น พวกเขานำ CNNs มาฝึกด้วย ‘โจทย์เชิงพื้นที่’ (Spatial tasks) เหล่านี้ ผลลัพธ์ที่น่าทึ่งคือ แบบจำลองเหล่านี้สามารถทำนายการทำงานของสมองส่วน ventral stream ได้ดีเทียบเท่า หรือในบางกรณี ดีกว่า แบบจำลองที่ฝึกมาเพื่อจดจำวัตถุเพียงอย่างเดียวเสียอีก

ยิ่งไปกว่านั้น นักวิจัยยังพบว่าในชั้นประมวลผลช่วงต้นและช่วงกลางของ CNNs ที่ฝึกด้วยโจทย์เชิงพื้นที่นั้น แทบจะ неотличимы (indistinguishable) จากแบบจำลองที่ฝึกด้วยโจทย์การจดจำวัตถุแบบเดิมๆ เลย “ดูเหมือนว่าพวกมันจะเรียนรู้รูปแบบการแทนค่า (Representation) ที่คล้ายกันมาก หรืออาจจะเป็นแบบเดียวกันเลยในชั้นต้นถึงชั้นกลาง” เซียกล่าว มีเพียงในชั้นสุดท้ายเท่านั้นที่แบบจำลองจะเริ่มแยกการทำงานออกไปอย่างชัดเจนเพื่อมุ่งเน้นไปยังเป้าหมายเฉพาะของตัวเอง การค้นพบนี้บ่งชี้ว่า ventral stream อาจรองรับความสามารถในการประมวลผลภาพที่กว้างขวางกว่าที่เราเคยคิด และสมองของเรา—รวมถึงสมองของเด็กๆ ที่กำลังเรียนรู้—อาจกำลังเรียนรู้ ‘หลายอย่างพร้อมกัน’ โดยใช้วงจรประสาทเดียวกัน

นักประสาทวิทยาชั้นนำอย่าง เจมส์ ดิ คาร์โล (James DiCarlo) และ โจชัว เทเนนบอม (Joshua Tenenbaum) ซึ่งเป็นทั้งผู้บุกเบิกในสาขานี้และผู้ร่วมเขียนงานวิจัยชิ้นนี้ เชื่อว่าความเข้าใจใหม่นี้ไม่เพียงแต่จะเปลี่ยนโฉมหน้าทฤษฎีทางประสาทวิทยา แต่ยังมีความสำคัญอย่างยิ่งในทางปฏิบัติสำหรับวงการปัญญาประดิษฐ์ด้วย บริษัทสตาร์ทอัพและห้องปฏิบัติการวิจัยในมหาวิทยาลัยของไทยที่กำลังพัฒนาหุ่นยนต์ ระบบแปลภาษาด้วย AI เกษตรอัจฉริยะ หรือระบบเฝ้าระวังต่างๆ อาจต้องกลับมาทบทวนวิธี ‘สอน’ ให้เครื่องจักร ‘มองเห็น’ โลกใหม่—ไม่ใช่แค่ให้จดจำวัตถุได้ แต่ต้องเข้าใจบริบทเชิงพื้นที่และความสัมพันธ์ของสิ่งต่างๆ อย่างลึกซึ้ง ซึ่งเป็นทักษะที่จำเป็นอย่างยิ่งในสภาพแวดล้อมที่ซับซ้อนและเปลี่ยนแปลงตลอดเวลาอย่างในกรุงเทพฯ หรือเชียงใหม่

ผลวิจัยนี้ยังเป็นโจทย์ท้าทายให้นักการศึกษาและบุคลากรทางการแพทย์ในไทยต้องพิจารณาทบทวนแนวทางการช่วยเหลือเด็กที่มีปัญหาทางการเรียนรู้ ทักษะการกะประมาณเชิงมิติสัมพันธ์ (Approximate visual-spatial skills)—เช่น การทำความเข้าใจแผนที่ในวิชาสังคมศึกษา หรือการจินตนาการรูปทรงเรขาคณิตในวิชาคณิตศาสตร์—อาจพัฒนาได้ดีขึ้นด้วยโปรแกรมฝึกที่ส่งเสริมทั้งความสามารถในการประมวลผลวัตถุและเชิงพื้นที่ไปพร้อมๆ กัน แทนที่จะมองว่าทักษะเหล่านี้แยกขาดจากกัน แนวคิดเดียวกันนี้อาจนำไปปรับใช้กับการฟื้นฟูผู้ป่วยโรคหลอดเลือดสมองหรือผู้ที่ได้รับบาดเจ็บทางสมองได้ด้วย ตัวอย่างเช่น การประเมินผู้ป่วยแบบเดิมๆ ในโรงพยาบาลไทยมักจะแยกทดสอบความสามารถในการบอกชื่อวัตถุ กับความสามารถในการรับรู้ทิศทางออกจากกัน แต่งานวิจัยนี้ชี้ว่าในระดับการทำงานของสมอง ขอบเขตของความสามารถเหล่านี้อาจไม่ได้แยกกันชัดเจนอย่างที่เราเคยเข้าใจ

ในมุมมองทางวัฒนธรรม การที่ระบบการศึกษาไทยมักเน้นการท่องจำ—จำ จำ จำ—อาจต้องเสริมด้วยกิจกรรมการเรียนรู้เชิงพื้นที่ที่เน้นการ ‘ลงมือทำ’ (Hands-on) มากขึ้น งานฝีมืออันเป็นเอกลักษณ์ของไทยหลายอย่าง เช่น การแกะสลักผลไม้ การทำร่มบ่อสร้าง หรือการเชิดหนังตะลุง ล้วนต้องอาศัยทักษะทั้งด้านการจดจำรูปทรงและการกะระยะ ซึ่งสอดคล้องกับการค้นพบใหม่นี้อย่างน่าทึ่ง ราวกับว่าภูมิปัญญาไทยได้ใช้ประโยชน์จากความสามารถทั้งสองด้านของสมองมานานแล้วโดยไม่รู้ตัว

ในอนาคต งานวิจัยนี้อาจมีส่วนช่วยในการพัฒนาเครื่องมือตรวจคัดกรองปัญหาการเรียนรู้และภาวะสมองเสื่อมในระยะเริ่มต้น ซึ่งมีความสำคัญอย่างยิ่งต่อสังคมผู้สูงอายุของไทย โดยสร้างแบบทดสอบที่อิงการทำงานของสมองที่ครอบคลุมมากขึ้น นอกจากนี้ ยังอาจปูทางไปสู่ระบบคอมพิวเตอร์วิทัศน์ที่ฉลาดขึ้นสำหรับการจัดการจราจร การเกษตรแม่นยำ หรือแม้แต่การวิเคราะห์ภาพถ่ายทางการแพทย์ ซึ่งความสามารถในการรับรู้ทั้ง ‘อะไร’ และ ‘ที่ไหน’ มีความสำคัญไม่แพ้กัน ทีมวิจัยมีแผนที่จะพัฒนาแบบจำลองของพวกเขาให้ละเอียดซับซ้อนยิ่งขึ้น เพื่อแยกแยะความแตกต่างเล็กๆ น้อยๆ ในการทำงาน และหวังว่างานวิจัยเหล่านี้จะช่วยให้เราเข้าใจกลไกที่สมองนำชุดเครื่องมือการมองเห็นอันน่าทึ่งนี้มาใช้งานได้อย่างเต็มประสิทธิภาพมากยิ่งขึ้น

สำหรับผู้อ่านชาวไทย หลักฐานใหม่นี้ตอกย้ำความสำคัญของการส่งเสริมความสามารถทั้งด้านการรับรู้วัตถุและเชิงพื้นที่ ไม่ว่าจะในห้องเรียน ที่ทำงาน หรือในชีวิตประจำวัน คุณครูและผู้ปกครองสามารถลองนำเกมและกิจกรรมที่ท้าทายให้เด็กๆ ไม่เพียงแค่บอกชื่อสิ่งของ แต่ยังต้องลองจัดวาง หมุน หรือระบุตำแหน่งของสิ่งเหล่านั้นในพื้นที่จริงหรือพื้นที่จำลอง เช่น การต่อจิ๊กซอว์ การพับกระดาษแบบโอริกามิ หรือการใช้สื่อการเรียนรู้เสมือนจริง (VR)

ในขณะที่สังคมไทยกำลังก้าวเข้าสู่ยุคดิจิทัลที่ต้องพึ่งพาเทคโนโลยีมากขึ้นเรื่อยๆ และคนทำงานต้องมีปฏิสัมพันธ์กับระบบ AI อย่างหลีกเลี่ยงไม่ได้ การทำความเข้าใจและใช้ประโยชน์จากศักยภาพการมองเห็นของสมองอย่างเต็มที่—ไม่ใช่แค่ความสามารถในการ ‘มองเห็นว่าสิ่งนั้นคืออะไร’—อาจเป็นกุญแจสำคัญที่ช่วยให้คนไทยมีความได้เปรียบทั้งในเชิงปัญญาและเศรษฐกิจในอนาคต

ที่มา: MIT News

MIT ช็อกวงการ! เผยสมองส่วน "จำหน้าคน-สิ่งของ" ทำหน้าที่ "นำทาง" ได้ด้วย?

ความเห็น

บทความในวันเดียวกัน