ปัญญาประดิษฐ์
เทคโนโลยี Brain-to-Voice ช่วยให้ชายที่เป็นอัมพาตพูดได้คล่อง

ทีมวิศวกรจากมหาวิทยาลัยแคลิฟอร์เนีย เดวิส ได้สร้างระบบสมองต่อเสียงที่ช่วยให้ผู้ที่มีปัญหาด้านการสื่อสารสามารถพูดได้อย่างคล่องแคล่ว ระบบนี้ผสมผสานอินเทอร์เฟซสมองกับคอมพิวเตอร์ (BCI) ปัญญาประดิษฐ์ขั้นสูง และการวิจัยใหม่ ๆ เพื่อรองรับการพูดแบบเรียลไทม์ที่เข้าใจได้และแสดงออกได้ รับฟังสิ่งที่คุณต้องการทราบ
ความผิดปกติในการสื่อสารคืออะไร?
เมื่อคุณคิดถึงสิ่งที่กำหนดตัวตนของคุณ อาจเป็นสไตล์หรือมุมมองของคุณ คนเพียงไม่กี่คนเท่านั้นที่จะพูดถึงน้ำเสียงของตัวเอง อย่างไรก็ตาม ทุกครั้งที่คุณพูด คุณจะได้ยินเสียงของตัวเอง ซึ่งช่วยยืนยันว่าเป็นคุณ ดังนั้น น้ำเสียงของคุณจึงเป็นส่วนสำคัญของตัวตนของคุณ ดังนั้น การสูญเสียส่วนหนึ่งของตัวตนของคุณไปอาจส่งผลเสียต่อสุขภาพจิตของคุณได้
น่าเศร้าที่สถานการณ์เช่นนี้เกิดขึ้นจริงกับผู้คนนับล้านที่ประสบปัญหาทางระบบประสาท ซึ่งอาจจำกัดความสามารถในการพูดได้อย่างคล่องแคล่ว อาการต่างๆ เช่น โรคหลอดเลือดสมอง โรคพูดไม่ชัด และโรคเสียงแหบ อาจทำให้พูดไม่ชัดหรือพูดไม่ชัด ส่งผลให้ความสามารถในการสื่อสารอย่างมีประสิทธิภาพของบุคคลนั้นลดลง
สถานการณ์เช่นนี้ไม่ใช่เหตุการณ์ที่เกิดขึ้นได้ยาก ตามรายงานล่าสุด การศึกษาในปีนี้ ผู้คนเกือบ 800,000 คนจะต้องทนทุกข์ทรมานจากโรคหลอดเลือดสมอง ข้อมูลเดียวกันระบุว่าผู้ป่วยโรคหลอดเลือดสมอง 1 ใน 3 รายจะประสบปัญหาด้านการสื่อสารบางรูปแบบหลังจากเกิดเหตุการณ์ดังกล่าว โรคเหล่านี้ส่งผลร้ายแรงต่อผู้ป่วยและอาจส่งผลให้เกิดภาวะซึมเศร้าและภาวะที่เป็นอันตรายอื่นๆ
อินเทอร์เฟซสมอง-คอมพิวเตอร์ (BCI) ช่วยการสื่อสารได้อย่างไร
โชคดีที่วิศวกรได้ทุ่มเทความพยายามอย่างมากในการพยายามแก้ไขปัญหาเหล่านี้ ตั้งแต่คอมพิวเตอร์ที่ควบคุมด้วยลมหายใจไปจนถึงซอฟต์แวร์ติดตามการเคลื่อนไหวของดวงตา เทคโนโลยีดูเหมือนจะให้แนวทางแก้ปัญหาบางอย่างได้ ในระดับนั้น อินเทอร์เฟซคอมพิวเตอร์ Brain ถือเป็นวิวัฒนาการเชิงตรรกะของเทคโนโลยีนี้สำหรับหลายๆ คน
นับตั้งแต่ฮันส์ เบอร์เกอร์ได้บันทึกกิจกรรมไฟฟ้าในสมองไว้ในช่วงทศวรรษปี 1920 นักวิทยาศาสตร์ได้พยายามใช้สัญญาณเหล่านี้เพื่อตรวจดูการทำงานของสมอง อย่างไรก็ตาม ต้องใช้เวลาวิจัยนานเกือบ 80 ปีจึงจะสามารถถอดรหัสการยิงสัญญาณของเซลล์ประสาทเพื่อสร้างภาพและการเคลื่อนไหวขึ้นมาใหม่ได้
ปัจจุบัน BCI ถือเป็นเทคโนโลยีใหม่ที่มีการใช้งานใน VR ระบบอัตโนมัติ การจัดการระบบ และภาคการแพทย์ โดยเฉพาะอย่างยิ่งภาคการแพทย์ได้เห็นการใช้เครื่องมือเหล่านี้เพื่อช่วยเหลือผู้ที่ประสบปัญหาด้านการเคลื่อนไหวหรือการสื่อสาร
ที่น่าสนใจคือ BCI รุ่นแรกๆ ช่วยให้ผู้ป่วยและคนที่รักสามารถสื่อสารกันได้ดีขึ้น ระบบในช่วงแรกๆ เหล่านี้ใช้จอแสดงผลข้อความในการสื่อสาร ต่อมาระบบข้อความได้รับการปรับปรุงให้สามารถอ่านคำต่างๆ ออกมาดังๆ เพื่อสร้างการตอบสนองด้วยเสียง แม้ว่าการตอบสนองด้วยเสียงจะมีประโยชน์ แต่ก็ขาดความรู้สึกเหมือนมนุษย์
ข้อจำกัดของระบบเสียง BCI แบบดั้งเดิม
มีปัจจัยจำกัดหลายประการที่ขัดขวางความสำเร็จของ BCI จนถึงปัจจุบัน ประการหนึ่งคือ วิธีการสื่อสารด้วยข้อความไม่เป็นธรรมชาติ ไม่คล่องตัว และเวลาไม่ตรงกันเมื่อเทียบกับการพูดคุยกับบุคคลอื่น
เวลาตอบสนองที่ล่าช้าของฟีเจอร์การพูดและเสียงหุ่นยนต์ยังทำให้ผู้ใช้รู้สึกไม่สบายใจเมื่อต้องสนทนากับเพื่อนตามปกติอีกด้วย ฟีเจอร์สำคัญๆ เช่น ความสามารถในการได้ยินเสียงตัวเอง แทรกแซง หรือแม้แต่พูดคำออกมานั้นไม่มีอยู่ในแนวทางนี้
การศึกษาจากสมองสู่เสียง
โชคดีที่ทีมนักวิทยาศาสตร์อาจค้นพบวิธีแก้ปัญหาเหล่านี้ได้หลังจากการวิจัยมานานหลายทศวรรษ “ประสาทเทียมสังเคราะห์เสียงทันที" ศึกษา1 นำเสนออุปกรณ์เทียมประสาทที่แปลงสมองเป็นเสียงแบบใหม่ที่สามารถแปลงกิจกรรมของสมองเป็นคำพูดได้ในทันที แม้ว่าจะยังอยู่ในช่วงเริ่มต้น แต่ก็มีศักยภาพที่จะปรับปรุงชีวิตของผู้คนนับล้านทั่วโลก
อุปกรณ์ดังกล่าวช่วยให้ผู้ใช้สามารถ "พูด" ผ่านคอมพิวเตอร์ได้เช่นเดียวกับอุปกรณ์รุ่นก่อนๆ อย่างไรก็ตาม วิธีนี้ใช้เซ็นเซอร์ที่ฝังไว้ทางศัลยกรรมในบริเวณโบรคาและเวอร์นิเก้ของสมอง ซึ่งเป็นบริเวณของสมองที่ทำหน้าที่ผลิตคำพูด

แหล่งที่มา - มหาวิทยาลัยแห่งแคลิฟอร์เนีย
โดยเฉพาะอย่างยิ่ง อาร์เรย์ไมโครอิเล็กโทรดสี่ชุดที่มีไมโครอิเล็กโทรด 256 ชุดทำให้วิศวกรสามารถจับคู่กิจกรรมของระบบประสาทกับเสียงที่ต้องการได้ โดยเฉพาะอย่างยิ่ง ระบบสามารถถอดรหัสคุณลักษณะพาราลิงกวิสติกส์ได้ด้วยการถอดรหัสกิจกรรมภายในคอร์เทกซ์ด้วยความล่าช้าน้อยกว่าหนึ่งวินาที
อัลกอริทึม AI ที่ใช้ในระบบ Brain-to-Voice
วิศวกรใช้ข้อมูลที่รวบรวมจากผู้เข้ารับการทดสอบเพื่อสร้างชุดข้อมูลสำหรับอัลกอริทึม AI ที่เป็นกรรมสิทธิ์ของตน ผู้เข้ารับการทดสอบได้รับการแสดงประโยคที่พวกเขาพยายามอ่านออกเสียง ขั้นตอนนี้ทำให้ทีมงานสามารถระบุกิจกรรมของระบบประสาทและใช้ข้อมูลดังกล่าวเพื่อสร้างวงจรปิดสำหรับการสังเคราะห์เสียง
ที่น่าประทับใจคือ อัลกอริทึมสามารถรับรู้ได้ว่าเมื่อใดที่บุคคลกำลังพยายามพูด และแปลงกิจกรรมทางประสาทของบุคคลนั้นให้เป็นพยางค์โดยอัตโนมัติโดยไม่ต้องเคลื่อนไหวใดๆ การแปลงนี้เกิดขึ้นได้อย่างราบรื่น ทำให้มีความคล้ายคลึงกับจังหวะของการสนทนาแบบดั้งเดิมมาก
นอกจากนี้ ระบบเสียงตอบรับแบบวงจรปิดยังช่วยให้โปรโตคอลสามารถสังเคราะห์เสียงของผู้ใช้ได้ ทำให้ผู้ใช้ได้ยินเสียงพูดเหมือนกับการสนทนาจริง ระบบจะสังเคราะห์รูปแบบเสียงเหล่านี้ ทำให้สามารถควบคุมจังหวะและจังหวะเวลาของผู้ป่วยได้อย่างเต็มที่
ทดสอบสมองกับเสียง
ขั้นตอนการทดสอบของการทดลองดังกล่าวเริ่มต้นด้วยการค้นหาผู้ป่วยที่เหมาะสม ทีมวิจัยได้ค้นหาชายคนหนึ่งที่ป่วยเป็นโรค ALS (amyotrophic lateral sclerosis) หรือที่เรียกกันในชื่อโรค Lou Gehrig ในสหรัฐอเมริกา โรคร้ายแรงนี้ทำให้เกิดการเสื่อมของเส้นประสาทที่เกิดขึ้นบริเวณไขสันหลังและสมอง ผู้ที่ป่วยเป็นโรค ALS อาจสูญเสียความสามารถในการพูดอย่างถูกต้อง เนื่องจากไม่สามารถควบคุมกล้ามเนื้อใบหน้าได้
ผู้ป่วยที่ได้รับการคัดเลือกให้เข้ารับการศึกษามีอาการ ALS และมีอาการพูดไม่ชัดอย่างรุนแรง หลังจากฝังเซ็นเซอร์และตั้งโปรแกรมอัลกอริทึม AI แล้ว ผู้ป่วยจะถูกขอให้อ่านประโยคออกเสียง เทคนิคนี้ทำให้วิศวกรสามารถลงทะเบียนกิจกรรมของสมองได้
เมื่อปรับเทียบแล้ว ต้นแบบจะสังเคราะห์เสียงของผู้ป่วยทันที ช่วยให้ผู้ป่วยสามารถสื่อสารได้แบบเรียลไทม์ ผู้ป่วยยังสามารถสื่อสารกับครอบครัว เปลี่ยนน้ำเสียงระหว่างสนทนาเพื่อเน้นย้ำประเด็นต่างๆ ของผู้ป่วยได้ ที่น่าประทับใจคือผู้ป่วยสามารถร้องเพลงสั้นๆ ได้ด้วย
ผลการทดสอบสมองเป็นเสียง
ผลการทดสอบแสดงให้เห็นว่าระบบสมองต่อเสียงมีประสิทธิภาพ โดยสามารถสังเคราะห์รูปแบบเสียงและการพูดของผู้ป่วยได้อย่างแม่นยำ โดยเฉพาะอย่างยิ่ง ระบบดังกล่าวมีความแม่นยำถึง 60% เมื่อเทียบกับ 4% เมื่อไม่ได้ใช้เครื่อง
วิศวกรสังเกตว่าผู้ป่วยสามารถปรับเปลี่ยนและปรับเสียงที่สังเคราะห์โดย BCI ได้แบบเรียลไทม์ พวกเขาบันทึกกระบวนการที่เสร็จสิ้นภายใน 1/14 วินาที ซึ่งใกล้เคียงกับเวลาหน่วงของการสนทนาปกติ พวกเขายังบันทึกกรณีที่ผู้ป่วยปรับเปลี่ยนเสียงเพื่อแสดงว่าตนได้ถามคำถาม
ที่น่าสนใจคือ เทคโนโลยีไม่ได้จำกัดอยู่แค่คำศัพท์ปัจจุบันของผู้ป่วยเท่านั้น ทีมวิจัยได้บันทึกตัวอย่างหลายกรณีที่ผู้ป่วยได้รับการสอนคำศัพท์ใหม่และระบบก็ออกเสียงคำศัพท์เหล่านั้นได้อย่างถูกต้อง ข้อมูลนี้แสดงให้เห็นถึงความสามารถของแนวทางนี้ในการจัดการกับความผิดปกติในการพูด
ประโยชน์ของสมองต่อเสียง
เทคโนโลยีแปลงเสียงจากสมองมาสู่ตลาดมีประโยชน์มากมาย ประการหนึ่งคือ เป็นวิธีการที่เชื่อถือได้และเป็นธรรมชาติสำหรับผู้ที่เป็นอัมพาตและมีอาการป่วยอื่นๆ ที่ส่งผลต่อชีวิต เพื่อให้กลับมาใช้ชีวิตปกติได้อีกครั้ง
โปรโตคอลสามารถส่งการตอบสนองการพูดได้ในทันที ช่องเสียงดิจิทัลรองรับเสียงร้องที่เป็นเอกลักษณ์ของผู้ป่วยและสามารถตอบสนองได้โดยไม่มีความล่าช้าที่ตรวจจับได้ การตอบสนองได้รับการพิสูจน์แล้วว่าแม่นยำและสามารถสร้างได้โดยใช้ข้อมูลสัญญาณประสาทเท่านั้น
ยุคใหม่สำหรับผู้ป่วยที่มีความผิดปกติในการสื่อสาร
ประโยชน์ที่ใหญ่ที่สุดประการหนึ่งของเทคโนโลยีนี้คือช่วยให้ผู้ที่ประสบปัญหาด้านการสื่อสารสามารถแบ่งปันเรื่องราวของตนเองในรูปแบบที่เข้าถึงได้ เทคโนโลยีนี้จะช่วยให้ผู้ใช้อุปกรณ์ประสาทเทียมสามารถมีส่วนร่วมในการสนทนาและช่วยเหลือผู้อื่นที่ประสบปัญหาในลักษณะเดียวกันได้
การประยุกต์ใช้ในโลกแห่งความเป็นจริงและไทม์ไลน์สำหรับเทคโนโลยี Brain-to-Voice
มีแอปพลิเคชันมากมายสำหรับเทคโนโลยีคอมพิวเตอร์ที่เชื่อมต่อสมองกับคอมพิวเตอร์ในสำนักงาน คอมพิวเตอร์มีมานานแล้ว และแม้ว่าจะมีการปรับปรุงด้านเทคโนโลยีเกือบทั้งหมด เช่น กราฟิก การประมวลผล และฮาร์ดแวร์ที่ดีขึ้น แต่คีย์บอร์ดยังคงแทบไม่ได้รับการแตะต้องเลย
การนำอินเทอร์เฟซคอมพิวเตอร์และสมองสำหรับการทดลองที่เชื่อถือได้มาใช้ถือเป็นการเปลี่ยนแปลงที่สำคัญ เนื่องจากเป็นการเปิดทางให้เกิดการโต้ตอบที่ราบรื่นระหว่างมนุษย์กับคอมพิวเตอร์ ดังนั้น เทคโนโลยีนี้อาจเปิดประตูสู่การรักษาและเทคโนโลยีขั้นสูงมากขึ้น
ไทม์ไลน์จากสมองสู่เสียง
นักวิจัยยังไม่ได้กำหนดกรอบเวลาที่ชัดเจน อย่างไรก็ตาม เมื่อพิจารณาจากสภาพร่างกายของผู้ป่วยที่เป็นโรคเหล่านี้ เทคโนโลยีนี้อาจออกสู่ตลาดได้ในอีก 5-10 ปีข้างหน้า จำเป็นต้องมีการวิจัยเพิ่มเติมเกี่ยวกับผลกระทบในระยะยาวของการปลูกถ่ายอวัยวะเทียมก่อนที่จะได้รับการอนุมัติจากหน่วยงานกำกับดูแล
นักวิจัยจากสมองสู่เสียง
การศึกษาสมองกับเสียงนำโดยนักวิจัยจากมหาวิทยาลัยแคลิฟอร์เนีย โดยเฉพาะอย่างยิ่ง เอกสารดังกล่าวระบุรายชื่อผู้มีส่วนสนับสนุนหลักในโครงการ ได้แก่ Maitreyee Wairagkar, Nicholas S. Card, Tyler Singer-Clark, Xianda Hou, Carrina Iacobacci, Lee M. Miller, Leigh R. Hochberg, David M. Brandman และ Sergey D. Stavisky
อนาคตของสมองสู่เสียง
ตามที่วิศวกรกล่าว ยังคงมีงานอีกมากที่ต้องทำในระบบแปลงสมองเป็นเสียง พวกเขาหวังว่าจะขยายการทดสอบให้ครอบคลุมผู้ป่วยมากขึ้นในอีกไม่กี่เดือนข้างหน้า พวกเขาต้องการรวมผู้ป่วยที่ทุกข์ทรมานจากความผิดปกติต่างๆ มากมายด้วย ผู้ที่ต้องการเข้าร่วมการศึกษาสามารถติดต่อได้ [ป้องกันอีเมล] เพื่อดูว่าพวกเขาผ่านคุณสมบัติหรือไม่
การลงทุนในภาคส่วน AI ด้านการดูแลสุขภาพ
ประเทศที่ใช้ปัญญาประดิษฐ์มีบทบาทที่ขยายตัวมากขึ้นในด้านการดูแลสุขภาพและการรักษา ระบบนี้สามารถช่วยให้ผู้ให้บริการด้านการดูแลสุขภาพระบุอาการเจ็บป่วยได้เร็วขึ้น รักษาโรคได้อย่างมีประสิทธิภาพมากขึ้น และแม้แต่ค้นพบสาเหตุหลักของความผิดปกติที่เกิดจากความเครียด ปัจจุบัน มีผู้เล่นหลายรายในวงการการดูแลสุขภาพที่ใช้ปัญญาประดิษฐ์ นี่คือบริษัทหนึ่งที่สามารถสร้างช่องทางในตลาดได้สำเร็จ
บริษัท SoundHound AI จำกัด
SoundHound AI จากเมืองซานตาคลารา รัฐแคลิฟอร์เนีย (ซุน -3.5%) มีการเดินทางที่น่าสนใจตั้งแต่เปิดตัวในฐานะแอประบุเพลง Midomi จนกระทั่งกลายมาเป็นหนึ่งในชื่อที่ได้รับการยอมรับมากที่สุดในด้านอินเทอร์เฟซสนทนาแบบ AI
การเดินทางของบริษัทเริ่มต้นขึ้นในปี 2005 หลังจากที่ Keyvan Mohajer เริ่มทำงานกับโปรโตคอลการจดจำเสียงขั้นสูง ในปี 2015 บริษัทได้เปลี่ยนชื่อเป็น SoundHound และเปลี่ยนโฟกัสไปที่แพลตฟอร์ม AI เสียงที่เป็นกรรมสิทธิ์ของบริษัท
บริษัท SoundHound AI จำกัด (ซุน -3.5%)
โปรโตคอลนี้ขยายขีดความสามารถในการจดจำเสียงพูดของ AI และได้รับการออกแบบโดยใช้เทคโนโลยี Deep Meaning Understanding ปัจจุบัน SoundHound เป็นผู้ให้บริการระบบวิเคราะห์เสียงพูดของ AI ชั้นนำที่ถือครองสิทธิบัตรมากกว่า 250 ฉบับและรองรับภาษาต่างประเทศได้มากกว่า 20 ภาษา
ข่าวและความคืบหน้าล่าสุดของหุ้น SoundHound AI (SOUN)
3 หุ้นปัญญาประดิษฐ์ (AI) ร้อนแรงที่อาจร่วงลงถึง 72% ตามคำกล่าวของนักวิเคราะห์วอลล์สตรีท
หุ้น AI ตัวไหน CoreWeave หรือ SoundHound น่าซื้อกว่ากัน?
การเติบโตทั่วโลกของ SoundHound AI สามารถทำให้มันเป็น AI ระดับยักษ์ใหญ่ได้หรือไม่?
นักวิเคราะห์กล่าวว่าอย่าคาดหวังอะไรมากจากหุ้น SoundHound ในช่วงครึ่งหลังของปี 2025
หุ้นปัญญาประดิษฐ์ที่ดีกว่า: SoundHound AI เทียบกับ Nvidia
หุ้น Growth 1 ตัวลดลง 45% ควรซื้อทันที
เทคโนโลยี Brain-to-Voice – อนาคตที่ไร้รอยต่อ
เมื่อคุณพิจารณาข้อได้เปรียบทางเทคโนโลยีที่การศึกษา Brain-to-voice นำเสนอสู่ตลาด คุณจะเข้าใจได้ง่ายว่าทำไมจึงมีหลายคนที่มองว่าการศึกษานี้เป็นก้าวสำคัญในภาคส่วนการแพทย์ ในอนาคต คุณอาจควบคุมหุ่นยนต์ ยานพาหนะ และส่วนสำคัญอื่นๆ ในชีวิตของคุณโดยใช้ BCI
การศึกษาล่าสุดนี้เน้นย้ำว่าเทคโนโลยีนี้สามารถปรับปรุงชีวิตของคนจำนวนมากได้อย่างไร ดังนั้น นักวิจัยจึงสมควรได้รับการปรบมือให้กับความพยายามของพวกเขา
เรียนรู้เกี่ยวกับความก้าวหน้าทางการดูแลสุขภาพที่น่าสนใจอื่น ๆ Good Farm Animal Welfare Awards.
การศึกษาที่อ้างอิง:
1. ไวรากการ์, เอ็ม., การ์ด, เอ็นเอส, ซิงเกอร์-คลาร์ก, ที. เอตอัล อุปกรณ์ประสาทเทียมที่สังเคราะห์เสียงได้ทันที ธรรมชาติ (2025). https://doi.org/10.1038/s41586-025-09127-3