موضوعات: مهندسی پزشکی، مغز، اعضای مصنوعی، Duke University
تاریخ انتشار: 8 ژانویه 2024
یک دستگاه مصنوعی، ایمپلنت مغزی، سیگنالهای مرکز گفتار مغز را رمزگشایی میکند و چیزی که فرد میخواهد بگوید را پیش بینی می کند.
تیمی متشکل از دانشمندان علوم اعصاب، جراحان مغز و اعصاب و مهندسان دانشگاه دوک یک پروتز گفتار ساخته اند که می تواند سیگنال های مغز را به کلمات گفتاری تبدیل کند.
این فناوری جدید که در مقاله ای تازه چاپ شده در ژورنال Nature Communications به تفصیل شرح داده شده است، امید را برای افراد مبتلا به اختلالات عصبی که به گفتار آسیب میرسانند، زنده میکند و آنها را قادر می سازد از طریق رابط مغز و رایانه با هم ارتباط برقرار کنند.
پرداختن به چالش های ارتباطی در اختلالات عصبی
گرگوری کوگان، دکترای نورولوژی در دانشگاه دوک و یکی از محققین اصلی در این پروژه، میگوید: «بیماران زیادی هستند که از اختلالات حرکتی ناتوانکننده مانند ALS (اسکلروز جانبی آمیوتروفیک) یا سندرم قفل شده (locked-in syndrome) رنج میبرند که میتواند توانایی صحبت کردن آنها را مختل کند، همچنین باید گفت که ابزارهای فعلی موجود برای برقراری ارتباط عموماً بسیار کند و دست و پا گیر هستند.
دستگاهی که اندازه یک تمبر است (قسمت نقطهدار درون نوار سفید) و ۱۲۸ حسگر میکروسکوپی را بستهبندی میکند که میتواند فعالیت سلولهای مغز را به آنچه که میخواهد گفته شود، ترجمه کند.
تصور کنید به یک کتاب صوتی با سرعت نصف گوش می دهید. این بهترین نرخ رمزگشایی گفتار موجود در حال حاضر است که در حدود 78 کلمه در دقیقه است. با این حال، مردم حدود 150 کلمه در دقیقه صحبت می کنند. تأخیر بین سرعت گفتار و کلمات رمزگشایی شده تا حدی به دلیل تعداد نسبتا کم حسگرهای فعالیت مغز است که میتوانند روی یک قطعه نازک کاغذ که در بالای سطح مغز قرار دارد، قرار داده شوند بنابراین حسگرهای کمتر اطلاعات کمتری را برای رمزگشایی فراهم میکنند.
تقویت رمزگشایی سیگنال مغز
برای بهبود محدودیتهای گذشته، کوگان با یکی از اعضای هیئت علمی موسسه دوک به اسم جاناتان ویونتی، که آزمایشگاه مهندسی زیست پزشکی او در ساخت حسگرهای مغزی با تعداد بالا، فوقالعاده نازک و انعطافپذیر تخصص دارد، همکاری کرد.
در مقایسه با پروتزهای گفتاری فعلی با 128 الکترود (سمت چپ)، مهندسان دوک دستگاه جدیدی را توسعه دادهاند که دوبرابر سنسورهای بیشتری را در فضای بسیار کوچکتر جای میدهد.
برای این پروژه، ویونتی و تیمش 256 حسگر مغز میکروسکوپی را روی یک قطعه پلاستیکی با درجه پزشکی و انعطاف پذیر که به اندازه یک تمبر بود، قرار دادند. نورونهایی که فقط مانند یک دانه شن از هم جدا میشوند، میتوانند الگوهای فعالیت بسیار متفاوتی در هنگام هماهنگی گفتار داشته باشند، بنابراین لازم است سیگنالها را از سلولهای مغزی همسایه تشخیص داده تا به پیشبینی دقیق درباره گفتار مورد نظر کمک شود.
آزمایشات بالینی و تحولات آینده
پس از ساخت ایمپلنت جدید، کوگان و ویونتی با چندین جراح مغز و اعصاب بیمارستان دانشگاه دوک، از جمله درک ساوتول، دکتر، ناندان لاد، دکترای تخصصی، و آلن فریدمن، دکتر، که به استخدام چهار بیمار کمک کردند، همکاری کردند. برای آزمایش ایمپلنت ها محققان نیاز داشتند که آنها را به طور موقت در بیمارانی که تحت عمل جراحی مغز به دلیل برخی بیماریهای دیگر مانند درمان بیماری پارکینسون یا برداشتن تومور قرار داشتند، قرار دهند. زمان برای کوگان و تیمش محدود بود تا دستگاه خود را در OR آزمایش کنند.
کوگان گفت: “من دوست دارم آن را با خدمه گودال نسکار مقایسه کنم.” ما نمیخواهیم زمان اضافهای به روند عملیات اضافه کنیم، بنابراین باید ظرف 15 دقیقه داخل و خارج میشدیم. به محض اینکه جراح و تیم پزشکی گفتند «برو!» ما با عجله وارد عمل شدیم و بیمار وظیفه را انجام داد.»
وظیفه ذکر شده در بالا یک فعالیت ساده گوش دادن و تکرار بود. شرکت کنندگان مجموعه ای از کلمات بی معنی مانند “ava”، “kug” یا “vip” را شنیدند و سپس هر کدام را با صدای بلند تکرار کردند. این دستگاه فعالیتهای قشر حرکتی گفتار هر بیمار را ثبت کرد، زیرا نزدیک به 100 ماهیچه را که لبها، زبان، فک و حنجره را حرکت میدهند، هماهنگ میکرد.
پس از آن، Suseendrakumar Duraivel، اولین نویسنده گزارش جدید و دانشجوی فارغ التحصیل مهندسی زیست پزشکی در دوک، دادههای عصبی و گفتاری را از مجموعه جراحی برداشت و آنها را به یک الگوریتم یادگیری ماشینی وارد کرد تا بر اساس ضبط فعالیت مغز ببیند چقدر میتواند با دقت صداهای ساخته شده را پیشبینی کند.
کومار دورایول، نامزد دکتری، آرایه رنگارنگی از دادههای امواج مغزی را تجزیه و تحلیل میکند. هر رنگ و خط منحصر به فرد فعالیت یکی از 256 حسگر را نشان می دهد که همه در از مغز بیمار در اتاق عمل ثبت شده است.
برای برخی از صداها، مانند /g/ در کلمه “gak”، رمزگشا در 84٪ مواقع زمانی که اولین صدا از یک رشته سه تایی یک کلمه بی معنی را تشکیل می داد، آن را به درستی دریافت کرد.
اما زمانیکه این حروف در وسط و به عنوان کلمه دوم و سوم قرار گرفتند دقت کاهش یافت. همچنین اگر شکل دو صدا شبیه به هم بودند، مانند /p/ و /b/، سیستم با مشکل مواجه می شد.
به طور کلی، رمزگشا در 40٪ موارد دقیق بود. ممکن است این یک نمره ساده یا حتی پایین در آزمون به نظر برسد، اما با توجه به اینکه شاهکارهای تکنیکی مشابه به ساعت ها یا روزها داده نیاز دارند، پس می توان گفت که نتیجه بسیار چشمگیر بود. با این حال، الگوریتم رمزگشایی گفتار Duraivel با تنها 90 ثانیه داده گفتاری از آزمون 15 دقیقه ای کار می کرد.
دورایول و مربیانش در مورد ساختن یک نسخه بی سیم از دستگاه با کمک مالی اخیر 2.4 میلیون دلاری از مؤسسه ملی بهداشت هیجان زده هستند. کوگان گفت: «ما اکنون در حال توسعه همان دستگاههای ضبط هستیم، اما بدون سیم. “شما می توانید در اطراف حرکت کنید، و مجبور نیستید به پریز برق متصل شوید، که واقعا میتواند هیجان انگیز باشد.” در حالی که کار آنها دلگرم کننده است، هنوز راه زیادی در پیش است تا پروتز گفتار ویونتی و کوگان به زودی وارد بازار شود.
ویونتی در مقاله اخیر مجله دوک در مورد این فناوری گفت: «ما در نقطهای هستیم که هنوز خیلی کندتر از گفتار طبیعی است، اما شما میتوانید مسیری را ببینید که ممکن است بتوانید به آن نقطه هم حتی برسید.»
برای مطالعه کامل این مقاله می تونید از لینک زیر استفاده کنید:
[…] مجله مهندسی پزشکی […]