محققان دانشگاه علوم و فناوری پوهانگ (POSTECH) موفق به توسعه یک فناوری پوشیدنی پیشرفته شده‌اند که می‌تواند گفتار خاموش را تنها با تحلیل حرکات بسیار ظریف عضلات گردن، به صدای قابل شنیدن تبدیل کند.

این پروژه که به سرپرستی پروفسور سونگ-مین پارک و دکتر سونگوک هونگ انجام شده، به‌عنوان «گامی مهم در ارتباط انسان و ماشین» توصیف شده است.

در این فناوری، نقطه شروع یک مشاهده ساده اما قدرتمند است: گفتار فقط به تولید صدا محدود نمی‌شود. هنگامی که فرد صحبت می‌کند یا حتی تلاش می‌کند بی‌صدا حرف بزند، «حرکات ریزی در عضلات و پوست اطراف گردن» او شکل می‌گیرد؛ حرکاتی که نوعی «نقشه نامرئی» از گفتار مورد نظر را می‌سازند.

برای ثبت این نقشه، تیم تحقیقاتی یک دستگاه پوشیدنی به نام «حسگر نقشه‌برداری کرنش چندمحوری» طراحی کرده است. این سیستم، «یک دوربین مینیاتوری را با سیلیکون انعطاف‌پذیر تعبیه شده با نشانگرهای مرجع ترکیب می‌کند» و به این ترتیب «حتی کوچک‌ترین تغییر شکل‌های پوست» را تشخیص می‌دهد. این حسگر سبک و انعطاف‌پذیر، برای استفاده روزمره طراحی شده و «می‌تواند به راحتی روی گردن قرار گیرد و هنگام تغییر موقعیت به طور خودکار دوباره کالیبره شود.»

داده‌های دریافتی از پوست گردن، در مرحله بعد با استفاده از هوش مصنوعی پردازش می‌شوند. الگوریتم‌ها «الگوهای کرنش را تفسیر کرده و کلمات یا جملات مورد نظر را بازسازی می‌کنند.» با اتصال این سیستم به یک موتور سنتز صدا که «بر اساس پروفایل صوتی کاربر آموزش داده شده است»، خروجی نهایی، گفتاری است که «بسیار شبیه صدای طبیعی فرد» به گوش می‌رسد؛ حتی در حالتی که «هیچ صدایی تولید نمی‌شود.»

در مقایسه با روش‌های سنتی بازیابی گفتار – مثل الکترومیوگرافی (EMG) یا الکتروانسفالوگرافی (EEG) – که «اغلب به تجهیزات حجیم نیاز دارند و می‌توانند برای استفاده طولانی‌مدت ناراحت‌کننده باشند»، رویکرد جدید POSTECH یک جایگزین سبک و پوشیدنی ارائه می‌دهد. در آزمایش‌های انجام‌شده، این سامانه «دقت بالایی را در بازسازی گفتار، حتی در محیط‌های پر سر و صدا مانند محیط‌های صنعتی که میکروفون‌های معمولی در آن با مشکل مواجه هستند، نشان داد.»

پیامدهای این فناوری فراتر از یک نوآوری آزمایشگاهی است. این سیستم می‌تواند «یک مسیر ارتباطی جدید برای بیمارانی که به دلیل آسیب تارهای صوتی یا جراحی حنجره صدای خود را از دست داده‌اند، فراهم کند» و این امکان را بدهد که آنها «دوباره با استفاده از پروفایل صوتی خود صحبت کنند.»

در عین حال، کاربرد آن فقط به مراقبت‌های بهداشتی محدود نیست؛ این فناوری می‌تواند ارتباط خاموش را در فضاهایی که صحبت کردن با صدای بلند دشوار یا نامطلوب است – مانند «کتابخانه‌ها، جلسات یا محیط‌های کاری پر سر و صدا» – امکان‌پذیر کند. چنین قابلیتی، دری تازه به سوی رابط‌های طبیعی‌تر میان انسان و هوش مصنوعی می‌گشاید؛ جایی که «می‌توان قصد و نیت را بدون تولید صدا به گفتار تبدیل کرد.

محققان POSTECH اعلام کرده‌اند که قصد دارند این فناوری را برای «استقرار گسترده‌تر در دنیای واقعی، بهبود دقت و گسترش قابلیت‌های زبانی» ارتقا دهند. به گفته آنها، نسخه‌های آینده می‌تواند «به طور یکپارچه‌تری با دستگاه‌های مصرفی ادغام شود» و بالقوه «نحوه ارتباط افراد را در محیط‌های شخصی و حرفه‌ای متحول کند.»

تیم پژوهشی معتقد است با تداوم ادغام هوش مصنوعی در این نوع فناوری‌های پوشیدنی، شاهد «تغییر به سمت اشکال تعاملی شهودی‌تر و نامحسوس‌تر» خواهیم بود؛ «جایی که حتی کلمات ناگفته نیز بالاخره قابل شنیدن هستند.»

انتهای پیام