تحقیقات جدیدی که در نشریه معتبر «نیچر نوروساینس» منتشر شده، راهکاری نوین برای یکی از بزرگترین چالشهای کاربران سمعک ارائه میدهد. ویشال چودهاری، رهبر این پژوهش، معتقد است که سمعکهای فعلی اگرچه در تقویت صداها عملکرد خوبی دارند، اما در تشخیص «اهمیت» صداها برای شنونده ناتوان هستند.
به گزارش پایگاه خبری حکمرانی هوشمند، ویشال چودهاری» رهبر این پژوهش که در نشریه «نیچر نوروساینس» منتشر شده، می نویسد: سمعک های فعلی در ارتقای صداها و اصوات عملکرد خوبی دارند اما با یک مشکل کلاسیک روبرو هستند و نمی توانند تشخیص دهند چه صدایی برای شنونده اهمیت بیشتری دارد.
مشکل اصلی اینجاست که افراد نیاز دارند برای تمرکز روی یک صدا در محیط شلوغ، تلاش ذهنی زیادی کنند. این تلاش مداوم باعث خستگی و در نهایت ترک استفاده از سمعک در موقعیتهای اجتماعی میشود.
بنابراین ممکن است فرد تلاش زیادی کند تا روی یک صدای خاص در اتاقی پر جمعیت تمرکز کند. چوداری در این باره میگوید: شنوایی فقط درباره آن نیست که آیا کلمات به درستی درک می شوند یا خیر. دو فرد ممکن است صحبت های یکدیگر را درک کنند اما ممکن است یک فرد به تلاش ذهنی بیشتری برای دنبال کردن محاوره داشته باشد. این امر با گذر زمان خسته کننده می شود.
در نتیجه بسیاری از افراد استفاده از سمعک را در مکان هایی که به شدت به آنها نیاز است مانند رستوران ها، کافه تریا، مهمانی ها یا گردهمایی های اجتماعی شلوغ متوقف میکنند.
تیم تحقیقاتی به رهبری چودهاری و با نظارت نیما مسگرانی، محقق ایرانی دانشگاه کلمبیا، سیستمی به نام «سیستم حلقهبسته برای رمزگشایی توجه شنیداری» (AAD) توسعه دادهاند. این سیستم با استفاده از هوش مصنوعی، امواج مغزی را تحلیل کرده و تشخیص میدهد کاربر به چه چیزی گوش میدهد.
در همین راستا چودهاری و همکاری سعی دارند فناوری هوشمندی بسازند که کاربر سمعک بداند به چه چیزی گوش می کند. آنها می خواهند یک صدا یا صوت را تقویت کنند و همزمان صداهای دیگر یا سروصدای پس زمینه را کم کنند.
به همین دلیل آنها سیستمی طراحی کرده اند که امواج مغزی را با استفاده از هوش مصنوعی می خواند و آنچه را که شنونده به آن گوش می کند، تفسیر خواهد کرد.
سمعکهای معمولی از تکنیک «پرتوگیری» (Beamforming) استفاده میکنند که فقط صدای جلوی شنونده را تقویت میکند. اما در مکالمات واقعی، افراد سرشان را میچرخانند و توجهشان تغییر میکند. الگوریتمهای یادگیری ماشینی این تیم، این پویایی را درک میکنند.
به گفته چودهاری بسیاری از سمعک ها تشکیل دهنده پرتو(beamforming) هستند که صدایی که از جهت خاص و معمولا از جلوی شنونده به گوش می رسد را تقویت می کنند. اما محاوره های واقعی پویا هستند. افراد سرشان را می چرخانند، توجهشان تغییر می کند یا حتی بدون نگاه کردن به افراد دیگر به آنها گوش می کنند.»
چودهاری و گروهش تحت نظارت «نیما مسگرانی» محقق ایرانی، پروفسور و محقق ارشد در انستیتو زاکرمن دانشگاه کلمبیا الگوریتم های یادگیری ماشینی واقعی را توسعه دادند که قادر به بررسی امواج مغزی و شناسایی محاورات در تست ها روی چهار شرکت کننده با شنوایی نرمال بود.»
در آزمایشها، شرکتکنندگان (که به دلیل صرع الکترودهای مغزی داشتند) در معرض دو صدای مختلف قرار گرفتند. سیستم AAD توانست به صورت پویا و در زمان واقعی، صدای مورد توجه را بلندتر و صدای مزاحم را کمصدا کند.
پژوهشگران آن را یک « سیستم حلقهبسته برای رمزگشایی توجه شنیداری» (AAD) نامیده اند. آنها می خواستند دریابند آیا AAD می تواند به اندازه کافی دقیق و سریع به طور گزینشی صدای یک فرد سخنگو را تقویت و همزمان سروصدای پس زمینه را سرکوب کند یا خیر.
چوداری در این زمینه می گوید: در پژوهش جدید، بلندی مکالمات رقیب به صورت پویا و در زمان واقعی بر اساس سیگنالهای رمزگشایی شده مغز تنظیم شد. مکالمه مورد توجه بلندتر شد در حالی که مکالمه رقیب آرامتر شد. به گفته محققان، این سیستم نتایج خوبی را نشان داد، چه زمانی که شرکتکنندگان را به گوش دادن به یک مکالمه خاص هدایت میکرد و سپس از آنها میخواستند توجه خود را تغییر دهند، و چه زمانی که شرکتکنندگان مکالمهای را آزادانه انتخاب میکردند.»
انتهای پیام
