تحقیقات جدیدی که در نشریه معتبر «نیچر نوروساینس» منتشر شده، راهکاری نوین برای یکی از بزرگترین چالش‌های کاربران سمعک ارائه می‌دهد. ویشال چودهاری، رهبر این پژوهش، معتقد است که سمعک‌های فعلی اگرچه در تقویت صداها عملکرد خوبی دارند، اما در تشخیص «اهمیت» صداها برای شنونده ناتوان هستند.

به گزارش پایگاه خبری حکمرانی هوشمند، ویشال چودهاری» رهبر این پژوهش که در نشریه «نیچر نوروساینس» منتشر شده، می نویسد: سمعک های فعلی در ارتقای صداها و اصوات عملکرد خوبی دارند اما با یک مشکل کلاسیک روبرو هستند و نمی توانند تشخیص دهند چه صدایی برای شنونده اهمیت بیشتری دارد.

مشکل اصلی اینجاست که افراد نیاز دارند برای تمرکز روی یک صدا در محیط شلوغ، تلاش ذهنی زیادی کنند. این تلاش مداوم باعث خستگی و در نهایت ترک استفاده از سمعک در موقعیت‌های اجتماعی می‌شود.

بنابراین ممکن است فرد تلاش زیادی کند تا روی یک صدای خاص در اتاقی پر جمعیت تمرکز کند. چوداری در این باره میگوید: شنوایی فقط درباره آن نیست که آیا کلمات به درستی درک می شوند یا خیر. دو فرد ممکن است صحبت های یکدیگر را درک کنند اما ممکن است یک فرد به تلاش ذهنی بیشتری برای دنبال کردن محاوره داشته باشد. این امر با گذر زمان خسته کننده می شود.

در نتیجه بسیاری از افراد استفاده از سمعک را در مکان هایی که به شدت به آنها نیاز است مانند رستوران ها، کافه تریا، مهمانی ها یا گردهمایی های اجتماعی شلوغ متوقف می‌کنند.

تیم تحقیقاتی به رهبری چودهاری و با نظارت نیما مسگرانی، محقق ایرانی دانشگاه کلمبیا، سیستمی به نام «سیستم حلقه‌بسته برای رمزگشایی توجه شنیداری» (AAD) توسعه داده‌اند. این سیستم با استفاده از هوش مصنوعی، امواج مغزی را تحلیل کرده و تشخیص می‌دهد کاربر به چه چیزی گوش می‌دهد.

در همین راستا چودهاری و همکاری سعی دارند فناوری هوشمندی بسازند که کاربر سمعک بداند به چه چیزی گوش می کند. آنها می خواهند یک صدا یا صوت را تقویت کنند و همزمان صداهای دیگر یا سروصدای پس زمینه را کم کنند.

به همین دلیل آنها سیستمی طراحی کرده اند که امواج مغزی را با استفاده از هوش مصنوعی می خواند و آنچه را که شنونده به آن گوش می کند، تفسیر خواهد کرد.

سمعک‌های معمولی از تکنیک «پرتوگیری» (Beamforming) استفاده می‌کنند که فقط صدای جلوی شنونده را تقویت می‌کند. اما در مکالمات واقعی، افراد سرشان را می‌چرخانند و توجهشان تغییر می‌کند. الگوریتم‌های یادگیری ماشینی این تیم، این پویایی را درک می‌کنند.

به گفته چودهاری بسیاری از سمعک ها تشکیل دهنده پرتو(beamforming) هستند که صدایی که از جهت خاص و معمولا از جلوی شنونده به گوش می رسد را تقویت می کنند. اما محاوره های واقعی پویا هستند. افراد سرشان را می چرخانند، توجهشان تغییر می کند یا حتی بدون نگاه کردن به افراد دیگر به آنها گوش می کنند.»

چودهاری و گروهش تحت نظارت «نیما مسگرانی» محقق ایرانی، پروفسور و محقق ارشد در انستیتو زاکرمن دانشگاه کلمبیا الگوریتم های یادگیری ماشینی واقعی را توسعه دادند که قادر به بررسی امواج مغزی و شناسایی محاورات در تست ها روی چهار شرکت کننده با شنوایی نرمال بود.»

در آزمایش‌ها، شرکت‌کنندگان (که به دلیل صرع الکترودهای مغزی داشتند) در معرض دو صدای مختلف قرار گرفتند. سیستم AAD توانست به صورت پویا و در زمان واقعی، صدای مورد توجه را بلندتر و صدای مزاحم را کم‌صدا کند.

پژوهشگران آن را یک « سیستم حلقه‌بسته برای رمزگشایی توجه شنیداری» (AAD) نامیده اند. آنها می خواستند دریابند آیا AAD می تواند به اندازه کافی دقیق و سریع به طور گزینشی صدای یک فرد سخنگو را تقویت و همزمان سروصدای پس زمینه را سرکوب کند یا خیر.

چوداری در این زمینه می گوید: در پژوهش جدید، بلندی مکالمات رقیب به صورت پویا و در زمان واقعی بر اساس سیگنال‌های رمزگشایی شده مغز تنظیم شد. مکالمه مورد توجه بلندتر شد در حالی که مکالمه رقیب آرام‌تر شد. به گفته محققان، این سیستم نتایج خوبی را نشان داد، چه زمانی که شرکت‌کنندگان را به گوش دادن به یک مکالمه خاص هدایت می‌کرد و سپس از آنها می‌خواستند توجه خود را تغییر دهند، و چه زمانی که شرکت‌کنندگان مکالمه‌ای را آزادانه انتخاب می‌کردند.»

انتهای پیام