یک گزارش پژوهشی تازه از سوی شرکت Palisade Research نشان میدهد برخی مدلهای هوش مصنوعی در شرایط آزمایشگاهی توانستهاند با شناسایی آسیبپذیریها، خود را روی سیستمهای دیگر تکثیر کنند.
به گزارش پایگاه خبری حکمرانی هوشمند، جفری لادیش، مدیر گروه ایمنی هوش مصنوعی مستقر در برکلی، در گفتوگو با گاردین هشدار داد:ما به سرعت در حال نزدیک شدن به نقطهای هستیم که دیگر هیچ کس قادر به از کار انداختن یک هوش مصنوعی سرکش نخواهد بود، زیرا این هوش مصنوعی قادر خواهد بود خود را در هزاران رایانه در سراسر جهان تکثیر کند.
این اظهارات پس از آن مطرح شد که محققان Palisade چند مدل شناختهشده از جمله چتجیپیتی اوپنایآی و کلود آنتروپیک را در یک شبکه کنترلشده آزمایش کردند. در این آزمایش، از مدلها خواسته شد آسیبپذیریها را شناسایی کرده و از آنها برای کپیکردن خود روی یک رایانه دیگر استفاده کنند.
طبق گزارش منتشرشده، برخی مدلها در انجام این مأموریت موفق بودند. آنها توانستند پارامترهای عددی منحصربهفرد مربوط به پردازش اطلاعات و همچنین نرمافزار محل استقرار خود را بازتولید کنند. در برخی اجراها، حتی یک «عامل فرعی» از سوی مدل اصلی ایجاد شد تا فرآیند تکثیر را انجام دهد.
با این حال، همه کارشناسان این نتایج را نشانه یک تهدید فوری نمیدانند. جیمسون اورایلی، متخصص امنیت سایبری تهاجمی که در این مطالعه مشارکت نداشته، به گاردین گفته است: آنها در محیطهایی آزمایش میشوند که در بسیاری از موارد دسترسی به آنها بسیار ساده است. این از ارزش تحقیقات آنها کم نمیکند، اما به این معنی است که نتیجه ممکن است در یک محیط سازمانی واقعی با حتی سطح متوسطی از نظارت، بسیار کمتر ترسناک به نظر برسد.»
او همچنین تأکید کرده است: بدافزارها دهههاست که نسخههایی از خود را در رایانههای مختلف جابجا میکنند، اما تا جایی که من میدانم، هیچکس این کار را در دنیای واقعی با مدلهای زبانی بزرگ محلی انجام نداده است.
به گفته اورایلی، محیط سرور مورد استفاده در این پژوهش نیز دارای آسیبپذیریهای عمدی بوده است.
این یافتهها در ادامه مجموعهای از مطالعات دیگر منتشر شدهاند که رفتار مدلهای هوش مصنوعی در مواجهه با خاموششدن یا محدودسازی را بررسی کردهاند. در یکی از این مطالعات، نسخه قدیمی چتجیپیتی در محیط شبیهسازیشده، پس از دریافت پیام خاموششدن، تلاش کرده بود خود را به درایوی دیگر منتقل کند. پژوهشهای دیگر نیز نشان دادهاند برخی مدلها در برابر تلاش برای غیرفعالسازی مقاومت میکنند یا حتی کد مربوط به خاموشی خود را مختل میسازند.
با وجود این نگرانیها، اورایلی معتقد است ابعاد بسیار بزرگ مدلهای زبانی باعث میشود احتمالاً پیش از خروج کامل از کنترل، شناسایی شوند. او بر این باور است که حتی در صورت موفقیت در تکثیر، کنترل و ردیابی چنین مدلهایی در محیطهای واقعی سادهتر از آن چیزی است که در نگاه اول به نظر میرسد.
در مجموع، این پژوهش بار دیگر نشان میدهد توسعه سریع هوش مصنوعی بدون چارچوبهای نظارتی دقیق میتواند چالشبرانگیز باشد؛ موضوعی که اهمیت رویکردهای مبتنی بر حکمرانی هوشمند را در مدیریت فناوریهای نوظهور برجسته میکند.
انتهای پیام
