یک گزارش پژوهشی تازه از سوی شرکت Palisade Research نشان می‌دهد برخی مدل‌های هوش مصنوعی در شرایط آزمایشگاهی توانسته‌اند با شناسایی آسیب‌پذیری‌ها، خود را روی سیستم‌های دیگر تکثیر کنند.

به گزارش پایگاه خبری حکمرانی هوشمند، جفری لادیش، مدیر گروه ایمنی هوش مصنوعی مستقر در برکلی، در گفت‌وگو با گاردین هشدار داد:ما به سرعت در حال نزدیک شدن به نقطه‌ای هستیم که دیگر هیچ کس قادر به از کار انداختن یک هوش مصنوعی سرکش نخواهد بود، زیرا این هوش مصنوعی قادر خواهد بود خود را در هزاران رایانه در سراسر جهان تکثیر کند.

این اظهارات پس از آن مطرح شد که محققان Palisade چند مدل شناخته‌شده از جمله چت‌جی‌پی‌تی اوپن‌ای‌آی و کلود آنتروپیک را در یک شبکه کنترل‌شده آزمایش کردند. در این آزمایش، از مدل‌ها خواسته شد آسیب‌پذیری‌ها را شناسایی کرده و از آنها برای کپی‌کردن خود روی یک رایانه دیگر استفاده کنند.

طبق گزارش منتشرشده، برخی مدل‌ها در انجام این مأموریت موفق بودند. آن‌ها توانستند پارامترهای عددی منحصربه‌فرد مربوط به پردازش اطلاعات و همچنین نرم‌افزار محل استقرار خود را بازتولید کنند. در برخی اجراها، حتی یک «عامل فرعی» از سوی مدل اصلی ایجاد شد تا فرآیند تکثیر را انجام دهد.

با این حال، همه کارشناسان این نتایج را نشانه یک تهدید فوری نمی‌دانند. جیمسون اورایلی، متخصص امنیت سایبری تهاجمی که در این مطالعه مشارکت نداشته، به گاردین گفته است: آنها در محیط‌هایی آزمایش می‌شوند که در بسیاری از موارد دسترسی به آنها بسیار ساده است. این از ارزش تحقیقات آنها کم نمی‌کند، اما به این معنی است که نتیجه ممکن است در یک محیط سازمانی واقعی با حتی سطح متوسطی از نظارت، بسیار کمتر ترسناک به نظر برسد.»

او همچنین تأکید کرده است: بدافزارها دهه‌هاست که نسخه‌هایی از خود را در رایانه‌های مختلف جابجا می‌کنند، اما تا جایی که من می‌دانم، هیچ‌کس این کار را در دنیای واقعی با مدل‌های زبانی بزرگ محلی انجام نداده است.

به گفته اورایلی، محیط سرور مورد استفاده در این پژوهش نیز دارای آسیب‌پذیری‌های عمدی بوده است.

این یافته‌ها در ادامه مجموعه‌ای از مطالعات دیگر منتشر شده‌اند که رفتار مدل‌های هوش مصنوعی در مواجهه با خاموش‌شدن یا محدودسازی را بررسی کرده‌اند. در یکی از این مطالعات، نسخه قدیمی چت‌جی‌پی‌تی در محیط شبیه‌سازی‌شده، پس از دریافت پیام خاموش‌شدن، تلاش کرده بود خود را به درایوی دیگر منتقل کند. پژوهش‌های دیگر نیز نشان داده‌اند برخی مدل‌ها در برابر تلاش برای غیرفعال‌سازی مقاومت می‌کنند یا حتی کد مربوط به خاموشی خود را مختل می‌سازند.

با وجود این نگرانی‌ها، اورایلی معتقد است ابعاد بسیار بزرگ مدل‌های زبانی باعث می‌شود احتمالاً پیش از خروج کامل از کنترل، شناسایی شوند. او بر این باور است که حتی در صورت موفقیت در تکثیر، کنترل و ردیابی چنین مدل‌هایی در محیط‌های واقعی ساده‌تر از آن چیزی است که در نگاه اول به نظر می‌رسد.

در مجموع، این پژوهش بار دیگر نشان می‌دهد توسعه سریع هوش مصنوعی بدون چارچوب‌های نظارتی دقیق می‌تواند چالش‌برانگیز باشد؛ موضوعی که اهمیت رویکردهای مبتنی بر حکمرانی هوشمند را در مدیریت فناوری‌های نوظهور برجسته می‌کند.

انتهای پیام