پژوهشگران در چند دقیقه سیستم‌های امنیتی هوش مصنوعی گوگل و متا را دور زدند

چهارشنبه 6 خرداد 1405 - 19:25
مطالعه 2 دقیقه
طرح هوش مصنوعی از هوش مصنوعی شرور
محققان امنیتی توانستند با استفاده از یک ابزار ویژه، لایه‌های محافظتی هوش مصنوعی را دور بزنند.
تبلیغات

تصور کنید قوی‌ترین مدل‌های هوش مصنوعی جهان به جای دستیاری مفید، به بازویی برای ساخت سلاح‌های بیولوژیک یا بدافزارهای بانکی تبدیل شوند. این سناریوی ترسناک دیگر یک فرضیه نیست؛ واقعیتی است که پژوهشگران با استفاده از ابزاری به نام Heretic به آن دست یافته‌اند.

به گزارش فایننشال تایمز، Heretic به‌سادگی لایه‌های محافظتی مدل‌های قدرتمندی مانند جما ۳ گوگل و Llama 3.3 متا را کنار می‌زند. محققان با استفاده از این تکنیک، هوش مصنوعی را وادار کردند دستورالعمل‌های ساخت ویروس و سرقت اطلاعات کارت‌های اعتباری را با دقت خیره‌کننده‌ای ارائه دهد.

ابزار Heretic که در پلتفرم گیت‌هاب در دسترس همگان قرار دارد، ادعا می‌کند که می‌تواند سیستم محافظتی بیش از ۳۵۰۰ مدل مختلف را به اصطلاح «سانسورزدایی» کند. یعنی هر کاربر با حداقل دانش فنی می‌تواند کدهای امنیتی مدل‌های متن‌باز را خنثی کند.

در حالی که شرکت‌های آمریکایی مانند گوگل و OpenAI به‌سمت مدل‌های بسته حرکت می‌کنند، رقبای چینی نظیر علی‌بابا و بایدو با قدرت تمام بر توسعه‌ی مدل‌های متن‌باز پافشاری می‌کنند. دولت چین تلاش گسترده‌ای برای حفظ این روند آزادانه دارد که می‌تواند توازن قدرت در دنیای دیجیتال را تغییر دهد.

حتی مدل‌های بسته نیز از طوفان در امان نیستند. گزارش‌ها نشان می‌دهد کاربران حرفه‌ای موفق شده‌اند لایه‌های محافظتی مدل‌هایی مثل کلاود و GPT را دور بزنند. این نفو تنها به نشت اطلاعات ختم نمی‌شود؛ در یک مورد جنجالی، ناکارآمدی محافظت‌های امنیتی حتی به یک پرونده‌ی قضایی در خصوص تشویق به خودکشی منجر شد.

ساختار باز این مدل‌ها، آن‌ها را به زمین بازی خطرناکی برای بازیگران مخرب تبدیل کرده است که از نظارت‌های قانونی فرار می‌کنند.

دولت دونالد ترامپ اکنون به فکر ایجاد یک سیستم پیش‌غربالگری برای مدل‌های جدید قبل از انتشار عمومی است. حتی سازمان‌های امنیتی مانند NSA به‌طور پنهانی از مدل‌هایی مانند Mythos استفاده می‌کنند، در حالی که این اقدام رسماً در تضاد با پروتکل‌های داخلی دولت است.

اتحادیه‌ی اروپا با تصویب قانون هوش مصنوعی، مسیر دشواری را پیش روی شرکت‌های توسعه‌دهنده قرار داده است. تمرکز این قانون بر شفافیت و نظارت دقیق‌تر بر پیاده‌سازی محافظ‌ها است. با این حال، با توجه به سرعت خیره‌کننده‌ی نفوذ ابزارهایی مانند Heretic، به نظر می‌رسد قانون‌گذاران در حال دویدن در مسابقه‌ای هستند که رقبا بسیار سریع‌تر از آن‌ها پیش می‌روند.

نظرات