پژوهشگران در چند دقیقه سیستمهای امنیتی هوش مصنوعی گوگل و متا را دور زدند
تصور کنید قویترین مدلهای هوش مصنوعی جهان به جای دستیاری مفید، به بازویی برای ساخت سلاحهای بیولوژیک یا بدافزارهای بانکی تبدیل شوند. این سناریوی ترسناک دیگر یک فرضیه نیست؛ واقعیتی است که پژوهشگران با استفاده از ابزاری به نام Heretic به آن دست یافتهاند.
به گزارش فایننشال تایمز، Heretic بهسادگی لایههای محافظتی مدلهای قدرتمندی مانند جما ۳ گوگل و Llama 3.3 متا را کنار میزند. محققان با استفاده از این تکنیک، هوش مصنوعی را وادار کردند دستورالعملهای ساخت ویروس و سرقت اطلاعات کارتهای اعتباری را با دقت خیرهکنندهای ارائه دهد.
ابزار Heretic که در پلتفرم گیتهاب در دسترس همگان قرار دارد، ادعا میکند که میتواند سیستم محافظتی بیش از ۳۵۰۰ مدل مختلف را به اصطلاح «سانسورزدایی» کند. یعنی هر کاربر با حداقل دانش فنی میتواند کدهای امنیتی مدلهای متنباز را خنثی کند.
در حالی که شرکتهای آمریکایی مانند گوگل و OpenAI بهسمت مدلهای بسته حرکت میکنند، رقبای چینی نظیر علیبابا و بایدو با قدرت تمام بر توسعهی مدلهای متنباز پافشاری میکنند. دولت چین تلاش گستردهای برای حفظ این روند آزادانه دارد که میتواند توازن قدرت در دنیای دیجیتال را تغییر دهد.
حتی مدلهای بسته نیز از طوفان در امان نیستند. گزارشها نشان میدهد کاربران حرفهای موفق شدهاند لایههای محافظتی مدلهایی مثل کلاود و GPT را دور بزنند. این نفو تنها به نشت اطلاعات ختم نمیشود؛ در یک مورد جنجالی، ناکارآمدی محافظتهای امنیتی حتی به یک پروندهی قضایی در خصوص تشویق به خودکشی منجر شد.
ساختار باز این مدلها، آنها را به زمین بازی خطرناکی برای بازیگران مخرب تبدیل کرده است که از نظارتهای قانونی فرار میکنند.
دولت دونالد ترامپ اکنون به فکر ایجاد یک سیستم پیشغربالگری برای مدلهای جدید قبل از انتشار عمومی است. حتی سازمانهای امنیتی مانند NSA بهطور پنهانی از مدلهایی مانند Mythos استفاده میکنند، در حالی که این اقدام رسماً در تضاد با پروتکلهای داخلی دولت است.
اتحادیهی اروپا با تصویب قانون هوش مصنوعی، مسیر دشواری را پیش روی شرکتهای توسعهدهنده قرار داده است. تمرکز این قانون بر شفافیت و نظارت دقیقتر بر پیادهسازی محافظها است. با این حال، با توجه به سرعت خیرهکنندهی نفوذ ابزارهایی مانند Heretic، به نظر میرسد قانونگذاران در حال دویدن در مسابقهای هستند که رقبا بسیار سریعتر از آنها پیش میروند.