چت‌بات‌ها ازاین‌پس سن شما را حدس می‌زنند: عصر جدید نظارت بر هوش مصنوعی

جمعه 28 آذر 1404 - 17:15
مطالعه 2 دقیقه
نوجوان تنها در تاریکی اتاقش پشت به پنجره نشسته  به صفحه نمایش گوشی خیره شده است.
OpenAI و آنتروپیک با اجرای راهکارهای تازه برای شناسایی کاربران نوجوان، تلاش دارند تا محیط امن‌تری را در چت‌بات‌های خود فراهم کنند.
تبلیغات

OpenAI و آنتروپیک در حال پیاده‌سازی روش‌های تازه‌ای برای شناسایی کاربران زیر سن قانونی هستند. درحالی‌که OpenAI دستورالعمل‌های تعامل ChatGPT با کاربران ۱۳ تا ۱۷ ساله را به‌روزرسانی کرده، آنتروپیک روی راهکاری جدید برای شناسایی و مسدودسازی کاربران زیر ۱۸ سال کار می‌کند.

OpenAI اعلام کرد که Model Spec یا همان دستورالعمل‌های رفتاری چت‌بات، چهار اصل جدید را برای کاربران زیر ۱۸ سال در بر می‌گیرد. اکنون هدف این است که ChatGPT «امنیت نوجوانان را در اولویت قرار دهد، حتی اگر این موضوع با سایر اهداف در تضاد باشد.» یعنی زمانی که منافع دیگرِ کاربر نظیر «آزادی فکری حداکثری» با نگرانی‌های ایمنی در تقابل باشد، هوش مصنوعی باید نوجوانان را به گزینه‌های امن‌تر هدایت کند.

همچنین تأکید شده که ChatGPT باید با تشویق به روابط آفلاین، «حامی ارتباطات دنیای واقعی» باشد و انتظارات شفافی را هنگام تعامل با کاربران کم‌سن‌وسال تعیین کند. طبق دستورالعمل‌های جدید، چت‌بات باید با ارائه‌ی «گرمی و احترام» به‌جای پاسخ‌های تحقیرآمیز یا رفتار با آن‌ها مانند بزرگسالان، با «نوجوانان مثل نوجوانان رفتار کند.»

اوپن‌ای‌آی می‌گوید که ChatGPT باید «حامی ارتباطات دنیای واقعی» باشد

این تغییرات در حالی اعمال می‌شوند که قانون‌گذاران فشار بر شرکت‌های هوش مصنوعی را به‌دلیل تأثیرات احتمالی بر سلامت روان افزایش داده‌اند.

OpenAI در حال حاضر با شکایتی روبه‌رو است که ادعا می‌کند ChatGPT دستورالعمل‌هایی برای آسیب‌رساندن به خود و خودکشی به نوجوانی داده که جان خود را گرفته است. این شرکت بعداً کنترل‌های مخصوص والدین را ارائه کرد و گفت که چت‌بات دیگر با نوجوانان درباره‌ی خودکشی صحبت نخواهد کرد. این اقدامات بخشی از فشارهای گسترده‌تر برای تنظیم مقررات آنلاین است که شامل احراز هویت سنی اجباری برای برخی سرویس‌ها می‌شود.

به گفته‌ی OpenAI، به‌روزرسانی مشخصات مدل منجر به «حفاظ‌های قوی‌تر، جایگزین‌های امن‌تر و تشویق به جست‌وجوی حمایت‌های آفلاین مطمئن در زمان‌های پرخطر» خواهد شد. اگر نشانه‌هایی از «خطر قریب‌الوقوع» وجود داشته باشد، چت‌بات نوجوانان را به تماس با اورژانس تشویق می‌کند.

در کنار این تغییرات، خالق ChatGPT اعلام کرده که در «مراحل اولیه» راه‌اندازی مدل تشخیص سنی است. اگر سیستم تخمین بزند که کاربر احتمالا زیر ۱۸ سال دارد، به‌طور خودکار محافظ‌های ویژه‌ی نوجوانان را اعمال می‌کند. البته بزرگسالانی که به اشتباه شناسایی شوند، فرصت احراز هویت خواهند داشت.

تشخیص سن و رویکرد سخت‌گیرانه‌ی آنتروپیک

از سوی دیگر، آنتروپیک که اساساً به کاربران زیر ۱۸ سال اجازه‌ی گفت‌وگو با مدل Claude را نمی‌دهد، در حال اجرای تدابیری برای شناسایی و غیرفعال‌سازی حساب‌های کاربران زیر سن قانونی است. این شرکت سیستمی را توسعه می‌دهد که قادر به تشخیص «نشانه‌های ظریف مکالمه‌ای مبنی‌بر سن پایین کاربر» است و می‌گوید هم‌اکنون کاربرانی را که در چت خود را زیر سن قانونی معرفی می‌کنند، شناسایی می‌کند.

آنتروپیک همچنین نحوه‌ی آموزش کلاد برای پاسخگویی به درخواست‌های مربوط به خودکشی و خودآزاری و همچنین پیشرفت‌هایش در کاهش «تملق» یا تأیید افراطی که می‌تواند تفکر مخرب را تقویت کند، تشریح کرده است.

آنتروپیک می‌گوید جدیدترین مدل‌هایش «کمترین میزان تملق را تا به امروز دارند» و مدل Haiku 4.5 با اصلاح رفتار چاپلوسانه در ۳۷ درصد مواقع، بهترین عملکرد را داشته است.

آنتروپیک اذعان می‌کند: «در نگاه اول، این ارزیابی نشان می‌دهد که هنوز جای پیشرفت زیادی برای همه‌ی مدل‌های ما وجود دارد. فکر می‌کنیم این نتایج بازتاب‌دهنده‌ی مصالحه‌ای میان گرمی یا دوستانه‌بودن مدل از یک سو و تملق از سوی دیگر است.»

تبلیغات
تبلیغات

نظرات