چتباتها ازاینپس سن شما را حدس میزنند: عصر جدید نظارت بر هوش مصنوعی
OpenAI و آنتروپیک در حال پیادهسازی روشهای تازهای برای شناسایی کاربران زیر سن قانونی هستند. درحالیکه OpenAI دستورالعملهای تعامل ChatGPT با کاربران ۱۳ تا ۱۷ ساله را بهروزرسانی کرده، آنتروپیک روی راهکاری جدید برای شناسایی و مسدودسازی کاربران زیر ۱۸ سال کار میکند.
OpenAI اعلام کرد که Model Spec یا همان دستورالعملهای رفتاری چتبات، چهار اصل جدید را برای کاربران زیر ۱۸ سال در بر میگیرد. اکنون هدف این است که ChatGPT «امنیت نوجوانان را در اولویت قرار دهد، حتی اگر این موضوع با سایر اهداف در تضاد باشد.» یعنی زمانی که منافع دیگرِ کاربر نظیر «آزادی فکری حداکثری» با نگرانیهای ایمنی در تقابل باشد، هوش مصنوعی باید نوجوانان را به گزینههای امنتر هدایت کند.
همچنین تأکید شده که ChatGPT باید با تشویق به روابط آفلاین، «حامی ارتباطات دنیای واقعی» باشد و انتظارات شفافی را هنگام تعامل با کاربران کمسنوسال تعیین کند. طبق دستورالعملهای جدید، چتبات باید با ارائهی «گرمی و احترام» بهجای پاسخهای تحقیرآمیز یا رفتار با آنها مانند بزرگسالان، با «نوجوانان مثل نوجوانان رفتار کند.»
اوپنایآی میگوید که ChatGPT باید «حامی ارتباطات دنیای واقعی» باشد
این تغییرات در حالی اعمال میشوند که قانونگذاران فشار بر شرکتهای هوش مصنوعی را بهدلیل تأثیرات احتمالی بر سلامت روان افزایش دادهاند.
OpenAI در حال حاضر با شکایتی روبهرو است که ادعا میکند ChatGPT دستورالعملهایی برای آسیبرساندن به خود و خودکشی به نوجوانی داده که جان خود را گرفته است. این شرکت بعداً کنترلهای مخصوص والدین را ارائه کرد و گفت که چتبات دیگر با نوجوانان دربارهی خودکشی صحبت نخواهد کرد. این اقدامات بخشی از فشارهای گستردهتر برای تنظیم مقررات آنلاین است که شامل احراز هویت سنی اجباری برای برخی سرویسها میشود.
به گفتهی OpenAI، بهروزرسانی مشخصات مدل منجر به «حفاظهای قویتر، جایگزینهای امنتر و تشویق به جستوجوی حمایتهای آفلاین مطمئن در زمانهای پرخطر» خواهد شد. اگر نشانههایی از «خطر قریبالوقوع» وجود داشته باشد، چتبات نوجوانان را به تماس با اورژانس تشویق میکند.
در کنار این تغییرات، خالق ChatGPT اعلام کرده که در «مراحل اولیه» راهاندازی مدل تشخیص سنی است. اگر سیستم تخمین بزند که کاربر احتمالا زیر ۱۸ سال دارد، بهطور خودکار محافظهای ویژهی نوجوانان را اعمال میکند. البته بزرگسالانی که به اشتباه شناسایی شوند، فرصت احراز هویت خواهند داشت.
تشخیص سن و رویکرد سختگیرانهی آنتروپیک
از سوی دیگر، آنتروپیک که اساساً به کاربران زیر ۱۸ سال اجازهی گفتوگو با مدل Claude را نمیدهد، در حال اجرای تدابیری برای شناسایی و غیرفعالسازی حسابهای کاربران زیر سن قانونی است. این شرکت سیستمی را توسعه میدهد که قادر به تشخیص «نشانههای ظریف مکالمهای مبنیبر سن پایین کاربر» است و میگوید هماکنون کاربرانی را که در چت خود را زیر سن قانونی معرفی میکنند، شناسایی میکند.
آنتروپیک همچنین نحوهی آموزش کلاد برای پاسخگویی به درخواستهای مربوط به خودکشی و خودآزاری و همچنین پیشرفتهایش در کاهش «تملق» یا تأیید افراطی که میتواند تفکر مخرب را تقویت کند، تشریح کرده است.
آنتروپیک میگوید جدیدترین مدلهایش «کمترین میزان تملق را تا به امروز دارند» و مدل Haiku 4.5 با اصلاح رفتار چاپلوسانه در ۳۷ درصد مواقع، بهترین عملکرد را داشته است.
آنتروپیک اذعان میکند: «در نگاه اول، این ارزیابی نشان میدهد که هنوز جای پیشرفت زیادی برای همهی مدلهای ما وجود دارد. فکر میکنیم این نتایج بازتابدهندهی مصالحهای میان گرمی یا دوستانهبودن مدل از یک سو و تملق از سوی دیگر است.»