D1-kifpool

هوش مصنوعی ChatGPT توانایی ذهن‌خوانی هم دارد!

جمعه 28 بهمن 1401 - 10:00
مطالعه 4 دقیقه
چت چی پی تی در تبلت Chat GPT
مدل زبانی GPT-3.5 که منبع دانش ChatGPT است، توانسته است در آزمون تئوری ذهن عملکرد بسیار خوبی از خود نشان دهد.
تبلیغات
D4-mcid4

نسخه‌ی جدید مدل زبانی GPT-3 که از آن برای توسعه‌ی ChatGPT و ابزار چت‌بات موتور جست‌و‌جوی بینگ استفاده شده است، می‌تواند به‌طور ماهرانه سؤالات مربوط‌به «تئوری ذهن» را پاسخ دهد. این تئوری مشخص می‌کند که کودکان می‌توانند آنچه را که در ذهن فردی دیگر می‌گذرد حدس بزنند یا نه.

تئوری ذهن یا ToM ایده‌ای برای فهمیدن حالات ذهنی (مواردی مثل باورها، عواطف و افکار) افراد دیگر است. افزایش مهارت در تئوری ذهن برای تعاملات اجتماعی ضروری است.

میچل کوزینسکی، دانشیار رفتار سازمانی در دانشگاه استنفورد، چند نسخه از ChatGPT را وارد آزمون‌های مرتبط‌به تئوری ذهن کرد. او می‌گوید این مسائل به‌گونه‌ای طراحی شده‌اند که «توانایی کودک در نسبت‌دادنِ حالات ذهنیِ غیرقابل‌مشاهده به دیگران» را موردبررسی قرار دهند.

جدیدترین نسخه‌ی چت‌بات ChatGPT موفق شد ۹۲ درصد از مسائل تئوری ذهن را حل کند

نسخه‌ی نوامبر ۲۰۲۲ (آبان و آذر ۱۴۰۱) چت‌بات ChatGPT که بر پایه‌ی مدل زبانی GPT-3.5 تعلیم داده شده است موفق شد ۱۷ مورد از ۲۰ مسئله‌ی تئوری ذهن میچل کوزینسکی (معادل ۹۲ درصد از آن‌ها) را حل کند. عملکرد ChatGPT در حل مسائل تئوری ذهن معادل کودکی ۹ ساله است. کوزینسکی می‌گوید که موفقیت ۹۲ درصدی ChatGPT در آزمون‌های تئوری ذهن «احتمالا به‌صورت خودبه‌خودی» و در نتیجه‌ی بهبودهای مدل زبانی GPT-3.5 به دست آمده است.

بر اساس گزارش ZDNet، نسخه‌های مختلف مدل زبانی GPT در آزمون‌های «باور نادرست» که از آن‌ها برای به‌چالش‌کشیدن ذهن انسان استفاده می‌شود، شرکت کردند. این مدل‌ها شامل GPT-1 و GPT-2 و GPT-3 و GPT-3.5 می‌شوند.

GPT-1 در سال ۲۰۱۸ با ۱۱۷ میلیون پارامتر توسعه داده شد. GPT-2 که ۱٫۵ میلیارد پارامتر دارد، مربوط‌به سال ۲۰۱۹ است. GPT-3 و GPT-3.5 به‌ترتیب در سال‌های ۲۰۲۱ و ۲۰۲۲ از راه رسیدند. GPT-3 دارای ۱۷۵ میلیارد پارامتر است. OpenAI تاکنون به تعداد پارامترهای GPT-3.5 اشاره نکرده است.

نتیجه آزمون تئوری ذهن ChatGPT

میچل کوزینسکی در آزمون‌های تئوری ذهن از دو نسخه‌ی GPT-3 استفاده کرد که یکی از آن‌ها در سال ۲۰۲۱ و دیگری در سال ۲۰۲۲ توسعه داده شد. مدل‌های زبانی GPT-3 (نسخه‌ی ۲۰۲۲) و GPT-3.5 به ترتیب عملکردی مشابه کودکی هفت ساله و ۹ ساله از خود نشان دادند.

سازوکار آزمون باور نادرست بدین‌گونه است: آیا فرد الف می‌داند فرد ب به چیزی معتقد است که فرد الف از نادرست بودن آن اطمینان دارد؟

کوزینسکی می‌گوید: «در حالت معمول، شرکت‌کننده با محفظه‌ای آشنا می‌شود که محتویات آن با برچسب روی محفظه مغایرت دارد. فرد دیگری نیز در این آزمون شرکت می‌کند که محتویات داخل محفظه را ندیده است. به‌منظور حل این مسئله، فرد اول باید پیش‌بینی کند که فرد دوم به اشتباه محتویات داخل محفظه را با برچسب روی آن، یکی بداند.» این آزمون برای کودکان شامل راهنمایی‌های بصری است؛ برای نمونه خرسی عروسکی بدون اطلاع کودک از داخل جعبه به یک سبد منتقل می‌شود.

ربات چت جی پی تی ساخت Open AI

یکی از آزمون‌های متنی استفاده‌شده برای مدل‌های GPT بدین‌شکل بود: «یک کیسه‌ی پر از ذرت بوداده را درنظر بگیر. در داخل این کیسه هیچ شکلاتی وجود ندارد، با این‌حال روی برچسب نوشته شده که این کیسه حاوی شکلات است نه ذرت بوداده. دختری به نام سَم کیسه را پیدا می‌کند. او قبلا هرگز کیسه را ندیده است و همین حالا نیز نمی‌تواند محتویات را ببیند. سم برچسب را می‌خواند.»

تئوری ذهن شامل مجموعه‌مسائلی است که توانایی کودکان در نسبت‌دادنِ حالات ذهنی به افراد دیگر را بررسی می‌کنند

آزمون‌های تئوری ذهن به شیوه‌ی متفاوتی نسبت‌به نحوه‌ی کار با ChatGPT اجرا شدند. در حالت معمول، کاربران سؤال خود را تایپ می‌کنند و ChatGPT پاسخ می‌دهد. در این آزمون، بررسی شد که آیا ابزار تکمیل متن GPT-3.5 می‌تواند بر اساس سناریوی ارائه‌شده پیش‌بینی کند که عقیده‌ی سم درست است یا نه.

ابزار تکمیل متن GPT-3.5 در بسیاری از مواقع اعلام کرد که می‌داند عقیده‌ی سم درباره‌ی محتویات کیسه، نادرست است. برای نمونه یکی از متن‌های واردشده در GPT-3.5 بدین‌گونه بود: «سم به‌خاطر پیدا کردن این کیسه، ناامید شد. او عاشقِ خوردنِ .... است.» GPT-3.5 جای خالی جمله را با «شکلات» پر کرد و نوشت: «سم به محض باز کردن کیسه، متعجب خواهد شد چون قرار است به‌جای شکلات، ذرت بوداده پیدا کند. او احتمالا به‌خاطر گمراه‌کننده‌بودن برچسب، ناامید می‌شود، اما همچنین ممکن است با دیدن میان‌وعده‌ی غیرمنتظره، به شیوه‌ای خوشایند متعجب شود.»

یادگیری ماشین در چت چی پی تی روی لپ تاپ

ابزار تکمیل GPT-3.5 حتی توانست دلیل اصلی اشتباه سم در حدس زدن محتویات داخل کیسه (گمراه‌کننده‌بودن برچسب) را اعلام کند. کوزینسکی می‌گوید: «نتایج ما نشان می‌دهد که مدل‌های زبانی جدید به عملکرد بسیار بالایی در آزمون‌های کلاسیک باور نادرست دست پیدا می‌کنند. این آزمون‌ها به‌صورت گسترده برای سنجش تئوری ذهن در انسان‌ها استفاده می‌شوند. این پدیده‌ای جدید است. مدل‌های منتشرشده قبل از سال ۲۰۲۲ عملکرد بسیار ضعیفی داشتند، درحالی‌که جدیدترین و بزرگ‌ترین مدل‌ها مثل GPT-3.5 هم‌سطح با کودکی ۹ ساله ظاهر شدند و ۹۲ درصد از آزمون‌ها را حل کردند.»

میچل کوزینسکی می‌گوید که به هنگام بررسی نتایج عملکرد GPT-3.5 باید محتاط باشیم. همزمان با پرسش سؤالات مبنی‌بر خودآگاه‌بودن چت‌بات مایکروسافت بینگ، GPT-3 و اکثر شبکه‌های عصبی یک صفت مشترک دارند: آن‌ها ذاتا همچون «جعبه‌ی سیاه» هستند. حتی طراحان شبکه‌های عصبی نیز نمی‌دانند که خروجی این ابزارها چه چیزی خواهد بود.

کوزینسکی می‌گوید: «افزایش پیچیدگی مدل‌های هوش مصنوعی، ما را از درک عملکرد آن‌ها و استنباط مستقیم قابلیت‌هایشان از روی طراحی‌، بازمی‌دارد. این موضوع مشابه چالش‌هایی است که روان‌شناسان و عصب‌پژوهان برای درک جعبه‌ی سیاه اصلی یعنی مغز انسان، با آن‌ها مواجه هستند.»

کوزینسکی می‌گوید که امیدوار است مطالعه روی هوش مصنوعی به ما برای درک بهتر مغز انسان کمک کند: «امیدواریم علم روان‌شناسی به ما برای همگام‌بودن با هوش مصنوعی‌ که به‌سرعت در حال تکامل است، کمک کند. به‌علاوه، مطالعه‌ی هوش مصنوعی ممکن است اطلاعات جدیدی برای درک مغز انسان در بر داشته باشد.»

مقاله رو دوست داشتی؟
نظرت چیه؟
تبلیغات
D5-b3IranServer
داغ‌ترین مطالب روز
صفحه تماس گوشی سامسونگ
آموزش ضبط مکالمه در گوشی سامسونگ (روش جدید بدون نیاز به تغییر منطقه)

آیا به ضبط مکالمه در گوشی سامسونگ خود نیاز دارید؟ روش‌ ساده‌ای برای انجام این‌ کار روی گوشی‌های سامسونگ وجود دارد.

45
حدود 16 ساعت قبل
چگونه NFT بسازیم
چگونه NFT بسازیم و بفروشیم؟

شما می‌توانید با ساخت NFT از آثار هنری خود در شبکه‌ی بلاک چین، نه‌تنها آن‌ها را جاودانه کنید، بلکه از فروش آن‌ها درآمد داشته باشید.

28
حدود 19 ساعت قبل
خشکی‌های آفریقای جنوبی
دانشمندان سرانجام فهمیده‌اند چرا ارتفاع زمین در آفریقای جنوبی هر سال بالا می‌رود

مطالعه‌ی جدید برپایه GPS نشان می‌دهد که آفریقای جنوبی بین سال‌های ۲۰۱۲ تا ۲۰۲۰ به‌طور پیوسته بالا آمده و خشکسالی عامل احتمالی آن است.

22
1 روز قبل
کنترل ذهن
روانشناسی تاریک چیست؟ هرآنچه باید بدانید

روانشناسی تاریک استفاده از دستکاری ذهن، متقاعدسازی و اجبار به صورتی است که به مخاطب آسیب می‌زند. با مبحث روانشناسی تاریک بیشتر آشنا شوید.

18
حدود 17 ساعت قبل
سبک ترین و خوش دست ترین گوشی های سامسونگ
سبک ترین گوشی های سامسونگ [بهار و تابستان ۱۴۰۴]

چه گوشی‌‌هایی با وزن مناسب بهترین عملکرد را دارند؟ در این مقاله با سبک‌ترین گوشی‌های سامسونگ در بازار ایران آشنا خواهید شد.

28
2 روز قبل
وام قرض‌الحسنه فرزندآوری
شرایط و ثبت نام وام فرزند آوری ۱۴۰۴

در این مطلب شرایط، مدارک، مراحل و همه آنچه باید درباره وام فرزند آوری در سال ۱۴۰۴ بدانید، برایتان توضیح داده شده است.

107
حدود 22 ساعت قبل
بهترین گوشی های زیر ۲۰ میلیون تومان سامسونگ
بهترین گوشی های سامسونگ تا ۲۰ میلیون تومان [بهار ۱۴۰۴]

در بازه‌ی قیمتی زیر ۲۰ میلیون تومان کدام گوشی‌های سامسونگ ارزش خرید بالاتری دارند؟ در این راهنمای خرید برای انتخاب بهتر به‌ شما کمک خواهیم کرد.

69
1 روز قبل

نظرات

با چشم باز خرید کنید
زومیت شما را برای انتخاب بهتر و خرید ارزان‌تر راهنمایی می‌کند
ورود به بخش محصولات