آپدیت جدید هوش مصنوعی «کلود» با ویژگی یادگیری خودکار از راه رسید
شرکت انتروپیک قابلیت جدیدی به نام Dreaming را برای عاملهای مدیریتشده (Managed Agents) در پلتفرم کلود منتشر کرد. این ویژگی، به عاملهای هوش مصنوعی اجازه میدهد تا با بررسی جلسات گذشته، الگوها را شناسایی کنند و عملکرد خود را بهطور خودکار بهبود ببخشند.
بهروزرسانی جدید در قالب پیشنمایش تحقیقاتی منتشر شده و هدف آن، کاهش نیاز به نظارت انسانی و افزایش توانمندی عاملها در انجام وظایف پیچیده اعلام شده است.
همزمان با Dreaming، ابزارهای دیگر نظیر ارکستراسیون چند-عاملی و وبهوکها نیز برای توسعهدهندگان فعال شدند.
مکانیزم Dreaming؛ حافظهای که تکامل مییابد
Dreaming یک فرآیند زمانبندی شده است که فضای ذخیرهسازی و جلسات هر عامل هوش مصنوعی را بازبینی میکند. این سیستم، الگوهای تکراری، اشتباهات رایج و ترجیحات تیمی را استخراج و حافظه را برای حفظ کیفیت سیگنالها بازسازی میکند.
توسعهدهندگان میتوانند سطح کنترل خود را تعیین کنند؛ بهطوری که Dreaming یا بهصورت خودکار حافظه را بهروزرسانی کند یا تغییرات پیش از اعمال، توسط کاربر بررسی شوند. این سیستم برای پروژههای طولانیمدت که نیاز به تداوم یادگیری دارند، بسیار حیاتی است.
سیستم Outcomes برای تضمین کیفیت خروجی
در کنار حافظه، قابلیت Outcomes معرفی شده است که به توسعهدهندگان اجازه میدهد یک معیار دقیق برای موفقیت تعریف کنند. در این ساختار، یک ارزیاب مجزا، خروجی را با معیارهای تعیینشده میسنجد تا از سوگیریهای مدل جلوگیری شود.
بر اساس بنچمارکهای داخلی انتروپیک، استفاده از Outcomes نرخ موفقیت در سختترین وظایف را تا ۱۰ واحد افزایش داده است. همچنین کیفیت تولید فایلهای docx و pptx بهترتیب ۸٫۴ درصد و ۱۰٫۱ درصد بهبود یافت.
مدیریت وظایف پیچیده
برای مدیریت حجم بالای کار، قابلیت Multiagent Orchestration به یک عاملِ پیشرو اجازه میدهد تا وظایف را خرد کند و آنها را به عاملهای متخصص واگذار کند. هر عامل متخصص میتواند مدل زبانی، پرامپت و ابزارهای مجزایی داشته باشد.
این متخصصها بهصورت موازی روی یک فایل مشترک فعالیت میکنند. تمام مراحل اجرای وظایف در کنسول کلود قابل ردیابی است تا کاربر بداند هر عامل در چه زمانی و به چه دلیلی اقدامی انجام داده است.
کاربردهای صنعتی و نتایج عملیاتی
شرکت هاروی با استفاده از این ابزارها، نرخ تکمیل وظایف خود در کارهای حقوقی را حدود ۶ برابر افزایش داد. بهعلاوه، تیم نتفلیکس برای تحلیل لاگهای هزاران اپلیکیشن، از ارکستراسیون چند-عاملی استفاده میکند تا تنها الگوهای حیاتی را شناسایی کند.
شرکت وایزداکس با پیادهسازی سیستم Outcomes برای بررسی کیفیت اسناد، سرعت بازبینیهای خود را ۵۰ درصد افزایش داد، در حالی که استانداردهای داخلی تیم بهطور کامل حفظ شدند.
به نظر شما عاملهای هوش مصنوعی که قادر به یادگیری از اشتباهات خود هستند، تا چه حد جایگزین نظارت انسانی میشوند؟