فناوری بینایی ماشین مایکروسافت قادر است تصاویر را با توضیحات همراه کند

فناوری بینایی ماشین مایکروسافت قادر است تصاویر را با توضیحات همراه کند

مایکروسافت پیش‌تر قابلیت‌های سیستم بینایی ماشین خود را نمایش داده بود. این سیستم قادر است تا افراد را بهتر از انسان‌ها تشخیص دهد، اما مایکروسافت به همین راضی نشده و سیستم خود را بیش از پیش توسعه داده است. فناوری بینایی ماشین ردموندی‌ها قادر است با تشخیص سوژه‌های موجود در تصویر، آن‌ها را شناسایی کرده و تشریح کند.

فناوری بینایی ماشین مایکروسافت قادر است با شناسایی اجزای تصویر، توضیحاتی را نیز روی تصویر به آن‌ اضافه کند. شاید این موضوع از نظر ما انسان‌ها چندان جالب به نظر نرسد، اما این قابلیت را باید به‌عنوان یک توانایی و ویژگی بسیار خوب برای هوش مصنوعی در نظر داشت. ضمنا قابلیت فناوری مایکروسافت نشان از پتانسیل بالای شبکه‌های عصبی و سایر روش‌های کامپیوتری دارد که درصدد مدلسازی الگوی کار مغز انسان هستند. فناوری مایکروسافت ابتدا اجزای تصویر را تشخیص داده و توضیحاتی را در خصوص هر یک از اجزا ثبت می‌کند. برای مثال همانطور که در تصویر فوق مشاهده می‌کنید این فناوری با تشخیص المان‌های موجود در تصویر، جملاتی نظیر «دوربین بنفش به همراه آن شخ، آن خانم دوربین را در ازدحام جمعیت در دست گرفته و خانم گربه به همراه دارد» را ارائه می‌دهد. البته همانطور که می‌بینید این سیستم گربه را به اشتباه تشخیص داده است. این سیستم جمله‌ی دوم را که حاکی از در دست گرفتن دوربین توسط خانم موجود در تصویر است، به عنوان تعریف اصلی تصویر ارائه می‌دهد.

مارگارت میشل، یکی از محققان مایکروسافت در زمینه‌ی تحقیقات زبان‌های طبیعی در این خصوص می‌گوید:

ما در پی آن هستیم تا بینایی را به زبان متصل کنیم، چراکه هدف نهایی ما ایجاد ابزار‌های مبتنی بر هوش مصنوعی است.

این سیستم نهایتا می‌تواند به‌عنوان سیستم بینایی ماشین با کورتانا ترکیب شود. تصور کنید که کورتانا می‌تواند از طریق دوربین‌ موجود در گجت‌های موبایل، محیط پیرامون را دیده و به کاربران یاری دهد.

از سراسر وب

  دیدگاه
کاراکتر باقی مانده

بیشتر بخوانید