API یادگیری ماشینی گوگل اشیاء مختلف را در ویدیوها تشخیص می‌دهد

API یادگیری ماشینی گوگل اشیاء مختلف را در ویدیوها تشخیص می‌دهد

گوگل به‌تازگی نسخه‌ی اولیه‌ی API یادگیری ماشینی خود را به نمایش گذاشته است. این API می‌تواند آیتم‌های مختلف را در ویدیوها شناسایی کند.

API جدید یادگیری ماشینی گوگل هم‌اکنون می‌تواند اشیاء مختلف را در ویدیوها تشخیص دهد. البته این سیستم فعلا در مراحل ابتدایی قرار دارد ولی دست‌یابی به همین سطح هم خود یک گام بزرگ در تکنولوژی یادگیری ماشینی است. گوگل در کنفرانس نکست‌کلود خود با اعلام جزئیاتی در مورد API جدید که آن را API ابر هوش ویدویی نامیده، توجهات زیادی را به خود جلب کرده است. گوگل در کنفرانس مورد اشاره نمونه‌ای نمایشی از API جدیدش را به‌نمایش گذاشت و جزئیات مختصری هم در مورد روش کارکرد و قابلیت‌های آن بیان کرد.

گوگل در کنفرانس نکست‌کلود ویدیویی از یک ببر را پخش کرده و در سمت راست پایین این ویدیو لیستی شامل نام اشیاء مختلف به‌نمایش درآمده است که همگی توسط API گوگل تشخیص داده شده‌اند. این آیتم‌ها در واقع نام مواردی است که احتمال دارد در ویدیو مورد نظر وجود داشته باشند و در کنار هر آیتم درصد اطمینان از وجود آن در ویدیو قرار داده شده است. پس از پخش شدن ویدیویی که در آن یک ببر وجود داشت، در کنار نام ببر عدد ۹۰.۱۱ درصد به‌نمایش درآمد. البته کلمه‌ی ببر سومین آیتمی بوده که توسط API جدید یادگیری ماشینی گوگل ایجاد شده و در بالای آن دو کلمه‌ی حیوان و حیات وحش نیز توسط این API شناسایی شده که هر دو این کلمه‌ها درست تشخیص داده شده‌اند. گوگل از مدل Tensor Flow و مدل‌های دیگر یادگیری ماشینی به عنوان چهارچوب اصلی این API جدید استفاده کرده و در حال حاضر این API در مرحله‌ی بتای خصوصی قرار دارد. به این ترتیب توسعه‌دهندگان می‌توانند برای تست API جدید یادگیری ماشینی گوگل ثبت‌نام کنند تا از آن به طور آزمایشی در پروژه‌های مورد نظر خود بهره ببرند.

در نسخه‌ی قبلی API گوگل که به منظور تشخیص موارد موجود در ویدیوها به‌کار می‌رفت از برچسب‌های دستی استفاده می‌شد، اما در نسخه‌ی جدید این API امکانی فراهم شده تا آیتم‌های موجود در ویدیوها به طور واقعی شناسایی شوند. در حال حاضر اگر ویدیوهای تبلیغاتی برای معرفی محصولات مشخص پخش شوند، API ابرهوش ویدیویی گوگل به‌خوبی می‌تواند آن محصول را تشخیص داده و بدین ترتیب این موضوع را درک کند که ویدیو یاد شده از نوع تبلیغاتی است. اما در کنفرانس نکست‌کلود و پس از پخش ویدیویی که در آن یک ببر وجود داشت، گوگل اعلام کرد که توسعه‌دهندگان می‌توانند با API جدید این شرکت محتوای مورد نظر خود را در ویدیوهایی که در فضای ذخیره‌سازی ابری گوگل قرار دارند با استفاده از کلمات کلیدی مثل «Tiger» جستجو کنند؛ در این مورد اگر کلمه‌ی Tiger جستجو شود، در بخش نتایج تمامی ویدیوهایی که در آن‌ها ببر وجود داشته باشد به نمایش در می‌آیند. البته قابلیت‌های API جدید گوگل شاید فعلا برای کاربران عادی کاربرد چندانی نداشته باشد و هدف اصلی از توسعه‌ی این API شرکت‌هایی هستند که نیاز به فضای ذخیره‌سازی ابری و راهکارهای محاسبات ابری دارند. البته پس از مدتی این تکنولوژی جدید در دسترس کاربران عادی نیز قرار خواهد گرفت. 

نظر شما در این مورد چیست؟

از سراسر وب

  دیدگاه
کاراکتر باقی مانده

بیشتر بخوانید