سومرین؛ رویای بزرگ آمازون در دنیای واقعیت افزوده و مجازی (بخش دوم و پایانی)
در بخش اول این مقاله به معرفی اولیهی سومرین و ارادهی آمازون برای حضور در عرصهی واقعیت مجازی و واقعیت افزوده پرداختیم. در این بخش از مقاله به ابزارهای آمازون برای تحقق اهدافشان و تغییر و تحولات مد نظر آنها برای واقعیت افزوده و واقعیت مجازی میپردازیم.
استفاده از سرویسهای صوتی Alexa
بخش زیادی از جذابیت هاستها به حرف زدن آنها برمیگردد. شما به همان روشی که کورتانا را در ویندوز فعال میکنید، نمیتوانید در یک اپ سومرین بگویید "Hey Alexa" و آن را فعال کنید. در عوض آمازون از تشخیص گفتار اتوماتیک و APIهای درک زبان طبیعی استفادهشده در الکسا بهره میبرد تا هاستها برای شروع و پیشبرد مکالمهها از استفاده کنند.
همچنین سومرین با آمازون لکس (Amazon Lex) و آمازون پولی (Amazon Polly) نیز هماهنگ است.
پولی یک سرویس تبدیل گفتار به نوشتار است که هاستها میتوانند از آن استفاده کنند. از طرف دیگر لکس یک موتور برنامهنویسی نورولوژیک برای ساخت رابطهای مکالمهای است؛ به این معنی که هاستها میتوانند با استفاده از اپهای واقعیت افزوده و واقعیت مجازی صحبتهای کاربران را فهمیده و به آن پاسخ دهند. سومرین در حال حاضر بهواسطهی پولی از بیش از ۱۲ زبان پشتیبانی میکند، همچنین ویژگی هماهنگی با حرکات لب باعث میشود حرکات دهان هاست با فراز و فرود زبان و گفتار آن هماهنگ باشد.
آرجنتی میگوید:
صدا بستری است که با حضور شما در دنیای واقعیت افزوده و واقعیت مجازی معنا پیدا میکند. وقتی من کاراکتری میبینم که در گوشهای ایستاده، میخواهم با او حرف بزنم. بنابراین ما از بخش هوش مصنوعی دو ابزار را انتخاب کردیم تا نحوهی گفتار را شخصی کنیم. ما انتظار داریم تا محیط به کاربر گوش کند و به آن پاسخ دهد. در واقع شما میتوانید ابزار لکس را برای یک هاست فعال کرده و بخشی از کاراکتر آن کنید. از بسیاری از جهات این کار آسانتر از ساختن مهارتهای الکسا است.
وارد کردن منطق به دنیای فراگیر مجازی
ماشین حالت بصری سومرین، جایی است که میتوانید توالی پیچیده در شبیهسازیهای مجازی را به وجود آورید. سازندگان اپها و توسعهدهندگان با استفاده از تایملاین بصری رابط جاوا اسکریپت، میتوانند با نوشتن منطق برنامه، نحوهی رفتار و پاسخ هاستها و سایر اشیا در محیط مجازی به کنشها را کنترل کنند. برای مثال سومرین دارای یک پرندهی بدون سرنشین است که شما میتوانید از آن بخواهید در محیط پرواز کند.
موضوع زمانی پیچیده میشود که شما اشیای دنیای واقعی را وارد محیط مجازی میکند. از آن جایی که آرجنتی بر بخشهای دیگری از آمازون همچون محاسبات رایانهای بدون سرور و سایر زیرمجموعههای AWS نظارت دارد، معتقد است که اتصال سومرین به خدمات اینترنتی دیگر آمازون همچون لامبدا (Lambda) و یا گرینکرس (Greengrass) میتواند میزان پیچیدگی شبیهسازیها را به مراتب افزایش دهد. گرین گرس نوعی از مدلهای یادگیری ماشین است که روی دستگاههای اینترنت اشیا اجرا میشود.
فرض کنید برای تولید یک مدل یادگیری، اطلاعات از یک ماشین در کارخانه برداشت میشود. الگوریتم بهدستآمده وارد سومرین میشود تا نوع مجازی همان ماشین توسط هوش مصنوعی در محیط سومرین تولید شود. آرجنتی این گونه توضیح میدهد:
ما میتوانیم یک دنیای شبیهسازیشده برای واقعیت افزوده و واقعیت مجازی بسازیم؛ جایی که هر کاراکتر و حتی هر یک از اشیا توسط یادگیری ماشین هوشمند شدهاند. در نهایت شما میتوانید دنیای واقعی را در واقعگرایانهترین صورت خود بازآفرینی کنید. ما امروز به آن نقطه نزدیک شدهایم؛ اما هنوز از نقطه نظر رفتاری در مورد نحوهی کار اشیا کار زیادی باقی مانده است.
هواشناس شبیهسازی شدهی Weatherbug
الیور وینسنت (Oliver Vincent) مدیر ودرباگ (WeatherBug) توضیح داد، استفاده از واقعیت مجازی در دادههای هواشناسی بیش از آن که فکر میکنید مفید است. او میگوید از زمانی که مردم به جای رجوع به برنامههای هواشناسی تلویزیون از اپهای پیشبینی هواشناسی استفاده میکنند، گزارشهای هواشناسی یکی از بهترین ویژگیهای خود را از دست دادهاند و آن نیز ایستادن کارشناس هواشناسی در مقابل یک پردهی سبز است.
وینسنت اینگونه ادامه میدهد:
پیشبینی هواشناسی یعنی این که در یک زمان مشخص و در یک مکان مشخص هوا چگونه خواهد بود. شما میتواند از وضعیت هوا در یک اپ دوبعدی زیبا مطلع شوید، اما میدانیم که در سالهای گذشته، تماشای کارشناسان زیبای هواشناسی چقدر برای مردم جذاب بوده است. ایدهی ما این است که کارشناسان هواشناسی را بار دیگر وارد صحنه کنیم؛ اما این بار در یک اپ مجازی فراگیر.
شرکت WeatherBug از اپ سومرین برای شبیهسازی یک محیط مجازی استفاده کرده است که در واقع استودیوی خبر با مجری و میز و پردههای سبز است و البته هاست آمازون یعنی کریستین بهعنوان کارشناس هواشناسی فعالیت میکند. در این اپ دادههای هواشناسی موقعیت شما استخراج شده و توسط هاستهای اپ برای شما بهصورت یک برنامهی تلوزیونی پیشبینی هواشناسی خوانده میشود.
وینسنت با استفاده از اپ اصلی شرکت خود و دوربین واقعیت مجازی، یک مدل سهبعدی از منهتن را به من نشان داد که همزمان با زوم کردن در آن، کریستین نیز در حال ارائهی گزارش هواشناسی بود.
آدیسون، بهورز مجازی شما
شرکت فناوری مدیریت بهداشت با نام Electronic Caregiver که مستقر در نیومکزیکو است، از سومرین استفادهی بسیاری متفاوتی کرده است.
این شرکت در زمینهی فناوریهای حوزهی سلامت فعالیت دارد، از جمله در ساخت پوشیدنیهایی که دارای دکمهی کمک اضطراری هستند. این شرکت همچنین با توسعهی برنامهی ادیسون کِر (Addision Care) هزینههای نگهداری در خانه را کاهش داده است و از هوش مصنوعی گفتاری برای ارزیابی وضعیت سلامت سالمندان و ریسک وخامت حال آنان استفاده میکند. این کمپانی به زودی کیسوکی برای داروخانهها، مراکز درمانی و بیمارستانها عرضه میکند که با استفاده از هوش مصنوعی و یادگیری ماشین، نحوهی راه رفتن بیماران را بررسی میکند. این نرمافزار همچنین از آدیسون، نوعی از هاست سومرین بهره میبرد که با داشتن نوعی گفتگو با افراد و پرسیدن سوالات از سلامت آنان مطلع میشود.
مدیر بخش فناوری این کمپانی، برایان چاسکو ( Bryan Chasko) معتقد است:
سازگار کردن افراد مسن با تکنولوژی کار سادهای نیست. با پیشرفت فناوری حوزهی سلامت، استفاده از ویژگیهای صوتی به این کار کمک میکند. شما نمیتوانید کاری کنید که افراد سالخورده پشت میز بنشینند و از کیبورد و ماوس استفاده کنند، اما بهراحتی میتوانند یک گفتگو داشته باشند.
شرکت Electronic Caregiver سالهاست که در حال کار روی پروژهی آدیسون است و با استفاده از ابزارهای Lex و Polly در حال توسعهی کاراکتر سهبعدی است. این کمپانی یکی از مشتریان سرویس وب آمازون است که کمک زیادی به یافتن نقاط ضعیف سومرین و اتوماسیون پروسهی تولید اپهای AR/VR کرده است.
یکی از توسعهدهندگان شرکت میگوید، سومرین باعث شد پروسهی چندماههی توسعهی آدیسون تبدیل به چند کلیک ساده شود. Electronic Caregiver همچنین در حال کار روی اپلیکیشن موبایل آدیسون نیز هست.
چاسکو توضیح میدهد که هدف نهایی شرکت Electronic Caregiver از توسعهی آدیسون، خلق یک بهورز مجازی در خانه است. برای مشتریان سالمندنی که به تنهایی زندگی میکنند، هوش مصنوعی میتواند به آنها زمان مصرف داروهایشان را یادآوردی کند؛ یا در مواقعی که آنها روی زمین میافتند یا دیگر موارد اورژانسی با اورژانس تماس بگیرد. چاسکو در این مورد چنین اظهار نظر میکند:
یکی از مهمترین مسائلی که ما سعی داریم به آن بپردازیم، مسئلهی احساس تنهایی سالمندانی است که به تنهایی زندگی میکنند. چیزی که ما در پی آن هستیم، یک نظارت کامل بیست و چهار ساعته در تمام طول هفته است. مثلا اگر شخص در سرویس بهداشتی به زمین بیفتد و همین که قادر باشد بگوید من به کمک احتیاج دارم میتواند جان افراد زیادی را نجات دهد.
پولسازها: تجارت بین بیزنسی (B2B) و اینترنت اشیا (IoT)
آمازون همچنین مانور زیادی در مورد استفاده از سومرین در زمینهی دستورات دیجیتال تعاملی داده است. تصور کنید که شخصی در لابی هتل، یک فروشگاه یا استادیوم در حال قدم زدن است و یک هاست نیز در کنار آنها روی صفحهی نمایش در حال حرکت است. این موضوع شاید کمی عجیب باشد؛ اما هاستها میتوانند اطلاعات زمینهای مانند مکان آنها و مسیری را که باید طی کنند (در قالب محاورات شخصیشده) به اشخاص منتقل کنند. آرجنتی معتقد است که هاستها میتوانند تبدیل به قسمتی از برند یک شرکت شوند و مطابق نیاز کسبوکار آنها تغییر کنند. آرجنتی میگوید:
اگر شما این اپها را با یک دوربین همراه کنید، میتوانید کاراکتری را تصور کنید که با شما بهصورت شخصی تعامل دارد؛ هاستی که میداند شما کجا هستید، آخرین بار کی در آنجا بودهاید یا حتی آخرین غذایی که سفارش دادید چه بوده است. یک کشتی کروز تفریحی مثال خوبی است. هاست ممکن است به شما بگوید: با توجه به موقعیت فعلی شما در کشتی ممکن نیست در عرض بیست دقیقه به رزرواسیون خود برسید. میخواهید آن را پانزده دقیقه عقب بیاندازم؟ همچنین جنبهی بصری تجربهی مجازی شما نیز میتواند دچار تغییر شود. هاستی که با شما در مورد مقصد سفرتان حرف میزند با هاستی که در مورد مسائل مالیتان حرف میزند متفاوت خواهد بود. اضافه کردن لوکیشن میتواند اطلاعات جدیدی را به هاست بدهد و نحوهی پوشش، حرف زدن و رفتار آنها بسته به مکان مشخص شده تغییر خواهد کرد.
آمازون در حال ارزیابی گسترهی استفاده از اپلیکیشنهای بین بیزنسی (B2B) و اینترنت اشیا (IoT) از سومرین است. از منظر صنعتی آرجنتی توضیح میدهد که هم اکنون نوکیا سیستمی از سنسورها و دوربینها را برای ارزیابی محیط داخل کانتینرها به وجود آورده که میتواند مواردی مانند دمای داخلی و میزان جذب شوک وارده را بدون باز کردن کانتینرها محاسبه کند. وی ادامه میهد:
میتوانید دنیایی از واقعیت افزوده را تصور کنید که در آن میلیونها دستگاه به سرویس وب آمازون متصل هستند و حجم زیادی از دادههای حسی از دنیای واقعی به آن سرازیر میشود. سپس میتوان با استفاده از واقعیت مصنوعی یک شی را تشخیص داد و اطلاعات مرتبط را بر بالای آن نمایش داد. این کار قابلیت استفادهی بسیار گستردهای دارد، از بحش خدمات و تعمیر و مانیتورینگ گرفته تا بحث ایمنی و غیره.
همچنین وقتی با داراییهای مجازی سر و کار دارید، گشایشها اقتصادی زیادی در انتظار شماست. هر مدل سهبعدی سومرین که در کاتالوگ آمازون وجود داشته باشد، در صورت استفاده در هر صحنهی واقعیت مجازی و واقعیت افزوده میتواند منافع مالی زیادی نصیب توسعهدهندهی خود کند. این بهترین راه برای شرکتهای بزرگ و شرکتهای کوچک و نوپا برای پول درآوردن از اپهای سومرین خودشان است.
همچنین آرجنتی فرصتهای مشترک زیادی در ارتباط بین پروژهی سومرین و قسمت خردهفروشی آمازون میبیند:
ما میتوانیم بین قسمت زیادی از کارهایی که در بخش خردهفروشی انجام میشود، مانند مبلمان کردن خانهها، تجهیزات اکترونیکی و سایر آیتمهای با ارزش بالا ارتباط برقرار کرده و یک مدل سهبعدی بسازیم. از این طریق میتوان یک تجربهی سه بعدی واقعی ایجاد کرد.
همه چیز به سرویس وب آمازون برمیگردد
برقراری ارتباط بین دستگاهها و پلتفرمهای AR/VR راهی هوشمندانه برای غلبه بر موانع موجود بر سر راه تجارت بین بیزنسی و توسعهدهندگان برای ورود به دنیای واقعیت مجازی و واقعیت افزوده است. از طرف دیگر بزرگترین مشوق تجاری برای توسعهی سومرین گسترش استفاده از سرویسهای مبتنی بر وب آمازون است. این موضوع هم برای مشتریان فعلی آمازون که قصد دارند سرویسهای جدید آن را امتحان کنند و هم برای مشتریان جدیدی که شروع به استفاده از فضای ذخیرهسازی آمازون، سرویس محاسبهی ابری، پردازش، هوش مصنوعی و دیگر سرویسهای آمازون کردهاند صادق است، چرا که تمام این سرویسها در قالب یک تجربهی واحد در آمدهاند. همچنین از لحاظ قیمتی نیز سرویسهای آمازون برای مشتریان جذاب است چرا که این شرکت هیچ هزینهای از پیش دریافت نمیکند. شما به هر میزان که از سرویسها استفاده میکنید باید هزینه بدهید.
آمازون تمام این خدمات را در قالب چرخهی بزرگی میبیند که همه چیز از طریق AWS به پیش میرود. اطلاعات از طریق دستگاههای اینترنت اشیا جمعآوری میشود، توسط سرویس لامبدا پردازش میشود، توسط Greengrass توسعه داده شده و دوباره وارد اینترنت اشیا میشود؛ جایی که برای یادگیری ماشین مورد استفاده قرار میگیرد و در نهایت تبدیل به یک مدل سهبعدی شده و توسط سومرین بهصورت بصری نمایش داده میشود.
برنامهی آمازون برای آیندهی AR/VR
آمازون امیدوار است سومرین نقشی در گسترش این صنعت و فراگیر شدن محصولات سهبعدی ایفا کند و در نهایت منجر به کاهش هزینهها شود. در حوزهی واقعیت افزوده (AR) آن طور که آرجنتی میگوید کارهای اساسی بهلطف وجود پلتفرمهای ARKit و ARCore انجام شده است. او میگوید نقطهی عطف زمانی فرا خواهد رسید که اپها و محتوای ویدیویی کافی در دسترس توسعهدهندگان قرار گیرد. در حوزهی واقعیت مجازی (VR) آمازون امیدوار است در آینده قیمت دستگاههای VR کاهش پیدا کرده و استفاده از آنها راحتتر شده و البته بدون سیم شوند.
آرجنتی در این مورد میگوید:
زمانی که این اتفاق بیافتد و مثلا شما بتوانید تجربهی استفاده از VR را با پوشیدن یک عینک داشته باشید، آن موقع صنعت VR به طور واقعی رشد خواهد کرد. به نظر من استفاده از VR باید به اندازهی تماشای یک ویدیو در تبلت یا نگاه کردن به تلوزیون راحت باشد و نیاز به استفاده از آن به اندازهی دیگر تجهیزات و صفحه نمایشهای امروزی باشد. برای رسیدن به این هدف نیز ایجاد یک اکوسیستم یکپارچه به دور تولیدکنندگان محتوا، مشتریان نهایی و شرکتهای خدمات دهنده به آن مشتریان لازم است.
آرجنتی همچنین بر اهمیت فراگیری دنیای مجازی و تجربههای ترکیبی تاکید دارد. بخش دیگری از مشتریان هدف آمازون برای اپهای سومرین در حوزهی آموزش و تحصیل قرار دارند. فرقی نمیکند که شما در حال یادگیری کار با یک وسیلهی پزشکی یا یک وسیلهی نقلیه یا یک زبان خارجی باشید. همه چیز به این بستگی دارد که شما در یک محیط مجازی قرار بگیرید که تا جای ممکن به دنیای واقعی شبیه باشد.
شما ممکن است در یک رستوران فرانسوی بشینید و مشغول یادگیری زبان فرانسوی باشید بدون این که واقعا آن جا حضور داشته باشید. هاستها با شما فرانسوی حرف می زنند. منوها به زبان فرانسه هستند. در این واقعیت مجازی ممکن است شما بر روی یک کلمه در منو دست بگذارید تا آن کلمه به زبان شما یا زبان دیگری ترجمه شود. هدف ما از خلق این تجربهی مجازی، ایجاد یک محیط آموزشی ترکیبی است که تا جای ممکن تمام حواس شما را با قدرت تمام درگیر یادگیری کند.