داستان تولد کورتانا: از یک ایده‌ی خام تا یک دستیار هوشمند قدرتمند

مایکروسافت با معرفی نسخه‌ی جدید سیستم‌عامل مختص به ابزار‌های قابل‌حمل خود یا همان ویندوزفون 8.1، قابلیت‌های جدیدی را در سیستم‌عامل خود گنجانده است؛ اما ردموندی‌ها پای کورتانا، شخصیت بازی‌های سری هیلو را نیز به این اکوسیستم باز کرده‌ و آن را در قالب یک دستیار صوتی هوشمند وارد این سیستم‌عامل نموده‌اند. هم‌اکنون اپل با سیری، گوگل با دستیار صوتی گوگل ناو و نهایتاً مایکروسافت نیز با دستیار صوتی مختص به خود یعنی کورتانا، سه ضلع رقابت در اکوسیستم‌ ابزار‌های‌هوشمند را تشکیل داده‌اند. باید دید آیا کورتانا قادر است به خوبی ایکس‌باکس و بازی هیلو، در این اکوسیستم نیز نقش پررنگی ایفا کند؟

این دستیار‌هوشمند قادر است تا با زیرنظر گرفتن فعالیت‌ها و کارهایی که شما با تلفن‌هوشمند ویندوزفونی خود انجام می‌دهید، شما را در برنامه‌ریزی‌های روزانه در کنار سایر امور از جمله در جستجوهای تحت‌وب خود یاری دهد. کورتانا شما را در امور بسیاری یاری خواهد کرد که می‌توان از ایفای نقش به‌عنوان اصلی‌ترین بازیگر در مورد جستجو و یافتن اطلاعات در ویندوزفون 8.1 یا انجام وظبفه به‌عنوان یک منشی یا تنظیم کننده‌ی قرار ملاقات‌ها و امور روزانه و یادآوری کارها نام برد. این سیستم، بسیار هوشمند توسعه‌‌ داده شده است تا کارکردی برابر یک عامل انسانی داشته باشد. با وجود رقابت چندین ساله در زمینه‌ی ابزار‌های‌هوشمند قابل‌حمل، مایکروسافت با قدرتی مثال‌زدنی و شتابی روزافزون درصدد نزدیک‌شدن به رقبای اصلی این عرصه است. در این میان کورتانا به‌عنوان یک قابلیت مهم به ویندوزفون 8.1 اضافه شده است که برای نزدیک به دو سال توسط برنامه‌نویسان مایکروسافت در حال توسعه بود. شاید بتوان تعبیه این سیستم در ویندوزفون 8.1 را اینگونه تعبیر کرد که مایکروسافت بار بزرگ رقابت با سایر پلتفرم‌ها را بر دوش کورتانا گذارده است. در ادامه داستان پیدایش کورتانا را از نظر خواهیم گذراند.

براساس گفته‌های مارکوس‌آش، مدیرگروه برنامه‌نویسان ویندوزفون، نام گذاری این سیستم به نام کورتانا پیشنهاد یکی از برنامه‌نویسان تیم به نام رابت‌هاوارد بوده است که در ابتدا ذهنیتی مبنی بر نام گرفتن محصول نهایی وجود نداشت و تصور این بود که از آن به‌عنوان یک کد یا نام اولیه برای شناساندن این محصول به کار گرفته خواهد شد. این سیستم از ابتدا با این نام خوانده شد و عناوینی چون دستیار شخصی هوشمند که در تاریخ مایکروسافت متعجب‌کننده‌ است، برای آن استفاده نشد. این نام تا چند هفته پیش از معرفی نهایی محصول باقی مانده بود تا اینکه در مورد بود یا نیود آن و انتخاب نام اصلی صحبت‌هایی رد و بدل شد. شاید این سیستم نام‌هایی چون نائومی، آلیکس یا شماری دیگر از نام‌های پیشنهاد داده شده را به خود می‌دید؛ اما عواملی چون فاش‌شدن اطلاعات در مورد این دستیار صوتی با نام کورتانا و همچنین درخواست‌های کاربران منجر به تثبیت این نام برای دستیار صوتی ویندوزفون 8.1 شد.CortanaInt1

سرچشمه‌ی کورتاتا را باید در بازی هیلو و در پس برنامه‌ها و اهداف ردموندی‌ها از انتخاب چنین نامی جستجو کرد. مطمئناً مایکروسافت درصدد توسعه‌ی دستیار هوشمندی بوده است که زیاد نامناسب و کپی شده به نظر نرسد. کورتانا در داستان بازی هیلو، شخصیتی است که همیشه در کنار مسترچیف (رئیس بزرگ) قرار گرفته و هم‌اکنون مایکروسافت این دستیار هوشمند را از از هیلو به ویندوزفون 8.1 انتقال داده و همگان را از نعمت وجود کورتانا بهره‌مند ساخته است. سرویس‌های مشابه همچون گوگل ناو، تمرکز بالایی روی داده‌های موجود در ابزار مورد استفاده‌ی کاربران دارند که علی‌رغم بهره‌مندی از اطلاعات خوب آن‌ها، می‌تواند در برخی اوقات به دلیل صدور اعلانیه‌های بی‌پایان، موجبات مزاحمت برای کاربر را فراهم کند؛ شاید در برخی مواقع نیز کاربران احساس خوشایندی نسبت به در اختیار داشتن اطلاعات زیاد از کاربر توسط این سیستم‌هوشمند نداشته باشند. برای پیشگیری از توسعه‌ی چنین سیستمی، مایکروسافت با شماری از مشهورترین و کاربلدترین دستیارهای شخصی موجود به گفتگو پرداخت و نتیجه‌ی این گفتگوها به توسعه‌ی سیستمی هوشمند با در اختیار‌داشتن اطلاعات کلیدی وعلایق کاربر است منتهی شد.

مایکروسافت با این پس زمینه ی ذهنی، کورتانا را همچون یک دفتر راهنمای شخصی توسعه داد که می‌توانست در صورت یافتن اطلاعات مفید شخصی یا هر آنچه که از نظر خود سیستم به درد بخور است، به خود اضافه کند. این یک لیست صرفاً دربردارنده‌ی اطلاعات حریم خصوصی کاربران نبوده و در واقع می‌توان آن را دربردانده‌ی اطلاعاتی دانست که کورتانا موفق به جمع‌آوری از شما شده است. این اطلاعات را می‌توان به نگرش کورتانا از کاربران تعبیر کرد؛ اما یکی از مهم‌ترین قابلیت‌های موجود، امکان حذف یکباره‌ی اطلاعاتی است که کاربر علاقه‌ای به ذخیره‌ی آن توسط کورتانا ندارد. این امکان از طریق گفتن عبارت "That's not right, I don't want you to know this" در اختیار کاربر قرار گرفته است. همچنین با گفتن عبارت "I'm comfortable with you reading my email" رضایت خود از کسب اطلاعات توسط کورتانا را به این سیستم نشان می‌دهید. از این‌رو کاربر کنترل کاملی روی تمامی اطلاعاتی دارد که کورتانا می‌تواند از آن داده‌هایی را برای خود جمع‌آوری کند. تمامی اطلاعات کورتانا در سرویس ذخیره‌ی ابری نگهداری می‌شوند و کاربران می‌توانند اطلاعات مربوط به مخاطبان، محل کار و زندگی و علایق خود را در اختیار این دستیار هوشمند قرار دهند. نگرش توسعه‌ی کورتانا بصورت یک دستیار که یک دفترچه‌ی مملو از اطلاعات درباره‌ی کاربر دارد، برخلاف چیزی است که تیم توسعه‌دهنده از ابتدا در نظر داشته تا آن را توسعه دهد. کورتانا همچنین قادر است تا الگوی رفتاری کاربر را از طریق مکالمات، نحوه‌ی استفاده از تلفن‌هوشمند و مکان‌هایی که کاربر در آن‌جا حاضر می‌شود، فراگیرد. می‌توان از طریق وارد‌کردن متن یا دستورات صوتی با کورتانا ازتباط یرقرار کرد؛ اما این سیستم در هر حالت درصورت یافتن اطلاعات جدید، در مورد ذخیره‌ی آن کاربر را مورد سؤال قرار می‌دهد.

CortanaInt2

درصورت اجرای کورتانا برای اولین بار، این سیستم سؤالاتی ابتدایی را که هر شخصی برای آشنایی با افراد دیگر از آن می‌پرسد، از کاربر سؤال می‌کند که شامل سؤالاتی چون اسم شما چیست، چه غداهایی را ترجیح می‌دهید، چه نوع فیلم‌هایی را می‌پسندید و شماری دیگر از این سؤالات می‌شود. از این پس با کلیک روی کلید جستو در ویندوزفون، کورتانا فعال می‌گردد که می‌توان با کشیدن انگشت روی آن به سمت بالا،  اطلاعات کسب شده را بصورت لیست‌وار نظاره کرد. این قابلیت تا حدودی شبیه کارت‌های موجود در گوگل ناو است، شامل اطلاعاتی از پرواز‌های هواپیما، نتایج ورزشی، نتایج بورس و هرچیز دیگری است که در اختیار کورتانا قرا گرفته و در منبع اطلاعاتی خود ذخیره کرده است. کاربران قادرند تا منبع اطلاعاتی کورتانا را بصورت دستی نیز با وارد‌کردن علایق شخصی، یادآوری‌ها، اخبار و همچنین وارد‌کردن تاریخ‌های پراهمیت برای خود آموزش دهند. کورتانا به‌عنوان یک قطب اطلاعاتی ایفای نقش می‌کند که اطلاعات آن در قالب کارت‌های اطلاعاتی یا کاشی‌های زنده در منوی استارت و اعلانیه‌ها در Action Center جدید تعبیه شده در ویندوزفون 8.1 نمایش داده می‌شود. برای مثال درصورت تغییر نتیجه‌ی تیم فوتبال مورد علاقه‌ی کاربر، این مسأله در کسری از ثانیه توسط کورتانا ودر قالب اعلانیه‌ای به کاربر اطلاع داده می‌شود. درصورت ورود به یک کشور دیگر، کورتانا کاربر را با اطلاعاتی از قبیل وضعیت آب و هوایی، نرخ تبدیل پول و نقشه‌های مورد نیاز تغذیه خواهد کرد. درصورت نگارش یا مشاهده‌ی یک ایمیل یا پیام متنی، اصطلاحاتی چون ملاقات‌ها با یک خط در زیر نمایش داده می‌شود که کورتانا امکان تبدیل آن به یک یادآور در تقویم را ممکن می‌کند.

CortanaInt3یکی از کاربردی‌ترین قابلیت‌های کورتانا قابلیت فعال‌سازی یک اعلانیه یا وظیفه به‌شرط انجام کار دیگری است. می‌توان این ویژگی را شبیه به IFTTT دانست. برای مثال می‌توان به کورتانا سپرد تا در زمان برقراری تماس تلفنی با شخص خاصی، موضوعی را یادآوری نماید؛ در اینصورت هر زمانی که کاربر اقدام به برقراری تماس با آن مخاطب خاص نماید یا مخاطب مشخص شده نیز با کاربر تماس بگیرد، کورتانا موضوع مربوطه را به کاربر یادآوری خواهد کرد. این قابلیت بسیار کاربردی است؛ اما کورتانا قدرت واقعی خود را در زمان جستجو نمایش خواهد داد. برای مثال درصورتی که کاربر در مورد بهترین رستوران موجود در نزدیکی خود از کورتانا سؤال بپرسد، این سیستم همچون سیری، لیست بلندبالایی از رستوران‌های موجود در نزدیکی کاربر را نمایش نمی‌دهد! بلکه با جستجو، نام یک رستوران که بیشترین امتیاز را از کاربران سرویس Yelp از آن خود کرده، برای کاربر به‌عنوان یک رستوران مناسب نشان می‌دهد. اما در صورتی که در سؤال خود بهترین رستوران‌ها را مورد سؤال قرار داده باشید، در این حالت کورتانا لیستی را پیش روی شما قرار می‌دهد. کورتانا در بکار بردن لغات بصورت جمع یا مفرد نیز با نهایت دقت عمل می‌کند. پس از ارائه‌ی بهترین رستوران یا انتخاب رستوران از لیست بهترین‌ها، در صورت به زبان راندن" Call it" یا "give me directions" کورتانا متوجه منظور شده و آدرس رستوران را برای شما نمایش می‌دهد. تمامی این مراحل با بکارگیری دستورات صوتی ممکن می‌شود.

در ویندوزفون 8.1، کورتانا چیزی بیشتر از یک نماد دایره‌‌ای درخشان است. مایکروسافت کورتانا را همراه با شخصیت و صفات انسانی توسعه داده است. برای مثال درصورتی که از وی "Who's your father" را بپرسید، این سیستم چنین پاسخ می‌دهد: "Technically speaking, that'd be Bill Gates. No big deal". این سیستم پاسخ سؤالات دیگر را نیز می‌دهد و گاهی اوقات نیز منظور خود را با نمایش نمادهای احساسی به کاربر ابراز می‌کند. این سیستم در برخی مواقع همچون لحظاتی که برای مثال، نتیجه‌ی بازی تیم شما در یک مسابقه‌ی فوتبال تغییر یافته، بسته به نتیجه با استفاده از واکنش‌هایی در قالب نماد‌های احساسی و نمادهای کارتونی، کاربر را مطلع ساخته و در واقع با کاربر همزادپنداری می‌کند. تیم توسعه‌دهنده‌ی کورتانا وعده‌ی ویژگی‌های دیگری را نیز داده است که در ادامه این سیستم به آن‌ها تجهیز خواهد شد.

مایکروسافت در پروسه‌‌ی توسعه‌ی کورتانا با توسعه‌دهندگان بازی هیلو که استودیوی 343 است، برای توسعه‌ی المان‌های نمایشی چشمی و همچنین با جن‌تیلور که یک بازیگر است، برای صدای کورتانا استفاده کرده است. این بازیگر تجربه‌ی ایفای صدای شخصیت‌های کارتونی را دارد که مشهورترین آن شخصیت کورتانا در سری بازی‌های هیلو است. استفاده از صدای تیلور که برای کاربران و دوست‌داران هیلو یک صدای شناخت شده است، برای مایکروسافت یک موقعیت بسیار خوب بود. آش در این مورد چنین اظهار نظر کرده است:

تیلور در جریان توسعه‌ی دستیار صوتی هوشمند ویندوزفون 8.1 نقش پررنگی را به عهده گرفته و در توسعه‌ی این فناوری بسیار تأثیرگذار خواهد بود.

صدای وی در مورادی که کورتانا نیاز به انجام مکالماتی دوستانه را دارد به کار گرفته خواهد شد.

برای مثال در مواقعی که سؤالی از مسترچیف (شخصیت بازی هیلو) از کورتانا بپرسید، شاهد مکالمه با صدای تیلور خواهیم بود؛ در غیر اینصورت در مواقعی که نیاز به ارائه‌ی اطلاعاتی کوتاه است، شاهد استفاده از صدای سینتیسایز شده از تیلور خواهیم بود.

مایکروسافت این سیستم هوشمند را در عرض دو سال توسعه نداده است؛ بلکه مایکروسافت برای پنج سال در حال سرمایه‌گذاری و بسترسازی اطلاعاتی برای توسعه‌ی این سیستم بوده است. کورتانا وابستگی زیادی به سرویس‌های بینگ دارد که این سرویس نیز متشکل از چندین هزار سروری است که در پشت صحنه در حال داده‌کاوی و تغذیه‌ی کورتانا هستند. مهندسان توسعه‌دهنده‌ی کورتانا همکاری نزدیکی با متخصصان توسعه‌دهنده‌ی سرویس بینگ داشته‌اند تا با همکاری یکدیگر کورتانا را وارد حیات نمایند. همانطور که گوگل ناو به سرویس جستجوی گوگل وابسته است، کورتانا نیز وابستگی شدیدی به سروسی جستجوی بینگ دارد.CortanaInt4

هرچند شاید به‌نظر برسد مهندسان توسعه‌دهنه‌ی سرویس بینگ دخالتی در توسعه‌ی کورتانا نداشته باشند، اما این افراد از دیدن محصول نهایی که کورتانا است، بسیار هیجان زده شده‌اند که نشان از مشارکت این افراد در توسعه‌ی دستیار صوتی هوشمند مایکروسافت دارد. مایکروسافت سرویس بینگ را از یک موتور جستجوی صرف به یک پلتفرم و سرویس جست‌جوی با قابلیت تأمین داده‌های مورد نیاز تبدیل کرده است. مهندسان در سال‌های اخیر سرویس‌های متعددی را برای کورتانا توسعه داده‌اند که مجموع این سرویس‌ها منجر به قدرت بالای بینگ شده است. از جمله‌ی این جزئیات میتوان به سیستمی برای پردازش زبان طبیعی و تعمیم اشیاء و موجودیت‌های موجود در جهان واقعی به داده‌های موجود در وب اشاره کرد که توسعه‌ی آن مستلزم بهره‌مندی از آخرین یافته‌ها و دستاورهای دانشمندان در رشته‌های چون زبان‌شناسی در ورای متخصصان فعال در حوزه‌ی کامپیوتر است. در صورتی که سرویس بینگ را به منزله‌ی یک خانه‌ی بزرگ و زیبا در نظر بگیریم، کورتانا یک خودروی شیک و زیبا است که در پارکینگ این خانه جا خوش کرده است.

برای پیشبرد طرح توسعه‌ی کورتانا در سرویس بینگ، مایک‌کالکاینو، مدیر توسعه در بینگ، به تیم توسعه پیوسته و اصلی‌ترین وظیفه‌ی وی، مدیریت توسعه‌ی بخش‌هایی از کورتانا بوده است که ریشه در سرویس‌های بینگ دارد.

وی در این مورد چنین اظهار نظر کرده است:

نگرش من در زمان آغاز کار بدین صورت بود که از نظر من باید تمامی سرویس‌های مرتبط و مورد نیاز به نحو احسن توسعه داده می‌شد و سپس تمامی موارد برای تشکیل ساختار اصلی در کنار هم قرار می‌گرفت.

تیم توسعه‌دهنده‌ی بینگ به مدیریت کالکاینو، به قدری از وقت استراحت و غیر کاری خود را در کنار تیم توسعه‌دهنده‌ی ویندوزفون برای پیشبرد کورتانا صرف کردند که به‌نظر می‌رسید محل کار آن‌ها رستورانی در شهر واشنگتن است.

کالکاینو در این مورد می‌گوید:

براستی ما زمان بسیار زیادی را با تیم توسعه‌ی کورتانا در ویندوزفون گذراندیم بطوریکه در قالب یک تیم به پیشبرد طرح یاری می‌رساندیم. ما در این پروژه زندگی کردیم و نتیجه‌ی آن یعنی کورتانا با تمام ویژگی‌های خارق‌العاده‌ی آن بود.

توسعه‌ی کورتانا یکی از فلسفه‌های کاری مایکروسافت با نام کار بصورت یکتاست که استیوبالمر پیش از ترک پست مدیریت، تمامی کارکنان را به تبعیت از آن فراخوانده بود.

CortanaInt5

کورتانا را باید اولین محصول از ترکیب سرویس‌های متعدد پلتفرم بزرگ بینگ بنامیم؛ از این‌رو می‌توان به علت قراردادن بتا در پس نام این سیستم پی برد؛ چراکه این سرویس هنوز در حال توسعه است. این سیستم نیازمند یادگیری به مرور زمان است تا از این طریق قادر به نمایش تمام قابلیت‌های کاربردی خود باشد. یکی از مهم‌ترین قسمت‌هایی که باید به نحو احسن توسعه داده شود، سیستم شناسایی صدا و همچنین گفتار است. این سرویس در ابتدا در ایالات متحده در اختیار کاربران قرار خواهد گرفت. در آخرین روزهای منتهی به عرضه‌ی رسمی این سیستم، تیم توسعه‌دهنده‌ی کورتانا همچنان در حال رفع ایرادها و مشکلات موجود بوده است. ویش‌ ولادیمینی، یکی از اصلی‌ترین برنامه‌نویسان این سیستم، روزهایی را به خاطر می‌آورد که از ساعت 7 صبح تا 11:30 شب در حال کار روی توسعه‌ی این سیستم بوده است. سیستم یادگیری کورتانا قابلیت فراوانی داشته و فهرست‌بندی خود را از میان میلیون‌ها داداه‌ی موجود، بصورت روزانه انجام می‌دهد. وی معتقد است که تمامی تلاش‌های انجام شده برای توسعه‌ی کورتانا به سرمنزل مقصود خواهد رسید.

یکی از مدیران بینگ در مورد کورتانا چنین اظهار نظر کرده است:

دیدگاه پیش‌ روی توسعه‌ی کورتانا، گسترش دامنه‌های آن به مرز‌هایی فراتر از ویندوزفون است.

اما استراتژی مایکروسافت به روشنی مشخص نبوده و هنوز نمی‌توان بصورت قطعی در مورد جایگاه اصلی و اهداف مایکروسافت از توسعه‌ی آن سخن به میان آورد. این سرویس قابلیت استفاده توسط اپلیکیشن‌های موجود در اکوسیستم را دارد. برای مثال می‌توان از اپلیکیشن هولو فقط با صدور دستور صوتی درخواست کرد که آخرین قسمت از یک سریال را برای کاربر پخش کند و در اینصورت اپلیکیشن با جستجوی مورد مربوطه، آن را برای کاربر به نمایش خواهد گذاشت.

مایکروسافت با مشاهده‌ی قابلیت‌های سیستم‌های مشابه توسعه داده شده توسط گوگل و اپل، پتانسیل بالای این سیستم را مشاهده کرده و با ترکیب قابلیت‌های مهم و کاربردی سیری و گوگل ناو، سعی دارد تا کورتانا را به کل اکوسیستم خود که شامل ایکس‌باکس، ویندوز و سایر محصولات مایکروسافت است، تعمیم دهد. شاید در آینده کاربران نسخه‌ی وب بینگ از یک صفحه‌ی شخصی شده برای خود استفاده نمایند که اعلانیه‌ها در قالب صفحه‌ی بینگ به کاربر نمایش داده شود. مایکروسافت بستر لازم برای گسترش کورتانا را در اختیار دارد که شامل میلیون‌های پی‌سی مبتنی بر ویندوز، سنسورهای صوتی و تصویری کینکت و تلفن‌های‌هوشمند مبتنی بر ویندوز است.

از سراسر وب

  دیدگاه
کاراکتر باقی مانده
تبلیغات