پیروزی در رقابت یادگیری ماشین فقط با برتری در حوزه‌ی داده امکان‌پذیر می‌شود

سه‌شنبه ۴ دی ۱۳۹۷ - ۲۲:۰۰
مطالعه 7 دقیقه
یادگیری ماشینی یکی از فناوری‌های پرطرفدار و مهم‌ امروزی محسوب می‌شود. برای برتری در این صنعت جدید، جمع‌آوری داده نقش حیاتی دارد.
تبلیغات

یادگیری ماشین اصطلاحی است که عموما با هوش مصنوعی نیز اشتباه گرفته می‌شود. این فناوری درحال‌تبدیل به دارایی باارزشی برای شرکت‌ها است. به‌علاوه، شرکت‌های فعال در حوزه‌ی طراحی و بهینه‌سازی یادگیری ماشین، به‌نوعی متوجه مشکلات اصلی آن شده‌اند. آن‌ها می‌دانند اجرای الگوریتم‌ها برای هوشمندشدن در ارتباط با مرکز داده یا مسئله‌ای مشخص، بخش آسان کار محسوب می‌شود.

راهکارهای متعدد و آسان شرکت‌های بزرگ برای اجرای سیستم‌های یادگیری ماشین عرضه شده‌اند. به‌عنوان مثال، گوگل با الگوریتم متن‌باز تِنسورفِلو (TensorFlow) و مایکروسافت با ارائه‌ی خدمات یادگیری ماشین در آژور (Azure) و آمازون با سرویس سیج‌مِیکر (SageMaker)، قابلیت‌های مذکور را به کاربران عرضه می‌کنند.

داده، ورودی باارزش سیستم‌های یادگیری ماشین و هوش مصنوعی، تنها بخشی است که تجاری نشده است. باوجوداین، داده‌ها به‌عنوان بازیگران مهم و تأثیرگذار در رقابت یادگیری ماشین شناخته می‌شوند. درواقع، پیداکردن داده‌ی باارزش دشواری‌های زیادی دارد.

کپی لینک

داده‌ی باارزش و مفید و کمیاب

شرکت‌ها برای انجام پروژه‌های هوش مصنوعی و یادگیری ماشین، داده‌ی لازمشان را دراختیار ندارند. به‌همین‌دلیل، داده درحال‌تبدیل به بازیگری تأثیرگذار در صنعت است. در دهه‌های گذشته، شرکت‌ها فعالیت و موفقیت خود را برپایه‌ی دارایی‌های فیزیکی و مالی، یعنی پول و اجناس تثبیت کرده‌اند. حتی در سال ۲۰۱۳ یک جایزه‌ی نوبل برای طرحی در زمینه‌ی قیمت‌گذاری روی دارایی‌ها درنظر گرفته شد. چنین جایزه‌ها و رویدادهایی اولویت پرداختن به موضوعات ذکرشده را بیش‌ازپیش کرد.

Sharing economy

شرکت‌های موفق دنیای امروز با دارایی‌ها و محصولات فیزیکی تجارت نمی‌کنند. به‌بیان‌دیگر، اغلب دارایی باارزش آن‌ها محصولاتی تحت‌شبکه یا نرم‌افزار هستند. در چهل سال گذشته، تمرکز دارایی‌ها به‌طور کامل تغییر کرده است. در سال ۱۹۷۵، حدود ۸۳درصد از دارایی شرکت‌ها اندازه‌گیری‌کردنی بود و در سال ۲۰۱۵، ۸۴درصد از دارایی‌ها اندازه‌گیری‌کردنی نبود.

دارایی‌های امروزی شرکت‌ها دیگر اندازه‌گیری‌کردنی نیست

اکثر شرکت‌های بزرگ امروزی به‌جای ساخت محصولات فیزیکی مانند ماشین لباس‌شویی یا قهوه‌ساز، اپلیکیشن منتشر یا به اتصال هرچه راحت‌تر مردم کمک می‌کنند. چنین تغییراتی نوعی ناهماهنگی بین آنچه اندازه‌گیری‌کردنی است و آنچه ارزش دارد، ایجاد کرده است.

نتیجه‌ی تغییر در ارزش واقعی شرکت‌ها و محصولات آن‌ها، کمبود داده‌ی باارزش در سطوح مشکل‌ساز است. به‌بیان‌دیگر، فاصله‌ی بین ارزش‌های بازار و محاسبات مسئولان مالی دنیای کسب‌وکار روزبه‌روز بیشتر می‌شود. به‌‌دلیل همین فاصله‌ها، شرکت‌ها بیشتر تلاش می‌کنند تا از فناوری یادگیری ماشین در تصمیم‌های مهمشان استفاده کنند.

برخی شرکت‌ها حتی ارزشمندترین مشاوران خود را نیز با هدف اجرای یادگیری ماشین اخراج کردند؛ اما اکثرا به این نتیجه رسیدند که داده‌ی لازم آن‌ها برای استفاده در سیستم‌های هوش مصنوعی، هنوز وجود خارجی ندارد. به‌‌عبارت‌دیگر، سیستم‌های کنونی و فناوری‌ها و روش‌های جدید را روی همان مواداولیه‌ی قدیمی و داده‌های ضعیف پیاده می‌کنند.

data

سیستم یادگیری ماشین نیز تاحدودی مانند انسان عمل می‌کند؛ یعنی تا وقتی به آن آموزش ندهیم، هوشمند نخواهد شد. به‌علاوه، ماشین‌ها برای هوشمندشدن بسیار بیشتر از انسان به داده نیاز دارند. البته، آن‌ها قطعا این داده‌ها را با سرعت بسیار بیشتری درمقایسه‌با انسان‌ها می‌خوانند. بنابراین، با وجود رقابت شرکت‌ها در جذب متخصصان هوش مصنوعی و اجرای برنامه‌های مرتبط، جنگی در پشت صحنه جریان دارد که هدف اصلی آن، دستیابی به داده‌های جدید و متفاوت است.

داده‌های سنّتی در سیستم‌های یادگیری ماشین کاربردی ندارند

به‌عنوان مثالی از داده‌ی متفاوت و کاربردی در دنیای جدید،‌ می‌توان حوزه‌ی مالی و اقتصادی را نام برد. در این حوزه، دیگر گزارش‌های رسمی سازمان‌های مالی خصوصی و دولتی یا آمارهای سرمایه‌گذاران باتجربه در تصمیم‌گیری‌های سرمایه‌گذاری مفید نیستند.

داده‌های جایگزین همچون حس موجود در رسانه‌های اجتماعی و تعداد پتنت‌های ثبت‌شده، از دو زاویه باارزش‌ محسوب می‌شوند: ۱. داده‌های سنّتی روی دارایی‌های سنّتی متمرکز هستند که در دنیای دارایی‌های اندازه‌گیری‌نشدنی آن‌چنان ارزشمند نیستند؛ ۲. فایده‌ای در استفاده از یادگیری ماشین برای تحلیل داده‌هایی وجود ندارد که همه از آن استفاده می‌کنند.

به‌بیان‌ساده، جست‌وجو برای مزیت رقابتی در همان مواداولیه‌ای که دیگر رقبا استفاده می‌کنند، سودی برای شرکت‌ها نخواهد داشت. شرکت‌های بزرگ به‌جای اجرای استراتژی‌های قدیمی، به‌دنبال داده‌های جدید و یافتن ارتباط و مزیت در آن‌ها هستند. این سازمان‌ها برای پیشبرد اهداف خود حتی دیتاست‌های اختصاصی تولید می‌کنند.

data science
کپی لینک

به چه اطلاعاتی نیاز دارید؟

تولید داده دشوارتر از جمع‌آوری و هماهنگ‌کردن و افزودن آن به مرکز داده خواهد بود. اکثر شرکت‌ها تصور می‌کنند مسیر صحیح شامل جمع‌آوری همه‌ی داده‌های دردسترس و جست‌و‌جو و تحلیل آن‌ها به امید یافتن راهکاری تازه است. درواقع، آن‌ها به‌دنبال نتیجه یا پیش‌بینی هستند که نتیجه‌ی دلخواهشان را نشان دهد.

هوش مصنوعی و یادگیری ماشین توانایی ارائه‌ی نتایج و تحلیل‌هایی دارد که شاید از عهده‌ی هیچ فردی برنیاید؛ اما این فناوری نمی‌تواند نتایج را با ثبات کامل ارائه کند. این نتیجه‌گیری به‌معنای شکست فناوری مذکور نیست؛ بلکه تنها باید آن را با هوشمندی به‌کار گرفت. البته، اجرای آن بسیار دشوارتر از مباحث تئوری است. به‌عنوان مثال، بسیاری از مدعیان ارائه‌ی داده‌های جدید و متفاوت هنوز از اندازه‌گیری معیارهای سنّتی برای جمع‌آوری داده استفاده می‌کنند.

قدمی که اکثر شرکت‌ها در اجرای سیستم هوش مصنوعی و تولید داده نادیده می‌گیرند، تعیین اولویت است. یادگیری ماشین در اخذ بینش انسان‌ها و توسعه‌ی روشی سریع‌تر و درک‌کردنی‌تر و مقیاس‌پذیرتر برای اجرای آن بینش مهارت دارد. انسان‌ها نیز بینش و دیدگاه خود را با استفاده از روش‌های مختلف از تخمین تجربی گرفته تا تحلیل ارتباط شرکت‌ها به‌دست می‌آورند.

تحلیل داده

برای بهره‌برداری از برتری یادگیری ماشین در حوزه‌های مذکور، نباید آن را با هر اطلاعات موجود و تقریبا مرتبط‌با حوزه‌ی فعالیت تغذیه کرد؛ بلکه دانشی منظم و ساختاریافته را به آن باید عرضه کرد. پس از ارائه‌ی داده‌ی مناسب، می‌توان امیدوار بود که هوش مصنوعی آن را بیاموزد و شاید مرزهایی از دانش کنونی انسان را فراتر ببرد.

کپی لینک

بینش یادگیری ماشین با داده‌های متفاوت ایجاد می‌شود

برای شرکت‌هایی که قصد دارند کاربردی تأثیرگذار از هوش مصنوعی و یادگیری ماشین را در روند کاری خود اجرا کنند، سه اصل وجود دارد. 

برای رسیدن به نتایج متفاوت به مواداولیه‌ی متفاوت نیاز داریم

اصل اول در اجرای سیستم یادگیری ماشین کاربردی، جمع‌آوری یا تولید داده‌ی متفاوت است. شما با کارکردن با داده‌های دردسترس رقبا، به یافته‌ی جدیدی دست نخواهید یافت. پیش از شروع، نگاهی به داخل سازمان خود بیندازید. باید آنچه شما و اعضای گروهتان به‌طور اختصاصی می‌دانید، به‌عنوان پایه‌های دیتاست هوش مصنوعی استفاده شود.

اجرای یادگیری ماشین به نقاط داده‌ی زیادی نیاز دارد؛ اما به آن معنی نیست که مدل شما گستره‌ی وسیعی از اطلاعات را باید پوشش دهد. به‌عبارت‌دیگر، پس از تغییر زمینه‌ی مطالعه‌ی داده، تمرکز فعالیت خود را مشخص کنید و به آن پایبند باشید.

کاربرد‌های یادگیری ماشین در کسب و کارها

در اصل دوم، باید ارزش داده‌ی معنادار درمقایسه‌با داده‌ی جامع را درک کنید. شاید شما در روند جمع‌آوری داده اطلاعاتی قوی و جزئی فراهم کنید؛ اما حوزه‌ی آن اطلاعات هیچ کاربردی برای سازمان نداشته باشد. در تعریف ساده، اگر شرکت از چنین داده‌هایی در فرایندهای تصمیم‌گیری گذشته استفاده نکرده، آن‌ها فایده‌ای برای سیستم یادگیری ماشین هم نخواهند داشت.

پایگاه داده‌ها را با اطلاعات منحصر‌به‌فرد دراختیارتان بسازید

متخصص حرفه‌ای حوزه‌ی یادگیری ماشین پیش از معماری سیستم، از مدیران شرکت سؤال‌هایی دشوار درباره‌ی زمینه‌های مهم می‌کند. به‌علاوه، او باید بداند زمینه‌های مهم چگونه در به‌کارگیری نتایج استخراج‌شده از هوش مصنوعی استفاده می‌شوند. اگر پاسخ به سؤال‌های متخصص برای شرکتتان دشوار باشد، درنتیجه هنوز تفکر لازم درباره‌ی ایجاد ارزش کاربردی از این حوزه را به‌کار نگرفته‌اید.

اصل سوم به‌کارگیری یادگیری ماشین به این نکته تأکید می‌کند که از دانش خود برای شروع کار استفاده کنید. شرکت‌های موفق در اجرای سیستم‌های یادگیری ماشین فرایند را با بینش اختصاصی خود درباره‌ی اولویت اصلی کاری در تصمیم‌گیری‌ها شروع می‌کنند. شروع از این مرحله به آن‌ها در انتخاب داده‌ها برای جمع‌آوری و فناوری‌های لازم کمک می‌کند.

نقطه‌ی مناسب برای شروع فرایند یادگیری ماشین، مقیاس‌دهی و رشد دانشی است که درحال‌حاضر، در تیم وجود دارد. رشد آن دانش در مسیر تولید ارزش برای شرکت مفید خواهد بود.

نکته‌ی کاملا واضح آن است که نرم‌افزار جهان را خورده است. این اصطلاح را مارک اندرسن، کارآفرین حوزه‌ی نرم‌افزار، بیان کرده است. البته، پدیده‌ی جوان دنیای فناوری هنوز سیر نیست و به رژیمی بهتر متشکل از داده‌های جدید و فناوری‌های نوین نیاز دارد. با چنین رژیم جدیدی می‌توان هنوز با نرم‌افزار ارزش خلق کرد.

شرکت‌ها و مدیرهای آن‌ها نمی‌خواهند از تغییر درحال‌جریان در تفکرها و ماشین‌ها و داده‌های جدید عقب بمانند. برای این منظور آن‌ها باید نگاهی به درون خود بیندازند و داده‌های باارزش با زوایای دید متفاوت را کشف کنند. تنها با چنین مواداولیه‌ای می‌توان نتایج بهتری کسب کرد و شرکت را در رقابت نگه داشت.

مقاله رو دوست داشتی؟
نظرت چیه؟
داغ‌ترین مطالب روز
تبلیغات

نظرات