در این مقاله سه متخصص در این زمینه دیدگاههای خودشان را با ما به اشتراک می گذارند.
بعضی از مجموعه داده ها فراتر از درک ما هستند. آن ها گسترده و پیچیده هستند و به همین دلیل، بدون کمک قادر به تجزیه و تحلیل آن ها نیستیم. به خصوص زمانی که از الگوریتمهای خودکفای یادگیری ماشین استفاده میکنیم.
به عقیده مگان هیکی ( مهندس یادگیری ماشین در شرکت هوش مصنوعی pryon ) : “این الگوریتم ها دیدگاه هایی را جمع آوری می کند که به دلیل پراکندگی و انتزاعی بودن، یک انسان نمی تواند به خوبی در دنیا مشاهده کند.”
می تواند به این معنی باشد که نمیتوان الگو هایی که انسان قادر به دیدن آن ها نیست – مانند یادگیری تشخیص نشانههای سرطان که انسان با چشم قادر به دیدن آن نیست – اطلاعات بیشتری جمع آوری کند، یا تجزیه و تحلیل های انسانی را با سرعتی فراتر از انسان انجام داد.
شرکت Tamr را در نظر بگیرید. این شرکت یک بستر برای تجزیه و تحلیل داده به نام Unify ایجاد می کند که کاربران اغلب از آن برای ادغام مجموعه داده های دارای تداخل استفاده می کنند. برای مثال اگر دو بانک که با یکدیگر همکاری می کنند بخواهند اطلاعات کاربران را با یگدیگر به اشتراک بگذارند، باید مطمئن شوند که اطلاعات هر کاربر دو بار در مجموعه اطلاعاتی ثبت نشده است. مثلا دو فرد با نامهای Jane Z. Doe و Jane Zamboni Doe را در نظر بگیرید که آدرس مشابهی دارند که درحقیقت یک فرد هستند ولی رایانه قادر به تشخیص این دو اسم و یکی درنظرگرفتن آن نیست که به اصطلاح به آن ” تطبیق درهم ” می گویند.
این اتفاق تازهای نیست، یادگیری ماشین بیش از ده سال است که در این زمینه فعالیت دارد اما اخیرا علاقه افراد به این زمینه بسیار زیاد شده است. حجم جستجو برای عبارت “یادگیری ماشین” از سال ۲۰۱۶ تقریباً دو برابر شده است و الگوریتم های یادگیری ماشین نقش گسترده ای در فناوری روزمره اجرا می کنند.
مهندسان یادگیری ماشین نقش کلیدی در این زمینه دارند. در حالی که گاهی اوقات الگوریتم های یادگیری ماشینی را می سازند ، بیشتر اوقات این الگوریتم ها را در نرم افزارهای موجود ادغام می کنند. این کار با اتصال الگوریتم ها به خطوط داده های مربوطه و فشرده سازی آن ها انجام می شود تا سیستم های رایانه ای اطلاعات اضافی را ثبت نکنند؛ در نهایت آن ها را با رابط های بصری تقویت میکنند.
مطالب زیر شاید برای شما هم جالب باشد. ما در ادامه این مقاله با سه مهندس یادگیری ماشین درمورد شغل آن ها و اینکه چگونه فعالیت خود را در این رشته شروع کرده اند، صحبت میکنیم.
چه عواملی به شما کمک کرد تا اولین شغل خود رادرزمینه یادگیری ماشین را بدست آورید؟
مگان هیکی ( Meghan Hickey ) :
مهندس یادگیری ماشین در pryon
چند سال پیش ، من کلاس های برنامه نویسی را گذراندم و از تمام داده های زبانی که در اینترنت تولید می شد، واقعاً هیجان زده شدم. بسیاری از ارتباطات ما این روزها به صورت آنلاین اتفاق می افتد درنتیجه من زبان شناسی را به عنوان یک دوره کارشناسی ارشد مطالعه کردم و تصمیم گرفتم مدرک کارشناسی ارشد زبانشناسی محاسباتی را بگیرم. ارتباط با افرادی که بوسیله مدرک با آن ها آشنا شدم بسیار برای من مفید بود.
وقتی فارغ التحصیل شدم ، می توانستم مهندس تحقیق در زمینه یادگیری ماشین بشوم و بیشتر در بخش زبانی به پردازش زبان طبیعی متمرکز شوم. من برخی شغل های تحقیقاتی را بر عهده گرفتم، اما متوجه شدم که بیشتر از این که علاقه داشته باشم یک هفته وقت گذاشته و در مورد مساله ای عمیق فکر کنم تا راه حل خلاقانه ای برای آن بیابم، تمایل دارم تا به حل مشکلات فوری تر و همکاری با تیم بپردازم.
نقش فعلی من زمانی که یک استارت اپ درمرحله اولیه خود بود، به من معرفی شد. ما واقعا کار مشخصی در آنجا نداشتیم. مدیر ارشد فناوری ما وقتی دید که علایق من به چه سمتی است، فکر کرد شاید مهندسی برای من مناسب تر باشد. در نتیجه من آن وظیفه را برعهده گرفتم و از انجام دادن آن لذت می برم.
لوک بیلبرو ( Luke Bilbro ) :
مدیر بخش مهندسی داده در شرکت Tamr
این اولین کار یادگیری ماشین من است. من در کار قبلی خود مشاور فنی بودم که پردازش داده های استاندارد را انجام می دادم. این مسئله باعث شد تا درک من در مشکلات اساسی مقیاس داده ها بیشتر شود و فکر میکنم این یکی از اصلی ترین عوامل در یافتن این شغل بود – من احتمالاً در هر مصاحبه ای که انجام دادم به این موضوع پرداختم.
من قبل از آن نقش مشاور، به عنوان یک فیزیکدان در دانشگاه بودم. من الان در ارتباط با فیزیک کاری انجام نمی دهم، اما در کلاسهای درس دانشگاه بطور غیر مستقیم آموخته ام، که چگونه می توانم روی یک مسئله متمرکز شوم و چطور سرسخت باشم. فکر می کنم این هم کمک کرد.
عمران هندلی ( Imran Hendley ) :
مدیر مهندسی یادگیری ماشین در شرکت Attivio
در بسیاری از موقعیت های شغلی در اوایل کارم به عنوان مهندس نرم افزار شروع کردم و بعد از آنکه مشکلاتی در زمینه یادگیری ماشین بوجود آمد، به سمت مهندسی یادگیری ماشین حرکت کردم.
شاید تا پنج سال پیش این به طور رسمی عنوان من نبود تا اینکه من یک سیستم پیش بینی فروش بهتر برای یک شرکت ساختم. آن ها می توانستند تأثیر آن را بطور مستقیم اندازه بگیرند و می خواستند پروژه را گسترش دهند درنتیجه عنوان من را تغییر دادند و تیمی پیرامون سیستم جدید ایجاد کردند.
با این وجود مدت ها قبل از شغل های حرفه ای ام سابقه یادگیری ماشین را داشتم. من از بچگی به آن علاقه مند شده بودم، وقتی که برنامه ای برای بازی شطرنج و برنامه دیگری برای بازی Go ساختم. من در اجرای پروژه های خودم تجربه زیادی کسب کردم.
برای افرادی که به دنبال شروع به کار در زمینه ی یادگیری ماشین هستند ، چه گام های اولیهای، مهم هستند؟
هیکی : برای افرادی مثل من که هیچ سابقهی مهندسی در یادگیری ماشین ندارند، یادگیری Python ، یادگیری مقدمات مهندسی کامپیوتر مانند ساختار دادهها و الگوریتم ها و تقریبا همه این موارد بسیار بسیار مهم هستند. برای افرادی که قبلا مهندس نرم افزار بودند، میخواهند مهندس یادگیری ماشین بشوند یادگیری Python بسیار مهم است و همچنین آشنایی با بعضی مجموعه ابزارها مانند PyTorch.
بیلبرو : هر وقت با کسی برای نقش مهندس یادگیری ماشین مصاحبه می کنم ، همیشه به دنبال سه مورد در آن ها بودم. این را نمی پرسم که آیا آن ها زبان برنامه نویسی خاصی می دانند؟ هر زبانی خوب است اما آیا آن ها می توانند داده های واقعی را رسیدگی کنند؟ داده های واقعی درهم برهم هستند. آن ها نمیتوانند انتظار داشته باشند هر مساله ای مانند سوالات کتابهای درسی دانشگاه باشد.
مورد دوم : آیا آن ها می توانند راه حل های مناسب برنامه نویسی ایجاد کنند؟ باید بدانم که اگر من یک مسئلهای را بطور آزمایشی به آن ها بدهم ، می توانند چیزی را ایجاد کنند که معقول باشد. خوب است که آنها بتوانند ناکارآمدی ها را شناسایی کنند و در مورد الگوریتم های شگفت انگیز با من صحبت کنند، اما من واقعاً به کسی احتیاج دارم که بتواند مانند برنامه نویسان فکر کند.
سومین و آخرین مورد ارتباطات است. برای کاری که در Tamr انجام می دهیم ، باید با هم کار کنیم. من در واقع کسی را ترجیح می دهم که بتواند در مورد راه حل ها با من صحبت کند تا فردی که فقط سر خود را پایین آورده و تلاش می کند مشکل را حل کند. برای فهمیدن اینکه فرد این قابلیت را دارند یا نه، من همراه با طرح مسئلهای، برخی جزئیات را نا گفته میگذارم تا به دنبال یافتن آن ها سوال بپرسند، درصورتی که سوالی نپرسند آن فرد قطعا دچار مشکل خواهد شد.
” درمسیر من، داشتن پایه و اساس قوی در مهندسی نرمافزار بسیار مفید بوده است. اگر در شغل خود این فرصت را ندارید، میتوانید در مورد ساخت محصول خودتان فکر کنید. این محصول می تواند صرفا برای سرگرمی باشد. “
هندلی : من فکر می کنم هیچکس نباید خود را محدود به یک مسیر سنتی کند. اما مطمئناً اگر هنوز مشغول به تحصیل هستید ، از فرصت ها برای تخصص در یادگیری ماشین استفاده کنید. درحال حاضر دانشگاه ها شروع به ارائه مدارک در رشته علوم داده می کنند درصورتیکه من درهنگام تحصیل خود چنین چیزی را ندیده بودم.
در مسیر من داشتن پایه و اساس قوی در مهندسی نرم افزار بسیار مفید بوده است. زیرا هنگامی که در شرکتی به عنوان مهندس یادگیری ماشین فعالیت میکنید اغلب باید محصولات نرم افزاری را درک کنید و به نوعی کار خود را با یک سیستم نرم افزاری موجود، ادغام کنید. اگر در شغل خود این فرصت را ندارید، میتوانید در مورد ساخت محصول خودتان فکر کنید. این محصول میتواند صرفا برای سرگرمی باشد.
آیا فکر میکنید که داشتن مدرک دانشگاهی برای پذیرش شغلی با عنوان مهندسی یادگیری ماشین اهمیت دارد؟ مدرک فارغالتحصیلی موسسات آموزشی چطور ؟
هیکی : من فکر میکنم این بستگی به کاری که میخواهید انجام دید، دارد. بسیاری از موقعیت هایی که برای دانشمندان در زمینه یادگیری ماشین دیده ام نیاز به مدرک استادی یا دکترا دارد که اغلب آن ها یک دکترا را ترجیح می دهند. من به عنوان یک مهندس یادگیری ماشین فکر می کنم شانس دستیابی به این موقعیت با تحصیلات معمولی بسیار پایین است. اگر به عنوان یک مهندس استخدام شوید، می توانید با مطالعه و انجام پروژه هایی در این زمینه، به یک مهندس یادگیری ماشین تبدیل شوید.
بیلبرو : از نظر من دانشگاه مهم است نه موسسات آموزشی. برای من موسسات آموزشی مهم بودند، بیشتر به خاطر اینکه وقتی از دانشگاه فارغ التحصیل شدم به اندازه کافی آماده نبودم. من به موسسات آموزشی از این نظر نیاز داشتم که من را به نقطه ای که میخواستم به آن برسم، متمرکز کنند و توانایی پذیرش چیزهایی را که در آن خوب نبودم را در من بوجود بیاورد. ولی بسیاری از افراد را میشناسم که با تمام شدن دوره دانشگاه و گذراندن چند دوره کارورزی بسیار از من آمادهتر بودند و می توانستند با تجربه کافی شروع به کار کنند.
هندلی : به نظر من دانشگاه خیلی مفید است ولی نیاز نیست. هم اکنون ما تقاضای زیادی برای مهندسین یادگیری ماشین و دانشمندان داده مشاهده می کنیم ولی در آن زمینه ها افراد کافی با مدارک تحصیلی وجود ندارند. بنابراین شرکت ها متوجه شدند که افراد توانمند زیادی با انواع دیگر مدرک ها، اصلاً بدون مدرک ، ولی با تجربه عملی وجود دارند که می توانند برای این کار مناسب باشند.
مسئولیت های اصلی شما در این شغل چیست؟
هیکی : از نظر من محققان یادگیری ماشین این مدل ها را می سازند و همه این تست ها را انجام می دهند. هنگامی که نتایج چشمگیر است و تیم تجاری ما فکر می کند که این مدل ها واقعاً می توانند به مردم کمک کنند، این همان جایی است که کار من شروع می شود. من مدل را انتخاب می کنم و آن را به تولید می رسانم.
این شامل فکر زیادی در مورد نحوه بیان ویژگی ها و دادههای مختلف در کار می شود، تا مطمئن شویم که حافظه ما تمام نشود. این شامل درک نحوه کار مدل ها می شود. هنچنین شامل درک درست از نحوه کار کردن مدل می شود و باید اطمینان پیدا کنم هنگام تلاش برای پیشبرد آن ها از مرحله تحقیقاتی به محیط تولید، به طور تصادفی آن ها را بهم نمیریزم. به عنوان محقق شما باید این آزمایشات گسترده را اجرا کنید مثلا شما باید به طور همزمان ۱۶۰۰ نمونه را از طریق مدل خود به اجرا دربیاورید. اما اگر شما شخیص هستید که در مورد کد نویسی و مهندسی مدل سوال می پرسید، محصول باید به نحو دیگری به نظر برسد. من در زمینه مهندسی آن کارهای زیادی را انجام می دهم تا بتوانم مدل را برای موارد روزمره مورد استفاده قرار دهم.
علاوه بر برای پیشبرد مدل ها، باید مطمئن شویم که گروه مهندسی و گروه یادگیری ماشین بطور موثری با یکدیگر درارتباط هستند.
” هدف این است که همیشه به مشتریان کمک کنیم تا ارزش داده های خود را بدست آورند. من به آن ها کمک می کنم تا بیشترین استفاده را از الگوریتم ها داشته باشند. “
بیلبرو : من وظیفه طراحی راه حل هایی را دارم که در برنامه Unify در شرکت Tamr مورد استفاده قرار می گیرد. در این برنامه هر چیزی، در هسته اصلی آن، الگوریتم یادگیری ماشین است.
هدف این است که همیشه به مشتریان کمک کند ارزش داده های خود را بدست آورند. من به آنها کمک می کنم تا بیشترین استفاده را از الگوریتم ها داشته باشند. بسترهای نرم افزاری Unify دارای هسته ای با پشتوانهای قدرتمند است که می تواند تمام کار های سخت را انجام دهد، کارهایی که بشر در پنج یا ده سال دیگر قادر به انجام آن نیست. اما برای اینکه قابل استفاده باشد، مقدار مشخصی از ادغام سیستم ها و مهندسی ویژگی های سفارشی وجود دارد که من انجام می دهم. من تمام خطوط داده و کلیه ارتباطات را به یکدیگر مرتبط می کنم و مهندسی داده هایی از این قبیل، که دراین صورت قادر به انجام یادگیری ماشین خواهیم بود.
هندلی : در حال حاضر من در حال ارائه دادن بهترین تجربه جستجو ممکن به کاربران نهایی در برنامه های Attivio هستم، که شامل ارائه بهترین نتایج جستجو و درک انواع جستجوهایی است که آنها انجام می دهند که ممکن است شامل ارئه یک رابط کاربری متفاوت باشد و یا عکس العمل های متفاوت ، بسته به اینکه فرد به دنبال پاسخ سوالی است یا به دنبال یافتن اطلاعات تماس یک مخاطب. اگر واقعاً می توانید درخواست های یک فرد را محدود کنید در نتیجه قادر خواهید بود که پاسخ آن را مستقیما در یک پنجره به او نشان دهید نه اینکه مجبور باشد با کلیک بر روی صفحه وب آن را پیدا کند.
چالش برانگیز ترین جنبه ی مهندسی یادگیری ماشین چیست؟
هیکی : یادگیری ماشین به عنوان یک رشته نسبتاً جدید است، بنابراین بسیاری از ابزارهایی که از آن ها استفاده می کنید به خوبی مستند سازی نشده اند. شک و شبهات زیادی در مورد چگونگی به دست آوردن بهترین عملکرد وجود دارد. این واقعاً چالش برانگیز است.
چالش دیگر برقراری ارتباط با افراد در مورد یادگیری ماشین است. اگر یک مدل یک سوال بپرسید ، یک پاسخ خاص دریافت خواهید کرد. سپس از یک مدل سؤالی می کنید که به نظر شما واقعاً مشابه سوال قبلی است، اما ممکن است پاسخ متفاوتی بدست آورید. الگویی که مدل ها می بینند همان الگویی نیستند که شما به عنوان یک انسان می بینید.
بیلبرو : چالش های محاسباتی وجود دارد که در بعضی مواقع کاملا ناامیدکننده به نظر میرسند. ما با شرکتهای زیادی کار می کنیم و من در آن ها وظیفه حل مسائل و مشکلات را دارم. باید مسائلی که موجب بهره وری بیشتر می شود، را شناسایی کنم که ممکن است مساله این باشد که در آن مخاطب من، ۱۲ ساعت با من اختلاف دارد. معمولا مشتریان مهمترین نمایندگان را برای اطلاعات خود استفاده می کنند و هیچ تضمینی وجود ندارد که آن افراد به زبان شما صحبت کنند چه برسد به اینکه در منطقه زمانی شما باشند.
هندلی : گاهی اوقات روبرو شدن با انتظارات کاربران بسیار چالشانگیز است. اگر شما نتایج نامناسبی را به آن ها ارائه دهید، آون ها هیچ وقت آن را فراموش نخواهند کرد، درحالیکه شاید شما چندین بار نتایج خوبی را برای آن ها فراهم کرده باشید.
درAttivio ما به ارائه امکان جتسجو در داده های مختلف به شرکت ها، تخصص داریم. بنابراین ما با بسیاری از فرمت های مختلف داده ها سروکار داریم مانند وب سایت ها، اسناد کلمهای، ایمیل ها، عناوین افراد. بستگی به آنچه که کاربر جستجو می کند که ممکن است جستجوهای آن ها به یک فرمت محدود شود. در نتیجه ما باید انچه که کاربر به دنبال آن است را، به خوبی درک کنیم؛ بدون اینکه گستره جستجوی افراد و رفتارهای مختلف کاربران مشکلی در آن ایجاد کند.
چه جنبه ای از مهندسی یادگیری ماشین بیشتر به شما انگیزه می دهد؟
هیکی : دیدن اینکه افراد چقدر تحت تاثیر سرعت بالای مدل ها قرار می گیرند بهترین پاداش برای ماست. اینکه ببینید چگونه جستجویی که قبلن شش ثانیه و بیشتر طول میکشد، ولی الان در کمتر از یک ثانیه نتیجه ای را ارائه می دهد، به ما خیلی انگیزه میدهید.
بیلبرو : خب، باید بگم که قرار گرفتن در بالاترین سطح از این فناوری در زمینه یادگیری ماشین بسیار خوب است. یادگیری ماشین رشتهی بسیار مهمی است و از آنجایی که علم روز به روز پیشرفت می کند، ماندن در بالاترین سطح از آن سخت خواهد بود. وقتی در این رشته هستید انگار که مدام درحال یادگرفتن نکات جدید هستید و این واقعا زیباست.
هندلی : آنچه بیشترین انگیزه را برای ادامه این کار به من می دهد شناخت مسائل جدیدی است که می تواند به یک صنعت کمک بزرگی کند. حل مسائلی که قبل تر کسی قادر به حل آن ها نبوده یا در صنایع خاصی مورد استفاده قرار می گیرد.
برای کسانی که می خواهند وارد این رشته شوند، چه منابعی را پیشنهاد می کند؟
هیکی : بسیاری از کارهایی که من انجام داده ام در زمینه پردازش زبان طبیعی بوده است. برای افراد علاقهمند منابع زیادی مانند کتاب پردازش گفتار و زبان Dan Jurafsky and James H. Martin وجود دارد.
همچنین اگر شما مهندس هستید و قبلا با این موضوعات روبه رو نبودید، دوره Coursera که توسط Andrew Ng ارائه می شود. گوش دادن به پادکست هایی که به آن Talking Machine می گویند، نیز می تواند شروع خوبی باشد. همچنین یک گروه از فعالان در این رشته در توییتر وجود دارد که Hal Daume III یکی از فعالان مورد علاقه من در این رشته است.
بیلبرو : کارآموزی و یا انجام فعالیت های مرتبط با این رشته بسیار مفید است. یک کارآموزی هشت-ده هفته ای در تابستان می تواند بیشتر از هرچیز به شما کمک کند. همچنین من به خواندن متون وبلاگ های سایت ها علاقه مندم که شرکت Tamr نیز یکی از این وبلاگ ها را دارد، که کمک می کند اطلاعات خود را به روز کنید.
هندلی : منابع آنلاین مفیدی وجود دارند که با هزینه کم و یا رایگان در دسترس هستند مانند دوره ی Fast AI در زمینه یادگیری ماشین.
همچنین پیشنهاد می کنم در رقابت های علوم داده در پلتفرم هایی مانندKaggle نیز شرکت کنید. مثلا در یک مسابقه داده هایی را در اختیار شما قرار می دهند و شما باید براساس آن بهترین پیش بینی ها را نسبت به سایر رقبای خود انجام دهید. ممکن است در این مسابقات، رقبایی وجود داشته باشند که بتوانند بهترین سیستم پیش بینی قیمت را فروش یک خانه را تولید کنند. فکر می کنم این یک راه عالی برای یادگیری، آنچه که به ان هنر ساخت سیستم های یادگیری ماشین می گویند، می باشد.
بیشتر بخوانید :
- متن اکشن فیگور چت جی پی تی | راهنمای کامل + ۱۲ دستور خلاقانه
- راهنمای تبدیل عکس به انیمه با چت جی پی تی + ۲۰ دستور از پرتره تا شاهکار جیبلی
- قوی ترین هوش مصنوعی دنیا
- برنامه ای که سن دقیق را نشان می دهد
- شباهت چهره گوگل