۲۰ کاربرد برتر یادگیری عمیق ۲۰۲۰ در صنایع مختلف

13 نوامبر, 2020 فناوری یک نظر

چند سال پیش هرگز تصور نمی کردیم که برنامه های یادگیری عمیق برای ما خودرو های خودران و دستیاران مجازی مانند الکسا، سیری و دستیار Google را به ارمغان بیاورند. اما امروز، این خلاقیت ها به بخشی از زندگی روزمره ما تبدیل شده اند. یادگیری عمیق همچنان با امکانات بی پایان خود مانند کشف تقلب و بازیابی پیکسل ، ما را مجذوب خود می کند. بگذارید بیشتر کاربردهای یادگیری عمیق در صنایع را بررسی کنیم.

برنامه های برتر یادگیری عمیق در صنایع مختلف

۱- خودرو های خودران
۲- تجمیع اخبار و کشف اخبار جعلی
۳- پردازش زبان طبیعی (NLP)
4- دستیارهای مجازی
۵- سرگرمی (VEVO ، Netflix ، فیلم سازی ، لحظات حساس ورزشی و غیره)
۶- تشخیص بصری
۷- کشف تقلب
۸- سلامت
۹- شخصی سازی ها
۱۰- تشخیص تأخیر رشد در کودکان
۱۱- رنگ آمیزی تصاویر سیاه و سفید
۱۲- افزودن صدا به فیلم های صامت
۱۳- ترجمه خودکار ماشین
۱۴- تولید خودکار دست خط
۱۵- بازی خودکار
۱۶- ترجمه ی تصویر – زبان
۱۷- بازسازی پیکسل
۱۸- توضیحات عکس
۱۹- جمعیت شناسی و پیش بینی انتخابات
۲۰- رویای عمیق

به دنیایی فکر کنید که تصادفات جاده ای یا دعوا های خیبانی وجود نداشته باشد. به دنیایی فکر کنید که هر عمل جراحی بدون این که جان انسان به دلیل خطاهای جراحی به خطر بیافتد، موفقیت آمیز باشد. به دنیایی فکر کنید که هیچ کودکی در معرض فقر قرار نگیرد و حتی آن هایی که دارای محدودیت های ذهنی یا جسمی هستند می توانند از همان کیفیت زندگی که بقیه بشریت از آن برخوردارند، برخوردار شوند. اگر تصور این موارد خیلی سخت است، به دنیایی فکر کنید که می توانید تصاویر قدیمی خود را (تصاویر بدون متادیتای زیاد) را بر اساس پارامترهای مورد نیاز خود (رویدادها ، روزهای خاص ، مکان ها ، چهره ها یا گروهی از افراد) تفکیک کنید.

برنامه های یادگیری عمیق ممکن است برای یک انسان عادی ناامید کننده به نظر برسد ، اما کسانی که این امتیاز را دارند که با دنیای یادگیری ماشین آشنا شوند درک می کنند که یادگیری عمیق با کاوش و حل مشکلات انسانی در هر حوزه در سطح جهانی مورد استفاده قرار می گیرد.

بنابراین ، در اینجا لیستی از برنامه های یادگیری عمیق با توضیحات آورده شده است که مطمئنا شما را متحیر خواهد کرد.

۱- خودرو های خودران

یادگیری عمیق نیرویی است که خودروهای خودران را به واقعیت تبدیل کرده است. برای اجرای این کار، یک میلیون مجموعه داده برای ساخت یک مدل، آموزش ماشین برای یادگیری و سپس آزمایش نتایج در یک محیط امن به سیستم داده می شود. آزمایشگاه های هوش مصنوعی Uber در پیتسبورگ نه تنها در زمینه ایجاد امنیت برای خودرو های بدون راننده کار می کنند بلکه چندین ویژگی هوشمند مانند گزینه های امکانات غذا با استفاده از خودرو های بدون راننده را نیز در آن ها ادغام می کنند.

نگرانی عمده برای توسعه دهندگان خودرو های خودران، مدیریت سناریوهای بی سابقه است. وجود یک چرخه منظم تست و پیاده سازی معمولی برای الگوریتم های یادگیری عمیق موجب اطمینان از رانندگی ایمن با مواجهه بیشتر و بیشتر با میلیون ها سناریو است. داده های حاصل از دوربین ها، حسگرها، نقشه برداری های جغرافیایی به ایجاد مدل های مختصر و پیچیده برای پیمایش ترافیک، شناسایی مسیرها، تابلوها، مسیرهای مخصوص عابر پیاده و عناصر در زمان مورد نیاز مانند حجم ترافیک و انسداد جاده ها کمک می کند. طبق گفته فوربس ، MIT در حال توسعه سیستم جدیدی است که به خودرو های خودمختار امکان می دهد بدون نقشه حرکت کنند زیرا نقشه برداری سه بعدی هنوز محدود به مناطق پر برخوردار جهان است و در سایر نقاط جهان به همان اندازه موثر نیست.

تدی اورت ، دانشجوی کارشناسی ارشد CSAIL گفت ، “دلیل این که قبلاً این نوع رویکرد ” بدون نقشه ” تا کنون انجام نشده است، این است که دستیابی به همان دقت و قابلیت اطمینان همانند نقشه های دقیق ، بسیار دشوارتر است. سیستمی از این دست که می تواند فقط با حسگرهای روی صفحه حرکت کند، نشان می دهد که اتومبیل های خودران قادر رانندگی در تعداد کمی از جاده هایی هستند که شرکت های فناوری از آن ها نقشه برداری کرده اند. “

۲- تجمیع اخبار و کشف اخبار جعلی

امروزه راه هایی برای فیلتر کردن خبر های بد و زشت از اخبار مورد نظر شما وجود دارد. استفاده گسترده از یادگیری عمیق در جمع آوری اخبار موجب تقویت تلاش ها برای سفارشی سازی اخبار براساس خواسته ی خوانندگان است. اگرچه ممکن است این مسئله جدید به نظر نرسد، اما سطح جدیدتری از پیچیدگی برای تعریف کلمات خواننده برای فیلتر کردن اخبار مطابق با پارامترهای جغرافیایی، اجتماعی، اقتصادی همراه با تنظیمات فردی خواننده در حال انجام است.

از سوی دیگر، کشف اخبار جعلی در دنیای امروز که اینترنت به منبع اصلی همه اطلاعات واقعی و جعلی تبدیل شده است، یک اصل مهم است. تفکیک اخبار جعلی بسیار دشوار است زیرا ربات ها آن را به صورت خودکار در کانال ها تکرار می کنند. کمبریج آنالیتیکا یک نمونه کلاسیک از چگونگی تأثیر اخبار جعلی، اطلاعات شخصی و آمار می باشد که بر درک خواننده تاثیر می گذارد. نمونه های دیگر همچون (حزب بهارتیا جانتا در مقابل کنگره ملی هند)، انتخابات (بخوانید مبارزات دیجیتال دونالد ترامپ ) و استفاده از داده های شخصی (استفاده ی فیس بوک از اطلاعات تقریباً ۸۷ میلیون کاربر) .

۳- پردازش زبان طبیعی (NLP)

درک پیچیدگی های مرتبط با زبان، نحو، معنا، ظرایف لحنی، عبارات یا حتی کنایه ها، یکی از سخت ترین کارها برای این است که انسان یاد بگیرد. آموزش مداوم از بدو تولد و قرار گرفتن در محیط های مختلف اجتماعی به انسان کمک می کند تا پاسخ مناسب و شکل بیان شخصی خود را نسبت به هر سناریو بشناسد. آموزش و اعتبارسنجی یک شبکه عصبی یادگیری عمیق برای کشف خبر بسیار دشوار است زیرا داده ها مملو از نظرات افراد مختلف هستند و هیچ یک از طرفین هرگز نمی تواند تصمیم بگیرد که اخبار بی طرف است یا مغرضانه است.

پردازش زبان طبیعی از طریق یادگیری عمیق در تلاش است تا با آموزش ماشین آلات برای یاد گرفتن تفاوت های زبانی و تنظیم پاسخ های مناسب، به هدف مورد نظر خود برسد. خلاصه سازی اسناد به طور گسترده ای در حوزه حقوقی مورد استفاده و آزمایش قرار می گیرد و باعث می شود قوانین کهنه منسوخ شوند. پاسخ به سوالات، مدل سازی زبان، طبقه بندی متن، تجزیه و تحلیل توییتر یا تجزیه و تحلیل احساسات در سطح گسترده تر، همه زیرمجموعه پردازش زبان طبیعی است که در آن حوزه ها یادگیری عمیق در حال پیشرفت است.

رگرسیون لجستیک یا SVM برای ساخت مدل های پیچیده زمان بر استفاده می شد اما اکنون نمایش های توزیع شده، شبکه های عصبی کانولوشن ، شبکه های عصبی تکراری و بازگشتی ، یادگیری تقویت کننده و استراتژی های تقویت حافظه به دستیابی به بلوغ بیشتر در NLP کمک می کنند. نمایش های توزیع شده به ویژه در تولید روابط معنایی خطی که برای ساخت عبارات و جملات استفاده می شود و معناشناسی کلمات (تعبیه کلمه به معنای تعریف کلمه در متن کلمات همسایه آن است) ، بسیار موثر است.

۴- دستیارهای مجازی

محبوب ترین برنامه ی کاربردی یادگیری عمیق دستیارهای مجازی است که از الکسا گرفته تا سیری گرفته تا دستیار گوگل متغیر است. هر بار تعامل با این دستیارها فرصتی را برای آن ها فراهم می کند تا درباره صدا و لهجه شما بیشتر بدانند و در نتیجه یک تجربه ثانویه تعامل انسانی را برای شما فراهم می کنند. دستیاران مجازی از یادگیری عمیق برای کسب اطلاعات بیشتر در مورد موضوعات خود استفاده می کنند، از رستوران های مورد علاقه ی شما گرفته تا مکان های پر بازدید یا آهنگ های مورد علاقه تان. آن ها یاد می گیرند که دستورات شما را با ارزیابی زبان طبیعی انسان برای اجرا درک کنند.

یکی دیگر از قابلیت های دستیاران مجازی این است که گفتار شما را به متن تبدیل می کند، برای شما یادداشت می نویسد و قرار ملاقات های شما را رزرو می کند. دستیاران مجازی به معنای واقعی کلمه در تماس با شما هستند زیرا آن ها می توانند همه کارها را انجام دهند ، از انجام کار های مختلف تا پاسخگویی خودکار به تماس های خاص شما تا هماهنگی کارهای بین شما و اعضای تیم شما. با استفاده از برنامه های یادگیری عمیق مانند تولید متن و خلاصه سازی اسناد، دستیاران مجازی می توانند در ایجاد یا ارسال نسخه الکترونیکی مناسب نیز به شما کمک کنند.

۵- سرگرمی (VEVO ، Netflix ، فیلم سازی ، لحظات حساس ورزشی و غیره)

در مسابقات تنیس ویمبلدون ۲۰۱۸ از IBM Watson برای تجزیه و تحلیل احساسات و حالات بازیکنان از طریق صدها ساعت فیلم برای تولید خودکار لحظات حساس برای پخش تلویزیونی استفاده کرد. این کار باعث صرفه جویی در تلاش ها و هزینه ها شد. به لطف یادگیری عمیق، آن ها توانستند در پاسخگویی به مخاطبان و محبوبیت بازیکنان و بازی ها مدلی دقیق تر ارائه دهند (در غیر این صورت فقط نکات حساس بازی نمایش داده می شد).

Netflix و آمازون با ایجاد فاکتور های شخصی خود در تنظیمات نمایش، زمان دسترسی، سابقه و غیره، قابلیت های یادگیری عمیق خود را برای ارائه تجربه شخصی به بینندگان خود افزایش می دهند تا نمایش هایی را که دوست دارند بیننده خاصی باشد، پیشنهاد دهند. VEVO با استفاده از یادگیری عمیق، نسل بعدی خدمات داده را برای نه تنها تجارب شخصی برای کاربران و مشترکان خود، بلکه همچنین برای هنرمندان، شرکت ها، مارک های ضبط و گروه های تجاری داخلی ایجاد کرده است تا بینشی بر اساس عملکرد و محبوبیت ایجاد کند. تجزیه و تحلیل عمیق ویدئو می تواند ساعت ها در تلاش دستی مورد نیاز برای همگام سازی صوتی / تصویری و آزمایش، رونویسی و برچسب گذاری آن صرفه جویی کند.

ویرایش محتوا و ایجاد محتوای خودکار به لطف Deep Learning و سهم آن در شناسایی چهره و الگوها اکنون به یک واقعیت تبدیل شده است. یادگیری عمیق هوش مصنوعی در حال ساخت انقلابی در روند فیلم سازی است زیرا دوربین ها یاد می گیرند زبان بدن انسان را برای آمیختن در شخصیت های مجازی مطالعه کنند.

۶- تشخیص بصری

خودتان را تصور کنید که با انبوهی از تصاویر قدیمی روبرو هستید که خاطرات گذشته را برای شما یادآوری می کند. تصمیم می گیرید چند تا از آن ها را قاب بگیرد اما اول ، شما می خواهید آن ها را مرتب کنید. قبلا تلاش دستی تنها راه تحقق این امر در غیاب فراداده بود. حداکثر کاری که می توانستید انجام دهید این بود که آن ها را براساس تاریخ مرتب کنید اما تصاویر بارگیری شده فاقد این فراداده ها هستند.

اینجاست که یادگیری عمیق وارد می شود و اکنون می توان تصاویر را بر اساس مکان های شناسایی شده در عکس ها، چهره ها، ترکیبی از افراد یا براساس رویدادها، تاریخ ها و غیره مرتب کرد. جستجوی عکس خاصی از کتابخانه (فرض کنید مجموعه داده ای به بزرگی کتابخانه عکس Google) به پیشرفته ترین سیستم های تشخیص بصری متشکل از چندین لایه از پایه تا پیشرفته برای شناسایی عناصر نیاز دارد. تشخیص بصری تصاویر در مقیاس بزرگ از طریق شبکه های عصبی عمیق با استفاده گسترده از شبکه های عصبی کانولوشن، Tensorflow و Python باعث رشد این بخش از مدیریت رسانه های دیجیتال می شود.

۷- کشف تقلب

بخش دیگری که از یادگیری عمیق سود می برد، بخش بانکی و مالی است که وظیفه کشف تقلب با دیجیتالی شدن معاملات پولی را بر عهده دارد. رمزگذاران خودکار در Keras و Tensorflow برای کشف تقلب در کارت های اعتباری که موجب صرفه جویی میلیاردها دلار هزینه برای بازیابی و بیمه موسسات مالی شده است، در حال توسعه هستند. پیشگیری و کشف تقلب بر اساس شناسایی الگوهای معاملات مشتری و امتیازات اعتباری، شناسایی رفتارهای ناهنجار و نقاط پرت(دور افتاده) انجام می شود.

از تکنیک های طبقه بندی و رگرسیون و شبکه های عصبی یادگیری ماشین برای کشف تقلب استفاده می شود. در حالی که از یادگیری ماشین بیشتر برای شناسایی موارد کلاهبرداری که نیاز به همکاری انسانی دارند استفاده می شود، یادگیری عمیق سعی دارد با تلاش برای مقیاس گذاری، این تلاش ها را به حداقل برساند.

۸- سلامت

طبق گفته ی NVIDIA ، “از تصویربرداری پزشکی گرفته تا تجزیه و تحلیل ژنوم ها گرفته تا کشف داروهای جدید، کل صنعت بهداشت و سلامت در حال تحول هستند و رایانه های GPU در قلب این تحول هستند. برنامه ها و سیستم های شتاب دهنده GPU با ارائه کارآیی ها و امکانات جدید، به پزشکان و محققان علاقه مند به بهبود زندگی دیگران برای انجام کار خود به بهترین شکل ممکن قدرت می بخشند. “

کمک به تشخیص زود هنگام، دقیق و سریع بیماری های تهدید کننده زندگی، افزایش پزشکان برای رفع کمبود پزشک با کیفیت و ارائه دهندگان مراقبت های بهداشتی، نتایج آسیب شناسی و استاندارد سازی دوره درمان و درک ژنتیک برای پیش بینی خطر ابتلا به بیماری ها و قسمت های منفی سلامتی برخی از پروژه های فناوری یادگیری عمیق است که در حوزه بهداشت و درمان به سرعت انجام می گیرند. بستری مجدد بیماران برای بخش بهداشت و درمان یک مشکل بزرگ است زیرا هزینه این کار دهها میلیون دلار است. اما با استفاده از یادگیری عمیق و شبکه های عصبی، غول های مراقبت های بهداشتی ضمن کاهش هزینه ها ، خطرات سلامتی مرتبط با بستری مجدد بیمار را کاهش می دهند.

هوش مصنوعی همچنین در تحقیقات بالینی توسط نهاد های نظارتی برای یافتن درمان بیماری های غیرقابل درمان بسیار مورد استفاده قرار می گیرد اما شک و تردید پزشکان و فقدان یک مجموعه داده عظیم هنوز هم استفاده از یادگیری عمیق در پزشکی را با چالش مواجه می کند.

۹- شخصی سازی ها

اکنون هر پلتفرمی در تلاش است تا با استفاده از بات های گفت و گو تجربه های شخصی سازی شده ی انسانی را به بازدید کنندگان خود ارائه دهد. یادگیری عمیق تلاش های غول های تجارت الکترونیکی مانند آمازون، E-Bay ، Alibaba و غیره برای ارائه تجارب شخصی یکپارچه در قالب توصیه های محصول، بسته های شخصی و تخفیف ها و شناسایی فرصت های بزرگ درآمد را تقویت کرده است.

حتی حضور در بازار های جدید با راه اندازی محصولات، پیشنهادها یا طرح هایی انجام می شود که به احتمال زیاد موجب رضایت مشتری شده و منجر به رشد در بازارهای خرد می شود. رویکردهای سلف سرویس آنلاین در حال افزایش است و گردش کار قابل اعتماد حتی امروزه آن سرویس هایی را که فقط از نظر فیزیکی در یک زمان در دسترس بودند، در بستر اینترنت در دسترس همه قرار می دهد.

ربات های متخصص در کارهای خاص با ارائه مناسب ترین خدمات به شما چه از طریق طرح های بیمه و چه درست کردن همبرگرهای سفارشی، تجربه های شما را در زمان واقعی شخصی سازی می کنند.

۱۰- تشخیص تأخیر رشد در کودکان

اختلالات گفتاری، اوتیسم و اختلالات رشد می تواند کیفیت زندگی کودکان مبتلا به هر یک از این مشکلات را مختل کند. تشخیص و درمان به موقع می تواند تأثیر شگفت انگیزی بر سلامت جسمی، روحی و روانی کودکان با توانایی متفاوت داشته باشد. از این رو، یکی از بهترین کاربردهای یادگیری عمیق، تشخیص زود هنگام و اصلاح دوره این مشکلات مرتبط با نوزادان و کودکان است.

این یک تفاوت عمده بین یادگیری ماشین و یادگیری عمیق است که در آن یادگیری ماشین اغلب فقط برای کارهای خاص استفاده می شود و یادگیری عمیق، از طرف دیگر ، به حل جدی ترین مشکلات نژاد بشر کمک می کند. محققان آزمایشگاه علوم رایانه ای و هوش مصنوعی در MIT و بیمارستان عمومی بیمارستان ماساچوست ، یک سیستم رایانه ای ایجاد کرده اند که می تواند اختلالات گفتاری و کلامیرا حتی قبل از رفتن کودک به مهد کودک هنگامی که به طور سنتی شروع به آشکار شدن می کند، شناسایی کند.

محققان عملکرد سیستم را با استفاده از معیار استانداردی به نام مساحت زیر منحنی ارزیابی کردند که توصیف معادله ی بین اعضای یک گروه جمعیتی است که دارای یک اختلال خاص هستند. آن ها از روش تجزیه و تحلیل رسوبی استفاده می کنند که ارتباط بین سن، جنسیت و ویژگی های صوتی گفتار آن ها را مشخص می کند. اوتیسم اغلب با ترکیب آن با فاکتورهایی مانند وزن کم هنگام تولد، فعالیت بدنی ، شاخص توده بدن، اختلالات یادگیری و غیره تشخیص داده می شود.

۱۱- رنگ آمیزی تصاویر سیاه و سفید

رنگ آمیزی تصویر در واقع فرایند گرفتن تصاویر در مقیاس خاکستری (به عنوان ورودی) و سپس تولید تصاویر رنگی (به عنوان خروجی) است. این فرآیند، با توجه به دشواری کار، به طور متعارف توسط انسان انجام می شد. با این حال، امروزه با استفاده از فناوری یادگیری عمیق، این اشیا و متن آن ها در عکس اعمال می شود – به منظور رنگ آمیزی تصویر ، دقیقاً مانند رویکرد اپراتور انسانی. اساساً، این روش شامل استفاده از شبکه های عصبی کانولوشن با کیفیت بالا در لایه های تحت نظارت است که تصویر را با افزودن رنگ دوباره ایجاد می کند.

۱۲- افزودن صدا به فیلم های صامت

کاربرد هر دو شبکه عصبی کانولوشن و شبکه های عصبی LSTM شامل ترکیب صدا برای مطابقت آن صدا با فیلم های بی صدا است. یک مدل یادگیری عمیق فریم های ویدئو را با پایگاه داده ای از صداهای از پیش ضبط شده برای انتخاب صداهای مناسب برای صحنه مرتبط سازد. این کار با استفاده از آموزش ۱۰۰۰ فیلم انجام می شود – که دارای صدای درام است که به سطوح مختلف ضربه می زند و صداهای مختلف ایجاد می کند. سپس این فیلم ها توسط مدل های یادگیری عمیق برای پیش بینی بهترین صدای مناسب در فیلم استفاده می شود. و بعداً برای پیش بینی ساختگی یا واقعی بودن صدا ، یک آزمایش مانند آزمایش Turing برای دستیابی به بهترین نتیجه ساخته شده است.

۱۳- ترجمه خودکار ماشین

شبکه های عصبی کانولوشنال در شناسایی تصاویری که حروف مرئی دارند مفید است. پس از شناسایی، می توان آن ها را به متن تبدیل، ترجمه و با استفاده از متن ترجمه شده ، دوباره ساخت. این فرآیند ترجمه بصری فوری نامیده می شود. این برنامه شامل ترجمه های خودکار به زبان دیگر با مجموعه ای از کلمات، عبارات یا جمله داده شده در یک زبان است. در حالی که ترجمه خودکار ماشینی مدتهاست وجود دارد ، اما یادگیری عمیق در دو زمینه خاص به نتایج عالی رسیده است:

ترجمه خودکار متن
ترجمه خودکار تصاویر

ترجمه متن معمولاً بدون هیچ گونه پیش پردازش دنباله انجام می شود. این کار اجازه می دهد تا الگوریتم وابستگی های بین کلمات را یاد بگیرد تا آن را در قالب زبان جدید ترسیم کند. این وظایف به طور کلی توسط شبکه های انباشته شبکه های عصبی ارجاعی LSTM انجام می شود.

۱۴- تولید خودکار دست خط

این کاربرد فناوری یادگیری عمیق شامل ایجاد مجموعه ای از دست خط های جدید برای یک مجموعه خاص از یک کلمه یا عبارت است. دست خط در اصل به عنوان دنباله ای از مختصات استفاده شده توسط قلم هنگام ایجاد نمونه ها ارائه می شود. رابطه بین حرکت قلم و حروف توسط مدل آموخته می شود و نمونه های جدیدی تولید می شود.

۱۵- بازی خودکار

در اینجا، یک مجموعه متن یاد گرفته می شود و متن جدید ، کلمه به کلمه یا کاراکتر به کاراکتر ایجاد می شود. این مدل از یادگیری عمیق قادر به یادگیری نحوه نوشتن، نگارش و حتی یادگیری استایل متن در جملات است. معمولاً از شبکه های عصبی ارجاعی برای یادگیری تولید متن از طریق موارد موجود در توالی رشته های ورودی استفاده می شود. با این حال ، اخیراً شبکه های عصبی LSTM نیز با استفاده از یک مدل مبتنی بر کاراکتر که در هر لحظه یک کارکتر به وجود می آورد، موفقیت بزرگی در این مسئله نشان داده اند. در زیر چند نمونه از برنامه ها ذکر شده است:

مقاله های پل گراهام
شکسپیر
مقالات ویکی پدیا (شامل نشانه گذاری)
هندسه جبری (با علامت گذاری LaTeX)
کد منبع لینوکس
نام های کودک

۱۶- ترجمه ی تصویر – زبان

یکی از کاربرد های جذاب یادگیری عمیق ترجمه های تصویر – زبان است. با استفاده از برنامه Google Translate ، اکنون می توان تصاویر عکاسی شده را با متن به زبان مورد نظر و به انتخاب خود ترجمه کرد. تمام کاری که شما باید انجام دهید این است که دوربین را بالای شی نگه دارید و تلفن شما یک شبکه یادگیری عمیق را برای خواندن تصویر ، OCR آن (یعنی تبدیل آن به متن) اجرا می کند و سپس آن را به یک متن به زبان مورد نظر شما ترجمه می کند. این یک برنامه بسیار مفید است با توجه به اینکه زبان ها دیگر به تدریج به مانعی جهت ارتباط انسانی محسوب نمی شوند و باعث برقراری ارتباط جهانی انسان ها با یکدیگر می شوند.

۱۷- بازسازی پیکسل

مفهوم بزرگنمایی در فیلم ها فراتر از وضوح واقعی آن تا زمانی که فناوری یادگیری عمیق وارد عمل نشده بود، غیر واقعی بنظر میرسید. در سال ۲۰۱۷ ، محققان Google Brain یک شبکه یادگیری عمیق را آموزش دادند تا تصاویر با وضوح بسیار کم از چهره ها گرفته و چهره فرد را از طریق آن پیش بینی کند. این روش به عنوان Pixel Recursive Super Resolution شناخته می شد.

این کار وضوح عکس ها را به میزان قابل توجهی افزایش می دهد، ویژگی های برجسته را به ترتیب مشخص می کند تا برای شناسایی شخص مورد نظر کافی باشد. تصویر زیر گروهی از تصاویر را نشان می دهد که شامل یک مجموعه اصلی عکس ۸ × ۸ در سمت راست همراه با عکس های واقعی در سمت چپ. و سرانجام، ستون میانی حاوی حدس های ساخته شده توسط رایانه است.

۱۸- توضیحات عکس

رایانه ها تمایل دارند که به طور خودکار عکس ها را طبقه بندی کنند. به عنوان مثال ، فیسبوک آلبوم هایی از تصاویر دارای برچسب ، آپلودهای تلفن همراه و تصاویر با جدول زمانی ایجاد می کند. به همین ترتیب ، Google Photos برای جستجوی آسانتر به طور خودکار تمام عکس های بارگذاری شده را برچسب گذاری می کند. با این حال ، این ها فقط برچسب هستند. یادگیری عمیق یک سطح دیگر و چندین مرحله به جلو می رود.

این فناوری ظرفیت توصیف همه عناصر موجود در عکس را دارد. اثری که توسط Andrej Karpathy و Li Fei-Fei اجرا شد ، یک شبکه یادگیری عمیق را آموزش داد تا ده ها منطقه جالب را در یک تصویر شناسایی کند و جمله ای را که هر یک از آن ها را توصیف می کند ارائه دهد. این بدان معناست که کامپیوتر نه تنها نحوه طبقه بندی عناصر موجود در عکس را فراگرفته است ، بلکه موفق به توصیف آن ها با دستور زبان انگلیسی نیز شده است.

۱۹- جمعیت شناسی و پیش بینی انتخابات

گبرو و همکارانش ۵۰ میلیون تصویر نمای خیابان Google را به منظور کشف آنچه یک شبکه یادگیری عمیق قادر به انجام آن ها است ، گرفته اند. نتایج ، طبق معمول فوق العاده بود. این رایانه قادر به یادگیری بومی سازی و تشخیص خودرو و مشخصات آن بود. این شرکت موفق به شناسایی بیش از ۲۲ میلیون خودرو به همراه نوع ، مدل ، نوع بدنه و سال ساخت آن ها شد. با الهام از داستان موفقیت این قابلیت فناوری یادگیری عمیق، اکتشافات در آنجا متوقف نشد. دیده شد که این مدل فقط از طریق شناسایی نوع ماشین قادر به پیش بینی مشخصات جمعیتی هر منطقه است.

به عنوان مثال ، اگر تعداد خودرو های سدان که طی ۱۵ دقیقه رانندگی در یک شهر با در حال عبور باشند از تعداد کامیون های وانت بیشتر باشد ، احتمالاً در انتخابات ریاست جمهوری بعدی (۸۸٪ احتمال) این شهر به یک دموکرات رأی خواهد داد. در غیر این صورت ، به احتمال زیاد رای جمهوری خواهان (۸۲٪) می رسد!

۲۰- رویای عمیق

در سال ۲۰۱۵ ، محققان گوگل روشی را یافتند که از شبکه های یادگیری عمیق برای افزایش ویژگی های تصاویر در رایانه استفاده می کرد. در حالی که امروزه از این روش به روش های مختلفی استفاده می شود ، یکی از کاربردهای فناوری یادگیری عمیق اساساً مفهوم رویای عمیق را در بر می گیرد.

این تکنیک ، همانطور که از نامش پیداست ، به کامپیوتر اجازه می دهد تا بالای یک عکس موجود رویاپردازی کند- در نتیجه یک رویای دوباره جمع شده ایجاد می کند. توهم و رویا بسته به نوع شبکه عصبی و آنچه در معرض آن قرار دارد متفاوت است. این تکنیک رویای عمیق توسط گروهی از محققان دانشگاه ساسکس برای ایجاد یک ماشین رویاپرداز استفاده شده است که به کاربران امکان می دهد از طریق یک واقعیت مجازی شرایط روانشناختی یا شرایط به وجود آمده توسط مواد روانگردان را تجربه کنند. این آزمایش موفقیت آمیز امکان استفاده از الگوریتم های شبکه عصبی عمیق را برای تجربیات رویایی بیشتر فراهم می کند.

شاید دوباره بپرسید یادگیری عمیق چیست؟ ممکن است به نظر برسد که چیزهای علمی-تخیلی از آن ساخته شده اند – فقط این که این فناوری قادر است آن داستان ها را به واقعیت فعلی ما تبدیل کند. این دامنه در حال حاضر فرصت های زیادی را برای افراد حرفه ای با یادگیری عمیق و سایر مهارت های هوش مصنوعی ایجاد کرده است. اگر برنامه های یادگیری عمیق فوق الذکر علاقه شما را برانگیخته است ، اکنون زمان مناسب برای افزودن مهارت هایتان در این زمینه است.