در سال های اولیه، به دست آوردن مدل های هوش مصنوعی مانند ChatGPT یا رقیب آن Cohere برای تولید پاسخ هایی شبیه به انسان، نیازمند تیم های گسترده ای از کارگران کم هزینه بود که به مدل ها کمک می کردند تا حقایق پایه ای مانند تصویر یک ماشین یا یک هویج را تشخیص دهند.
اما به روز رسانی های پیچیده تر برای مدل های هوش مصنوعی در عرصه به شدت رقابتی عصر حاضر، نیازمند شبکه ای به سرعت در حال گسترش از مربیان انسانی است که دانش تخصصی دارند – از مورخان گرفته تا دانشمندان، و برخی دارای مدرک دکترا.
ایوان ژانگ، یکی از بنیان گذاران Cohere، درباره مربیان انسانی داخلی این شرکت می گوید: ” یک سال پیش، ما می توانستیم با استخدام دانشجویان دوره کارشناسی کنار بیاییم تا به طور کلی به هوش مصنوعی نحوه بهبود را آموزش دهیم.
” اکنون ما به پزشکان مجوز داده ایم که به مدل ها نحوه رفتار در محیط های پزشکی، یا تحلیلگران مالی یا حسابداران را آموزش دهند.”
برای آموزش بیشتر، Cohere که آخرین بار بیش از ۵ میلیارد دلار ارزش داشت، با یک استارتاپ به نام Invisible Tech همکاری می کند. Cohere یکی از رقبای اصلی OpenAI است و در زمینه هوش مصنوعی برای کسب و کارها تخصص دارد.
استارتاپ Invisible Tech از هزاران مربی استفاده می کند که از راه دور کار می کنند و به یکی از شرکای اصلی شرکت های هوش مصنوعی از AI۲۱ گرفته تا مایکروسافت تبدیل شده است تا مدل های هوش مصنوعی خود را برای کاهش خطاها آموزش دهند که در دنیای هوش مصنوعی به توهم معروف است.
فرانسیس پدرازا، بنیانگذار این شرکت می گوید: ” ما ۵۰۰۰ نفر در بیش از ۱۰۰ کشور جهان داریم که دارای مدرک دکترا، دارندگان مدرک کارشناسی ارشد و متخصصان کار دانش هستند.”
شرکت Invisible بسته به موقعیت کارگر و پیچیدگی کار، به ازای هر ساعت ۴۰ دلار پرداخت می کند. برخی شرکت ها مانند Outlier تا ۵۰ دلار در ساعت پرداخت می کنند، در حالی که شرکت دیگری به نام Labelbox می گوید برای موضوعات “با تخصص بالا” مانند فیزیک کوانتوم تا ۲۰۰ دلار در ساعت پرداخت می کند، اما برای موضوعات پایه ای با ۱۵ دلار شروع می شود.
نامرئی در سال ۲۰۱۵ به عنوان یک شرکت اتوماسیون گردش کار تاسیس شد که به امثال شرکت تحویل غذای DoorDash برای دیجیتالی کردن منوی تحویل آن ها کمک می کرد. اما اوضاع زمانی تغییر کرد که یک شرکت تحقیقاتی نسبتا ناشناخته به نام OpenAI در بهار ۲۰۲۲ و پیش از عرضه عمومی ChatGPT با آن ها تماس گرفت.
” OpenAI با یک مشکل به سراغ ما آمد و آن این بود که وقتی از نسخه اولیه ChatGPT سوالی می پرسید، دچار توهم می شد. در این شرایط شما نمی توانید به پاسخ اعتماد کنید.”
آن ها به یک شریک آموزش هوش مصنوعی پیشرفته نیاز داشتند تا یادگیری تقویتی را با بازخورد انسانی فراهم کنند.”
OpenAI به درخواست برای اظهارنظر پاسخ نداد.
هوش مصنوعی Generative براساس داده های گذشته ای که برای آموزش آن استفاده می شود، محتوای جدیدی تولید می کند. با این حال، گاهی اوقات نمی تواند بین اطلاعات درست و غلط تمایز قائل شود و خروجی های غلطی تولید می کند که در اینجا میگوییم توهم زده است! در یک مثال قابل توجه، در سال ۲۰۲۳ یک چت بات گوگل اطلاعات نادرستی را در مورد اینکه کدام ماهواره برای اولین بار از یک سیاره خارج از منظومه شمسی زمین در یک ویدیوی تبلیغاتی عکس گرفته است، به اشتراک گذاشت.
شرکت های هوش مصنوعی آگاه هستند که توهمات می توانند جذابیت نبوغ را برای کسب و کارها از بین ببرند و راه های مختلفی را برای کاهش آن امتحان می کنند، از جمله استفاده از مربیان انسانی برای آموزش مفهوم واقعیت و داستان.
Invisible می گوید از زمانی که با OpenAI همراه شده، به شرکای آموزش هوش مصنوعی برای اکثر شرکت های GenAI، از جمله Cohere، AI21 و Microsoft تبدیل شده است. Cohere و AI۲۱ تایید کردند که مشتری این شرکت هستند اما مایکروسافت تایید نکرد که مشتری Invisible است.
پدرازا گفت: ” این ها همه شرکت هایی هستند که چالش های آموزشی داشتند، که هزینه شماره یک آن ها توان محاسباتی بود، و هزینه شماره دو آن ها آموزش با کیفیت است.”
چگونه کار می کند؟
OpenAI که فعالیت خود را در حوزه هوش مصنوعی آغاز کرده، تیمی از محققان به نام “تیم داده های انسانی” دارد که با مربیان هوش مصنوعی برای جمع آوری داده های تخصصی برای آموزش مدل های خود مانند ChatGPT هم کاری می کنند.
به گفته یکی از منابع آشنا به فرایندهای این شرکت، محققان OpenAI آزمایش های مختلفی مانند کاهش توهمات یا بهبود سبک نوشتن و کار با مربیان هوش مصنوعی شرکت Invisible و سایر فروشندگان را انجام می دهند.
به گفته این شخص، در هر نقطه، ده ها آزمایش در حال اجرا است که برخی از آن ها با ابزارهای توسعه یافته توسط OpenAI و برخی دیگر با ابزارهای فروشندگان انجام می شوند.
براساس آنچه شرکت های هوش مصنوعی می خواهند – مثلا از بهتر شدن تاریخ سوئد یا انجام مدل سازی مالی – شرکت Invisible کارگرانی با مدارک مرتبط برای آن پروژه ها استخدام می کند و بار مدیریت صدها مربی توسط شرکت های هوش مصنوعی را کاهش می دهند.
پدرازا گفت: “OpenAI برخی از باورنکردنی ترین دانشمندان کامپیوتر در جهان را دارد اما آن ها لزوما متخصص تاریخ سوئد یا سوالات شیمی یا سوالات زیست شناسی یا هر چیزی که شما می توانید از آن بپرسید نیستند” و افزود که بیش از ۱۰۰۰ کارمند قراردادی تنها به OpenAI کمک می کنند.
آقای Zhang از Cohere گفت که او شخصا از مربیان Invisible برای یافتن راهی برای آموزش مدل GenAI خود برای یافتن اطلاعات مرتبط از یک مجموعه داده بزرگ استفاده کرده است.
رقابت
از جمله رقبای این فضا می توان به Scale AI اشاره کرد که یک استارت آپ خصوصی به ارزش ۱۴ میلیارد دلار است و مجموعه ای از داده های آموزشی را در اختیار شرکت های هوش مصنوعی قرار می دهد. این شرکت همچنین وارد حوزه ارائه آموزش های هوش مصنوعی شده و OpenAI را به عنوان یک مشتری می شناسد. متاسفانه شرکت Scale AI به درخواست های مصاحبه برای این داستان پاسخ نداد.
Invisible که از سال ۲۰۲۱ سودآور بوده، تنها ۸ میلیون دلار سرمایه اولیه جذب کرده است.
پدرازا گفت: ” ما ۷۰ درصد متعلق به تیم هستیم و تنها ۳۰ درصد متعلق به سرمایه گذاران.
مربیان انسانی ابتدا از طریق کار برچسب گذاری داده ها وارد آموزش هوش مصنوعی شدند که نیاز به مهارت کمتری داشت و همچنین حقوق کمتری دریافت می کردند، گاهی اوقات به اندازه ۲ دلار که این بیشتر توسط مردم کشورهای آفریقایی و آسیایی انجام می شود.
با راه اندازی مدل های پیشرفته تر توسط شرکت های هوش مصنوعی، تقاضا برای مربیان تخصصی و به ده ها زبان در حال افزایش است و یک موقعیت خوب ایجاد می کند که در آن کارگران از موضوعات مختلف می توانند بدون اینکه حتی بدانند چگونه کد بنویسند، مربی هوش مصنوعی شوند.
تقاضا از سوی شرکت های هوش مصنوعی منجر به ایجاد شرکت های بیشتری می شود که خدمات مشابهی ارائه می دهند.
ژانگ گفت : ” اینباکس من اساسا پر از شرکت های جدیدی است که اینجا و آنجا ظاهر می شوند. من این فضا را فضایی جدید می بینم که در آن شرکت ها انسان ها را فقط برای ایجاد داده برای آزمایشگاه های هوش مصنوعی مانند ما استخدام می کنند.