در سالهای اولیه توسعه مدلهای زبانی بزرگ، مانند ChatGPT و Cohere، برای آموزش مدلها جهت تولید پاسخهای شبیه به انسان، به نیروی کار انسانی گستردهای نیاز بود. این نیروها وظیفه داشتند تا به مدلها کمک کنند تا مفاهیم اولیه مانند تشخیص تفاوت بین تصویر یک ماشین و یک هویج را درک کنند. اما با پیچیدهتر شدن مدلهای هوش مصنوعی و افزایش رقابت در این حوزه، نیاز به متخصصان آموزشدهنده با دانش تخصصیتر به شدت احساس شد. امروزه، شبکه گستردهای از متخصصان، از مورخان و دانشمندان گرفته تا افرادی با مدرک دکترا، در فرآیند آموزش این مدلها مشارکت دارند.
به گزارش سرویس اخبار فناوری رسانه تکنولوژی تکنا، ایوان ژانگ، یکی از بنیانگذاران Cohere، در این باره میگوید: «در گذشته، برای آموزش کلی مدلهای هوش مصنوعی، میتوانستیم از دانشجویان کارشناسی نیز استفاده کنیم. اما اکنون، برای آموزش مدلها در حوزههای تخصصی مانند پزشکی، مالی و حسابداری، به متخصصان مجرب نیاز داریم.»
Cohere که یکی از رقبای اصلی OpenAI محسوب میشود، برای آموزش مدلهای خود با شرکتی به نام Invisible Tech همکاری میکند. Invisible Tech هزاران متخصص آموزشدهنده را در سراسر جهان به کار گرفته است تا به شرکتهای هوش مصنوعی مانند AI21 و مایکروسافت در بهبود دقت مدلهای خود کمک کنند. این شرکتها با استفاده از دادههای آموزشی باکیفیت، تلاش میکنند تا خطاهای مدلهای زبانی بزرگ را که در اصطلاح به آنها «توهم» گفته میشود، کاهش دهند.
فرنسیس پدرازا، بنیانگذار Invisible Tech، میگوید: «ما هزاران متخصص با مدرک دکترا، فوقلیسانس و متخصصان حوزههای مختلف را در بیش از ۱۰۰ کشور جهان به کار گرفتهایم. Invisible Tech به ازای هر ساعت کار، بسته به تخصص مورد نیاز و محل جغرافیایی کاربر، دستمزدهایی بین ۱۵ تا ۲۰۰ دلار پرداخت میکند.
Invisible Tech در ابتدا به عنوان یک شرکت خودکارسازی فرآیندهای کاری فعالیت میکرد. اما با ظهور مدلهای زبانی بزرگ و نیاز آنها به دادههای آموزشی باکیفیت، این شرکت به یکی از بازیگران اصلی در حوزه آموزش مدلهای هوش مصنوعی تبدیل شد. OpenAI، یکی از پیشگامان در حوزه هوش مصنوعی، نیز از خدمات Invisible Tech برای آموزش مدلهای خود استفاده میکند. OpenAI برای بهبود عملکرد مدلهای خود در زمینههای مختلف، مانند تولید متن خلاقانه و پاسخگویی به سؤالات پیچیده، به دادههای آموزشی بسیار تخصصی نیاز دارد. هوش مصنوعی تولیدکننده، با وجود پیشرفتهای چشمگیر، هنوز هم با چالشهایی مانند تولید اطلاعات نادرست مواجه است. این موضوع اهمیت استفاده از دادههای آموزشی باکیفیت و نظارت دقیق بر فرآیند آموزش مدلها را بیش از پیش آشکار میکند.
source