شرکت OpenAI در حال انتشار مدل هوش مصنوعی جدیدی به نام o1 است، که اولین مدل در سری برنامهریزی شدهی مدلهای «استدلال» محسوب میشود. یک هوش مصنوعی که برای پاسخگویی به سوالات پیچیدهتر، سریعتر از انسان آموزش دیده است. این مدل همراه با نسخهی کوچکتر و ارزانتری به نام o1-mini منتشر میشود. و بله، اگر شما در شایعات هوش مصنوعی غرق شدهاید: این در واقع، همان مدل بسیار موردانتظار Strawberry است.
عرضه و قیمت مدل هوش مصنوعی o1
برای OpenAI، مدل o1 گامی به سوی هدف گستردهتر آنها، یعنی هوش مصنوعی شبیه به انسان است. به طور عملیتر، این مدل در نوشتن کد و حل مسائل چند مرحلهای نسبت به مدلهای قبلی عملکرد بهتری دارد. اما استفاده از آن نسبت به GPT-4o گرانتر و کندتر است. OpenAI این انتشار از o1 را به عنوان «پیشنمایش» معرفی میکند تا تأکید کند که چقدر این مدل جدید است.
از امروز، کاربران ChatGPT Plus و Team به هر دو نسخه o1-preview و o1-mini دسترسی خواهند داشت. در حالی که کاربران Enterprise و Edu از اوایل هفته آینده به این سرویسها دسترسی پیدا میکنند. OpenAI اعلام کرده که برنامه دارد دسترسی به o1-mini را برای تمام کاربران رایگان ChatGPT فراهم کند، اما هنوز تاریخ انتشار مشخصی را تعیین نکرده است.
دسترسی توسعهدهندگان به o1 بسیار گران است: در API، قیمت o1-preview برای هر یک میلیون توکن ورودی، یا قطعات متنی که توسط مدل تجزیه و تحلیل میشوند، 15 دلار و برای هر یک میلیون توکن خروجی 60 دلار است. برای مقایسه، هزینه GPT-4o برای هر یک میلیون توکن ورودی 5 دلار و برای هر یک میلیون توکن خروجی 15 دلار است.
o1 چه تقاوتی با مدلهای قبلی دارد؟
آموزش پشت o1 از نظر بنیادین با نسلهای قبلی خود متفاوت است. رهبر تحقیقات OpenAI، «جری توورک»، به کایلی رابیسون نویسنده ورج توضیح میدهد. اگرچه شرکت هنوز درباره برخی جزئیات مطمئن نیست. او میگوید o1 «با استفاده از یک الگوریتم بهینهسازی کاملاً جدید و یک مجموعه داده آموزشی جدید که به طور خاص برای آن طراحی شده، آموزش دیده است.»
OpenAI مدلهای قبلی GPT را آموزش داده است تا الگوهایی را از دادههای آموزشی خود تقلید کنند. اما در o1 با استفاده از روشی به نام یادگیری تقویتی، که سیستم را از طریق پاداشها و تنبیهها آموزش میدهد، مدل را برای حل مسائل به صورت مستقل آموزش داده است. هوش مصنوعی o1 سپس از یک «زنجیره فکری» برای پردازش پرسشها استفاده میکند. به طریقی مشابه پردازش مسائل توسط انسانها که به صورت گام به گام انجام میشود.
به عنوان نتیجه این روش آموزشی جدید، OpenAI میگوید که مدل باید دقیقتر باشد. توورک میگوید «ما متوجه شدهایم که این مدل کمتر دچار توهم میشود.» اما مشکل همچنان پابرجاست. «ما نمیتوانیم بگوییم که توهمات را حل کردهایم.»
وجه تمایز o1 با مدلهای قبلی چیست؟
ویژگی اصلی که این مدل جدید را از GPT-4o متمایز میکند، توانایی آن در حل مسائل پیچیدهتر مانند برنامهنویسی و ریاضیات است که به مراتب بهتر از نسخههای پیشین عمل میکند. همچنین این مدل قادر است دلایل خود را توضیح دهد.
مدیر تحقیقات ارشد OpenAI، «باب مکگرو»، میگوید «این مدل قطعاً در حل آزمون ریاضی AP از من بهتر است. در حالی که من در دانشگاه رشته ریاضی خواندهام.» او میگوید OpenAI همچنین o1 را در آزمون ورودی المپیاد بینالمللی ریاضیات آزمایش کرده است. در حالی که GPT-4o تنها 13 درصد از مسائل را به درستی حل کرده است، o1 به دستاورد 83 درصد رسیده است.
در مسابقات برنامهنویسی آنلاین که به رقابتهای Codeforces شناخته میشوند، این مدل جدید به درصد 89 شرکتکنندگان دست یافت. OpenAI ادعا میکند که بهروزرسانی بعدی این مدل، عملکردی «مشابه دانشجویان دکتری در سوالات معیار چالشبرانگیز در فیزیک، شیمی و زیستشناسی» خواهد داشت.
در عین حال، هوش مصنوعی o1 به اندازه GPT-4o در بسیاری از زمینهها توانمند نیست. این مدل در دانش واقعی درباره جهان به خوبی عمل نمیکند. همچنین توانایی جستجو در وب یا پردازش فایلها و تصاویر را ندارد. با این حال، شرکت معتقد است که این مدل نمایانگر یک کلاس جدید از تواناییها است. این مدل به نام o1 نامگذاری شده است تا نشان دهد که «همه چیز دوباره به عدد 1 بازگردانده شده».
آزمونی برای هوش مصنوعی o1
مک گرو میگوید: «بیایید صادق باشیم: فکر میکنم ما سنتاً در نامگذاری وحشتناک هستیم.» او ابراز امیدواری میکند که این اولین قدم برای نامهای جدیدتر و عاقلانهتری باشد «که بهتر بتوانند آنچه را که ما در حال انجامش به دنیا هستیم، منتقل کنند.»
نویسنده ورج شخصا قادر به امتحان کردن o1 نبوده است. اما مک گرو و توورک این هفته آن را در یک تماس ویدیویی به او نشان دادند. آنها از هوش مصنوعی خواستند تا این معما را حل کند:
یک شاهزاده خانم به همان اندازه سن دارد که شاهزاده در زمانی خواهد داشت که شاهزاده خانم دو برابر سن شاهزاده را داشته باشد، در زمانی که سن شاهزاده خانم نصف مجموع سن فعلی آنها بود. سن شاهزاده و شاهزاده خانم چقدر است؟ تمامی راه حلهای این سوال را ارائه دهید.
مدل برای سی ثانیه در حالت انتظار قرار گرفت و سپس پاسخ صحیحی ارائه داد. OpenAI رابط کاربری را طوری طراحی کرده است که مراحل تفکر مدل را هنگام فکر کردن نشان میدهد. نکته جالب این نیست که o1 کار خود را نشان داد – GPT-4o هم میتواند این کار را انجام دهد اگر از آن خواسته شود – بلکه این است که چگونه o1 عمدا سعی کرده شبیه به فکر انسان به نظر برسد. عباراتی مانند «من کنجکاو هستم درباره»، «من در حال فکر کردن هستم» و «باشه، بگذار ببینم» تداعیگر مراحل گام به گامی از تفکر است.
اما این مدل در حال فکر کردن نیست و قطعاً انسان نیست. پس چرا طراحی شده است تا به نظر برسد که هست؟
بنا به گفته توورک، اوپنایآی به برابر دانستن تفکر مدل هوش مصنوعی با تفکر انسانی اعتقاد ندارد. اما رابط کاربری به گونهای طراحی شده که نشان دهد مدل چگونه زمان بیشتری را صرف پردازش و عمیقتر شدن در حل مسائل میکند. او میگوید: «روشهایی وجود دارد که باعث میشود این مدل بیشتر از مدلهای قبلی انسانی به نظر برسد.»
مکگرو میگوید: «فکر میکنم خواهید دید که راههای زیادی وجود دارد که در آنها مدل کمی بیگانه به نظر میرسد. اما همچنین راههایی وجود دارد که به طور غافلگیرکنندهای انسانی به نظر میرسد.» به مدل زمان محدودی برای پردازش پرسشها داده میشود، بنابراین ممکن است چیزی شبیه به این بگوید: «اوه، وقتم دارد تمام میشود، بگذار سریع به یک پاسخ برسم.» همچنین در ابتدای زنجیره فکری خود، ممکن است به نظر برسد که در حال طوفان فکری است و چیزی شبیه به این بگوید: «میتوانم این کار یا آن کار را انجام دهم، باید چه کار کنم؟»
حرکت به سوی تصمیمگیری جای انسان
مدلهای بزرگ زبانی که امروزه وجود دارند، دقیقاً به هوشمندی که تصور میشود نیستند. آنها اساسا فقط دنبالههایی از کلمات را برای رسیدن به پاسخی بر اساس الگوهای یادگرفته شده از حجم عظیمی از دادهها پیشبینی میکنند. به عنوان مثال، ChatGPT گاهی اوقات اشتباهاً ادعا میکند که کلمه «توتفرنگی» فقط یک حرف ت دارد، زیرا آن را به درستی تجزیه و تحلیل نمیکند. اما شاید بد نباشد بدانید، مدل جدید o1 این پرسش را به درستی پاسخ داد.
در حالی که گزارشها حاکی از آن است که OpenAI به دنبال جذب سرمایهگذاری بیشتر با ارزشگذاری خیرهکننده 150 میلیارد دلار است، شتاب آن به دستاوردهای بیشتر تحقیقاتی بستگی دارد. این شرکت در حال افزودن قابلیتهای استدلال به مدلهای بزرگ زبانی است. زیرا آیندهای را میبیند که در آن سیستمهای خودکار یا عواملی وجود دارند که قادر به اتخاذ تصمیمات و انجام اقدامات به نیابت از شما هستند.
برای پژوهشگران هوش مصنوعی، شکستن مرزهای استدلال گام مهمی به سوی دستیابی به سطح هوش انسانی است. این تفکر وجود دارد که اگر مدلی فراتر از تشخیص الگو قادر به عملکرد باشد، میتواند در زمینههایی مانند پزشکی و مهندسی، دستاوردهای شگرفی را ممکن سازد. با این حال، در حال حاضر، تواناییهای استدلالی o1 نسبتاً کند، و برای توسعهدهندگان هزینهبر است.
مکگرو میگوید «ما ماههاست که روی استدلال کار میکنیم زیرا فکر میکنیم این در واقع پیشرفت حیاتی است. در اصل، این یک شیوهی جدید برای مدلها است تا بتوانند مشکلات واقعاً دشواری را که برای پیشرفت به سمت سطوح هوش مانند انسان لازم است، حل کنند.»
source