شرکت OpenAI در حال انتشار مدل هوش مصنوعی جدیدی به نام o1 است، که اولین مدل در سری برنامه‌ریزی شده‌ی مدل‌های «استدلال» محسوب می‌شود. یک هوش مصنوعی که برای پاسخگویی به سوالات پیچیده‌تر، سریع‌تر از انسان آموزش دیده‌ است. این مدل همراه با نسخه‌ی کوچک‌تر و ارزان‌تری به نام o1-mini منتشر می‌شود. و بله، اگر شما در شایعات هوش مصنوعی غرق شده‌اید: این در واقع، همان مدل بسیار موردانتظار Strawberry است.

عرضه و قیمت مدل هوش مصنوعی o1

برای OpenAI، مدل o1 گامی به سوی هدف گسترده‌تر آن‌ها، یعنی هوش مصنوعی شبیه به انسان است. به طور عملی‌تر، این مدل در نوشتن کد و حل مسائل چند مرحله‌ای نسبت به مدل‌های قبلی عملکرد بهتری دارد. اما استفاده از آن نسبت به GPT-4o گران‌تر و کندتر است. OpenAI این انتشار از o1 را به عنوان «پیش‌نمایش» معرفی می‌کند تا تأکید کند که چقدر این مدل جدید است.

از امروز، کاربران ChatGPT Plus و Team به هر دو نسخه o1-preview و o1-mini دسترسی خواهند داشت. در حالی که کاربران Enterprise و Edu از اوایل هفته آینده به این سرویس‌ها دسترسی پیدا می‌کنند. OpenAI اعلام کرده که برنامه دارد دسترسی به o1-mini را برای تمام کاربران رایگان ChatGPT فراهم کند، اما هنوز تاریخ انتشار مشخصی را تعیین نکرده است.

دسترسی توسعه‌دهندگان به o1 بسیار گران است: در API، قیمت o1-preview برای هر یک میلیون توکن ورودی، یا قطعات متنی که توسط مدل تجزیه و تحلیل می‌شوند، 15 دلار و برای هر یک میلیون توکن خروجی 60 دلار است. برای مقایسه، هزینه GPT-4o برای هر یک میلیون توکن ورودی 5 دلار و برای هر یک میلیون توکن خروجی 15 دلار است.

o1 چه تقاوتی با مدل‌های قبلی دارد؟

آموزش پشت o1 از نظر بنیادین با نسل‌های قبلی خود متفاوت است. رهبر تحقیقات OpenAI، «جری توورک»، به کایلی رابیسون نویسنده ورج توضیح می‌دهد. اگرچه شرکت هنوز درباره برخی جزئیات مطمئن نیست. او می‌گوید o1 «با استفاده از یک الگوریتم بهینه‌سازی کاملاً جدید و یک مجموعه داده آموزشی جدید که به طور خاص برای آن طراحی شده، آموزش دیده است.»

OpenAI مدل‌های قبلی GPT را آموزش داده است تا الگوهایی را از داده‌های آموزشی خود تقلید کنند. اما در o1 با استفاده از روشی به نام یادگیری تقویتی، که سیستم را از طریق پاداش‌ها و تنبیه‌ها آموزش می‌دهد، مدل را برای حل مسائل به صورت مستقل آموزش داده است. هوش مصنوعی o1 سپس از یک «زنجیره فکری» برای پردازش پرسش‌ها استفاده می‌کند. به طریقی مشابه پردازش مسائل توسط انسان‌ها که به صورت گام به گام انجام می‌شود.

به عنوان نتیجه این روش آموزشی جدید، OpenAI می‌گوید که مدل باید دقیق‌تر باشد. توورک می‌گوید «ما متوجه شده‌ایم که این مدل کمتر دچار توهم می‌شود.» اما مشکل همچنان پابرجاست. «ما نمی‌توانیم بگوییم که توهمات را حل کرده‌ایم.»

وجه تمایز o1 با مدل‌های قبلی چیست؟

ویژگی اصلی که این مدل جدید را از GPT-4o متمایز می‌کند، توانایی آن در حل مسائل پیچیده‌تر مانند برنامه‌نویسی و ریاضیات است که به مراتب بهتر از نسخه‌های پیشین عمل می‌کند. همچنین این مدل قادر است دلایل خود را توضیح دهد.

مدیر تحقیقات ارشد OpenAI، «باب مک‌گرو»، می‌گوید «این مدل قطعاً در حل آزمون ریاضی AP از من بهتر است. در حالی که من در دانشگاه رشته ریاضی خوانده‌ام.» او می‌گوید OpenAI همچنین o1 را در آزمون ورودی المپیاد بین‌المللی ریاضیات آزمایش کرده است. در حالی که GPT-4o تنها 13 درصد از مسائل را به درستی حل کرده است، o1 به دستاورد 83 درصد رسیده است.

در مسابقات برنامه‌نویسی آنلاین که به رقابت‌های Codeforces شناخته می‌شوند، این مدل جدید به درصد 89 شرکت‌کنندگان دست یافت. OpenAI ادعا می‌کند که به‌روزرسانی بعدی این مدل، عملکردی «مشابه دانشجویان دکتری در سوالات معیار چالش‌برانگیز در فیزیک، شیمی و زیست‌شناسی» خواهد داشت.

در عین حال، هوش مصنوعی o1 به اندازه GPT-4o در بسیاری از زمینه‌ها توانمند نیست. این مدل در دانش واقعی درباره جهان به خوبی عمل نمی‌کند. همچنین توانایی جستجو در وب یا پردازش فایل‌ها و تصاویر را ندارد. با این حال، شرکت معتقد است که این مدل نمایانگر یک کلاس جدید از توانایی‌ها است. این مدل به نام o1 نامگذاری شده است تا نشان دهد که «همه چیز دوباره به عدد 1 بازگردانده شده».

آزمونی برای هوش مصنوعی o1

مک گرو می‌گوید: «بیایید صادق باشیم: فکر می‌کنم ما سنتاً در نام‌گذاری وحشتناک هستیم.» او ابراز امیدواری می‌کند که این اولین قدم برای نام‌های جدیدتر و عاقلانه‌تری باشد «که بهتر بتوانند آنچه را که ما در حال انجامش به دنیا هستیم، منتقل کنند.»

نویسنده ورج شخصا قادر به امتحان کردن o1 نبوده است. اما مک گرو و توورک این هفته آن را در یک تماس ویدیویی به او نشان دادند. آنها از هوش مصنوعی خواستند تا این معما را حل کند:

یک شاهزاده خانم به همان اندازه سن دارد که شاهزاده در زمانی خواهد داشت که شاهزاده خانم دو برابر سن شاهزاده را داشته باشد، در زمانی که سن شاهزاده خانم نصف مجموع سن فعلی آن‌ها بود. سن شاهزاده و شاهزاده خانم چقدر است؟ تمامی راه حل‌های این سوال را ارائه دهید.

مدل برای سی ثانیه در حالت انتظار قرار گرفت و سپس پاسخ صحیحی ارائه داد. OpenAI رابط کاربری را طوری طراحی کرده است که مراحل تفکر مدل را هنگام فکر کردن نشان می‌دهد. نکته جالب این نیست که o1 کار خود را نشان داد – GPT-4o هم می‌تواند این کار را انجام دهد اگر از آن خواسته شود – بلکه این است که چگونه o1 عمدا سعی کرده شبیه به فکر انسان به نظر برسد. عباراتی مانند «من کنجکاو هستم درباره»، «من در حال فکر کردن هستم» و «باشه، بگذار ببینم» تداعی‌گر مراحل گام به گامی از تفکر است.

اما این مدل در حال فکر کردن نیست و قطعاً انسان نیست. پس چرا طراحی شده است تا به نظر برسد که هست؟

بنا به گفته توورک، اوپن‌ای‌آی به برابر دانستن تفکر مدل هوش مصنوعی با تفکر انسانی اعتقاد ندارد. اما رابط کاربری به گونه‌ای طراحی شده که نشان دهد مدل چگونه زمان بیشتری را صرف پردازش و عمیق‌تر شدن در حل مسائل می‌کند. او می‌گوید: «روش‌هایی وجود دارد که باعث می‌شود این مدل بیشتر از مدل‌های قبلی انسانی به نظر برسد.»

مک‌گرو می‌گوید: «فکر می‌کنم خواهید دید که راه‌های زیادی وجود دارد که در آن‌ها مدل کمی بیگانه به نظر می‌رسد. اما همچنین راه‌هایی وجود دارد که به طور غافلگیرکننده‌ای انسانی به نظر می‌رسد.» به مدل زمان محدودی برای پردازش پرسش‌ها داده می‌شود، بنابراین ممکن است چیزی شبیه به این بگوید: «اوه، وقتم دارد تمام می‌شود، بگذار سریع به یک پاسخ برسم.» همچنین در ابتدای زنجیره فکری خود، ممکن است به نظر برسد که در حال طوفان فکری است و چیزی شبیه به این بگوید: «می‌توانم این کار یا آن کار را انجام دهم، باید چه کار کنم؟»

حرکت به سوی تصمیم‌گیری جای انسان

مدل‌های بزرگ زبانی که امروزه وجود دارند، دقیقاً به هوشمندی که تصور می‌شود نیستند. آن‌ها اساسا فقط دنباله‌هایی از کلمات را برای رسیدن به پاسخی بر اساس الگوهای یادگرفته شده از حجم عظیمی از داده‌ها پیش‌بینی می‌کنند. به عنوان مثال، ChatGPT گاهی اوقات اشتباهاً ادعا می‌کند که کلمه «توت‌فرنگی» فقط یک حرف ت دارد، زیرا آن را به درستی تجزیه و تحلیل نمی‌کند. اما شاید بد نباشد بدانید، مدل جدید o1 این پرسش را به درستی پاسخ داد.

در حالی که گزارش‌ها حاکی از آن است که OpenAI به دنبال جذب سرمایه‌گذاری بیشتر با ارزش‌گذاری خیره‌کننده 150 میلیارد دلار است، شتاب آن به دستاوردهای بیشتر تحقیقاتی بستگی دارد. این شرکت در حال افزودن قابلیت‌های استدلال به مدل‌های بزرگ زبانی است. زیرا آینده‌ای را می‌بیند که در آن سیستم‌های خودکار یا عواملی وجود دارند که قادر به اتخاذ تصمیمات و انجام اقدامات به نیابت از شما هستند.

برای پژوهشگران هوش مصنوعی، شکستن مرزهای استدلال گام مهمی به سوی دستیابی به سطح هوش انسانی است. این تفکر وجود دارد که اگر مدلی فراتر از تشخیص الگو قادر به عملکرد باشد، می‌تواند در زمینه‌هایی مانند پزشکی و مهندسی، دستاوردهای شگرفی را ممکن سازد. با این حال، در حال حاضر، توانایی‌های استدلالی o1 نسبتاً کند، و برای توسعه‌دهندگان هزینه‌بر است.

مک‌گرو می‌گوید «ما ماه‌هاست که روی استدلال کار می‌کنیم زیرا فکر می‌کنیم این در واقع پیشرفت حیاتی است. در اصل، این یک شیوه‌ی جدید برای مدل‌ها است تا بتوانند مشکلات واقعاً دشواری را که برای پیشرفت به سمت سطوح هوش مانند انسان لازم است، حل کنند.»

source

توسط wikiche.com