OpenAI در رویداد آنلاین ۱۲ روزه خود از مدلهای هوش مصنوعی استدلالگر o3 و o3-mini با قابلیت تفکر در سطح انسان رونمایی کرد.
سم آلتمن، مدیر عامل OpenAI، مدلهای هوش مصنوعی o3 و o3-mini را در آخرین روز از رویداد آنلاین ۱۲ روزه OpenAI معرفی کرد. این مدلها بر اساس مدلهای قبلی o1 ساخته شده و با استفاده از روش «زنجیره خصوصی فکر» پاسخهای خود را از قبل برنامهریزی میکنند. به این نوع روش، استدلال شبیهسازی شده (SR) میگویند.
مدل o3 توانست در بنچمارک ARC-AGI رکورد جدیدی را کسب کند به طوری که در بخش منابع رایانشی کم امتیاز ۷۵.۷% و در بخش منابع رایانشی بالا ۸۷.۵% به دست آورد. این نتایج قابل مقایسه با عملکرد انسانی عنوان شده است. o3 همچنین در انجمن ریاضی ۲۰۲۴ آمریکا امتیاز ۹۶.۷ درصد و در آزمون GPQA Diamond که شامل سؤالاتی در سطح کارشناسی در زیست شناسی، فیزیک و شیمی بود، ۸۷.۷ درصد کسب کرد. در بخش ریاضی Frontier مدل o3 توانست ۲۵.۲ درصد مسئلهها را حل کند، در حالی که پیش از این هیچ مدل نتوانسته بود بیش از ۲ درصد را حل کند.
مدل o3-mini دارای ویژگی تفکر انطباقی زمان است که باعث ارائه سرعتهای پردازش پایین، متوسط و بالا میشود. OpenAI مدعی است تنظیمات رایانشی بالاتر منجر به ارائه نتایج بهتر میشود. این مدلها فعلاً به منظور آزمایش در دسترس کارشناسان امنیتی قرار خواهند گرفت. لازم به ذکر است o3-mini برای عرضه در اواخر ژانویه برنامه ریزی شده است و مدتی بعد o3 در دسترس قرار خواهد گرفت.
source