OpenAI در رویداد آنلاین ۱۲ روزه خود از مدل‌های هوش مصنوعی استدلال‌گر o3 و o3-mini با قابلیت تفکر در سطح انسان رونمایی کرد.

سم آلتمن، مدیر عامل OpenAI، مدل‌های هوش مصنوعی o3 و o3-mini را در آخرین روز از رویداد آنلاین ۱۲ روزه OpenAI معرفی کرد. این مدل‌ها بر اساس مدل‌های قبلی o1 ساخته شده‌ و با استفاده از روش «زنجیره خصوصی فکر» پاسخ‌های خود را از قبل برنامه‌ریزی می‌کنند. به این نوع روش، استدلال شبیه‌سازی شده (SR) می‌گویند.

مدل o3 توانست در بنچمارک ARC-AGI رکورد جدیدی را کسب کند به طوری که در بخش منابع رایانشی کم امتیاز ۷۵.۷% و در بخش منابع رایانشی بالا ۸۷.۵% به دست آورد. این نتایج قابل مقایسه با عملکرد انسانی عنوان شده است. o3 همچنین در انجمن ریاضی ۲۰۲۴ آمریکا امتیاز ۹۶.۷ درصد و در آزمون GPQA Diamond که شامل سؤالاتی در سطح کارشناسی در زیست شناسی، فیزیک و شیمی بود، ۸۷.۷ درصد کسب کرد. در بخش ریاضی Frontier مدل o3 توانست ۲۵.۲ درصد مسئله‌ها را حل کند، در حالی که پیش از این هیچ مدل نتوانسته بود بیش از ۲ درصد را حل کند.

مدل o3-mini دارای ویژگی تفکر انطباقی زمان ​​است که باعث ارائه سرعت‌های پردازش پایین، متوسط ​​و بالا می‌شود. OpenAI مدعی است تنظیمات رایانشی بالاتر منجر به ارائه نتایج بهتر می‌شود. این مدل‌ها فعلاً به منظور آزمایش در دسترس کارشناسان امنیتی قرار خواهند گرفت. لازم به ذکر است o3-mini برای عرضه در اواخر ژانویه برنامه ریزی شده است و مدتی بعد o3 در دسترس قرار خواهد گرفت.

source

توسط wikiche.com