بر اساس گزارشی جدید، شرکت متا در حال توسعه یک مدل هوش مصنوعی تازه با تمرکز بر تولید و پردازش تصویر و ویدئو است که با نام رمز Mango شناخته می‌شود. هم‌زمان، این شرکت روی یک مدل زبانی بزرگ مبتنی بر متن با نام Avocado نیز کار می‌کند. انتظار می‌رود هر دو مدل در نیمه نخست سال ۲۰۲۶ معرفی و منتشر شوند.

به گزارش وال‌استریت ژورنال (WSJ)، الکساندر وانگ، مدیر ارشد هوش مصنوعی متا، در یک نشست پرسش‌وپاسخ داخلی با حضور کریس کاکس، مدیر ارشد محصول این شرکت، درباره این مدل‌های جدید توضیحاتی ارائه داده است. وانگ در این جلسه به مدل متنی Avocado اشاره کرده و گفته است که یکی از اهداف اصلی آن، بهبود چشمگیر توانایی‌ها در انجام وظایف برنامه‌نویسی و کدنویسی خواهد بود.

علاوه بر این، متا کارهای اولیه‌ای را روی مفهومی موسوم به «مدل‌های جهانی» (World Models) آغاز کرده است. این سیستم‌ها با دریافت و تحلیل اطلاعات بصری از محیط، تلاش می‌کنند درک عمیق‌تری از دنیای واقعی به دست آورند و به هوش مصنوعی کمک کنند تا محیط اطراف خود را بهتر بفهمد.

در تابستان امسال، متا ساختار فعالیت‌های هوش مصنوعی خود را بازسازمان‌دهی کرد و الکساندر وانگ را برای هدایت گروه جدیدی با عنوان Meta Superintelligence Labs به خدمت گرفت. طبق این گزارش، مارک زاکربرگ، مدیرعامل متا، نقش فعالی در شکل‌گیری این تیم داشته و بیش از ۲۰ پژوهشگر را از شرکت OpenAI جذب کرده است. این بخش جدید اکنون شامل بیش از ۵۰ پژوهشگر، مهندس و متخصص حوزه هوش مصنوعی است.

تولید تصویر و ویدئو به یکی از میدان‌های رقابت اصلی میان شرکت‌های فعال در حوزه هوش مصنوعی تبدیل شده است. متا در ماه سپتامبر از مولد ویدئوی هوش مصنوعی خود با نام Vibes رونمایی کرد که با همکاری استارتاپ Midjourney توسعه یافته بود. کمتر از یک هفته بعد، OpenAI نیز ابزار تولید ویدئوی خود با نام Sora را معرفی کرد.

گوگل نیز در این حوزه موفقیت‌هایی به دست آورده است. اوایل امسال، ابزار تولید تصویر Nano Banana به رشد سریع پلتفرم Gemini کمک کرد و تعداد کاربران ماهانه آن را از حدود ۴۵۰ میلیون نفر در ماه جولای به بیش از ۶۵۰ میلیون نفر تا اواخر اکتبر رساند.

پس از آنکه گوگل در ماه نوامبر نسخه سوم Gemini را منتشر کرد، سم آلتمن، مدیرعامل OpenAI، از وضعیت «کد قرمز» در این شرکت خبر داد؛ اقدامی که با هدف بازپس‌گیری برتری در شاخص‌های کلیدی عملکرد انجام شد. در ادامه، OpenAI نسخه به‌روزشده‌ای از ChatGPT Images را نیز عرضه کرد.

source

توسط wikiche.com