
بر اساس گزارشی جدید، شرکت متا در حال توسعه یک مدل هوش مصنوعی تازه با تمرکز بر تولید و پردازش تصویر و ویدئو است که با نام رمز Mango شناخته میشود. همزمان، این شرکت روی یک مدل زبانی بزرگ مبتنی بر متن با نام Avocado نیز کار میکند. انتظار میرود هر دو مدل در نیمه نخست سال ۲۰۲۶ معرفی و منتشر شوند.
به گزارش والاستریت ژورنال (WSJ)، الکساندر وانگ، مدیر ارشد هوش مصنوعی متا، در یک نشست پرسشوپاسخ داخلی با حضور کریس کاکس، مدیر ارشد محصول این شرکت، درباره این مدلهای جدید توضیحاتی ارائه داده است. وانگ در این جلسه به مدل متنی Avocado اشاره کرده و گفته است که یکی از اهداف اصلی آن، بهبود چشمگیر تواناییها در انجام وظایف برنامهنویسی و کدنویسی خواهد بود.
علاوه بر این، متا کارهای اولیهای را روی مفهومی موسوم به «مدلهای جهانی» (World Models) آغاز کرده است. این سیستمها با دریافت و تحلیل اطلاعات بصری از محیط، تلاش میکنند درک عمیقتری از دنیای واقعی به دست آورند و به هوش مصنوعی کمک کنند تا محیط اطراف خود را بهتر بفهمد.
در تابستان امسال، متا ساختار فعالیتهای هوش مصنوعی خود را بازسازماندهی کرد و الکساندر وانگ را برای هدایت گروه جدیدی با عنوان Meta Superintelligence Labs به خدمت گرفت. طبق این گزارش، مارک زاکربرگ، مدیرعامل متا، نقش فعالی در شکلگیری این تیم داشته و بیش از ۲۰ پژوهشگر را از شرکت OpenAI جذب کرده است. این بخش جدید اکنون شامل بیش از ۵۰ پژوهشگر، مهندس و متخصص حوزه هوش مصنوعی است.
تولید تصویر و ویدئو به یکی از میدانهای رقابت اصلی میان شرکتهای فعال در حوزه هوش مصنوعی تبدیل شده است. متا در ماه سپتامبر از مولد ویدئوی هوش مصنوعی خود با نام Vibes رونمایی کرد که با همکاری استارتاپ Midjourney توسعه یافته بود. کمتر از یک هفته بعد، OpenAI نیز ابزار تولید ویدئوی خود با نام Sora را معرفی کرد.
گوگل نیز در این حوزه موفقیتهایی به دست آورده است. اوایل امسال، ابزار تولید تصویر Nano Banana به رشد سریع پلتفرم Gemini کمک کرد و تعداد کاربران ماهانه آن را از حدود ۴۵۰ میلیون نفر در ماه جولای به بیش از ۶۵۰ میلیون نفر تا اواخر اکتبر رساند.
پس از آنکه گوگل در ماه نوامبر نسخه سوم Gemini را منتشر کرد، سم آلتمن، مدیرعامل OpenAI، از وضعیت «کد قرمز» در این شرکت خبر داد؛ اقدامی که با هدف بازپسگیری برتری در شاخصهای کلیدی عملکرد انجام شد. در ادامه، OpenAI نسخه بهروزشدهای از ChatGPT Images را نیز عرضه کرد.
source