گوگل مدل تولید ویدیوی Veo 2 را به ویرایشگر Google Vids اضافه کرده است. حالا این شرکت مدل جدیدتر خود، یعنی Veo 3 را که در رویداد I/O 2025 معرفی شد و به خاطر کلیپ‌های واقع‌گرایانه‌اش سر و صدای زیادی به پا کرد، عرضه کرده است. مهم‌ترین ویژگی این نسخه جدید این است که می‌تواند ویدیو و صدای همزمان را مستقیماً از یک متن تولید کند.

اکنون هر کسی که یک طرح Google Workspace سازگار داشته باشد، می‌تواند درون یک پروژه Vids کلیپ‌های ۸ ثانیه‌ای بسازد. کافی است روی آیکون «تولید ویدیو» در ویرایشگر کلیک کنید، Veo 3 را انتخاب کنید و سپس بنویسید دوست دارید چه چیزی ببینید و بشنوید. مثال‌های گوگل شامل چیزهایی مانند یک سخنگو که برای نمایش یک محصول صحبت می‌کند یا یک کارمند که مقدمه‌ای برای ویدیوی ایمنی ارائه می‌دهد، است. این مدل آنقدر خوب است که دیالوگ‌هایی تولید می‌کند که واقعاً با حرکت لب شخصیت هماهنگ هستند. بعد از ساخت کلیپ، می‌توانید آن را به راحتی وارد ویدیوی خود کنید. و اگر صدای تولیدشده خوب نبود، می‌توانید صدای کلیپ را قطع (Mute) کنید.

 

گوگل Veo 3 را به Google Vids آورد؛ تولید ویدیو و صدا فقط با متن

 

عملکرد Veo 3 در Google Vids

در حال حاضر کلیپ‌های ساخته شده با این مدل با کیفیت 720p و نرخ ۲۴ فریم در ثانیه هستند، که البته با پتانسیل مدل مستقل Veo 3 برای تولید ویدیوهای 4K فاصله زیادی دارد. با این حال، اضافه شدن قابلیت تولید صدای کاربردی به طور داخلی یک پیشرفت بزرگ است. این قابلیت صدای بومی دقیقاً همان چیزی است که Veo 3 را از رقبایی مانند Sora شرکت OpenAI متمایز می‌کند، چون Sora عمدتاً فقط ویدیوهای بدون صدا تولید می‌کند.

گوگل به تازگی شروع به فعال‌سازی این ویژگی کرده، اما اگر هنوز آن را در حساب خود نمی‌بینید نگران نباشید. این شرکت انتشار را به صورت تدریجی انجام می‌دهد و ممکن است تا ۱۵ روز طول بکشد تا کامل شود، بنابراین دسترسی شما بستگی به موجی دارد که حساب‌تان در آن قرار گرفته و این که ادمین شرکت شما از مسیر انتشار سریع (Rapid Release) یا زمان‌بندی‌شده (Scheduled Release) استفاده می‌کند یا نه. این قابلیت برای بسیاری از کاربران پولی Google Workspace از جمله مشترکان Business Standard و Plus و همچنین Enterprise Standard و Plus در دسترس است.

همچنین برای کاربران پلن Essentials، سازمان‌های غیرانتفاعی (Nonprofits) و حتی پلن‌های ابتدایی‌تر مانند Business Starter و Enterprise Starter هم فعال شده است. فعلاً تولید هوشمند ویدیویی فقط دستورات را به زبان انگلیسی می‌فهمد و همه ویدیوها به طور نامرئی واترمارک‌گذاری می‌شوند تا مشخص باشد توسط هوش مصنوعی ساخته شده‌اند.

source

توسط wikiche.com