گوگل مدل تولید ویدیوی Veo 2 را به ویرایشگر Google Vids اضافه کرده است. حالا این شرکت مدل جدیدتر خود، یعنی Veo 3 را که در رویداد I/O 2025 معرفی شد و به خاطر کلیپهای واقعگرایانهاش سر و صدای زیادی به پا کرد، عرضه کرده است. مهمترین ویژگی این نسخه جدید این است که میتواند ویدیو و صدای همزمان را مستقیماً از یک متن تولید کند.
اکنون هر کسی که یک طرح Google Workspace سازگار داشته باشد، میتواند درون یک پروژه Vids کلیپهای ۸ ثانیهای بسازد. کافی است روی آیکون «تولید ویدیو» در ویرایشگر کلیک کنید، Veo 3 را انتخاب کنید و سپس بنویسید دوست دارید چه چیزی ببینید و بشنوید. مثالهای گوگل شامل چیزهایی مانند یک سخنگو که برای نمایش یک محصول صحبت میکند یا یک کارمند که مقدمهای برای ویدیوی ایمنی ارائه میدهد، است. این مدل آنقدر خوب است که دیالوگهایی تولید میکند که واقعاً با حرکت لب شخصیت هماهنگ هستند. بعد از ساخت کلیپ، میتوانید آن را به راحتی وارد ویدیوی خود کنید. و اگر صدای تولیدشده خوب نبود، میتوانید صدای کلیپ را قطع (Mute) کنید.
عملکرد Veo 3 در Google Vids
در حال حاضر کلیپهای ساخته شده با این مدل با کیفیت 720p و نرخ ۲۴ فریم در ثانیه هستند، که البته با پتانسیل مدل مستقل Veo 3 برای تولید ویدیوهای 4K فاصله زیادی دارد. با این حال، اضافه شدن قابلیت تولید صدای کاربردی به طور داخلی یک پیشرفت بزرگ است. این قابلیت صدای بومی دقیقاً همان چیزی است که Veo 3 را از رقبایی مانند Sora شرکت OpenAI متمایز میکند، چون Sora عمدتاً فقط ویدیوهای بدون صدا تولید میکند.
گوگل به تازگی شروع به فعالسازی این ویژگی کرده، اما اگر هنوز آن را در حساب خود نمیبینید نگران نباشید. این شرکت انتشار را به صورت تدریجی انجام میدهد و ممکن است تا ۱۵ روز طول بکشد تا کامل شود، بنابراین دسترسی شما بستگی به موجی دارد که حسابتان در آن قرار گرفته و این که ادمین شرکت شما از مسیر انتشار سریع (Rapid Release) یا زمانبندیشده (Scheduled Release) استفاده میکند یا نه. این قابلیت برای بسیاری از کاربران پولی Google Workspace از جمله مشترکان Business Standard و Plus و همچنین Enterprise Standard و Plus در دسترس است.
همچنین برای کاربران پلن Essentials، سازمانهای غیرانتفاعی (Nonprofits) و حتی پلنهای ابتداییتر مانند Business Starter و Enterprise Starter هم فعال شده است. فعلاً تولید هوشمند ویدیویی فقط دستورات را به زبان انگلیسی میفهمد و همه ویدیوها به طور نامرئی واترمارکگذاری میشوند تا مشخص باشد توسط هوش مصنوعی ساخته شدهاند.
source