در رویداد Google I/O 2025، این غول جست‌وجو مجموعه‌ای از ابزارهای جدید هوش مصنوعی را معرفی کرد که مهم‌ترین آن‌ها Gemini Flash 2.5 بود و همه به آن دسترسی دارند. یکی دیگر از پیشرفت‌های جالب مربوط به مدل‌های زبانی کوچک (LLM) بود، جایی که شرکت، مدل Gemma 3n را معرفی کرد؛ مدلی که به‌گونه‌ای طراحی شده تا مستقیماً روی دستگاه‌های شخصی شما اجرا شود.

بزرگ‌ترین پیشرفت جدید در Gemma 3n این است که از نوآوری‌ای استفاده می‌کند که توسط گوگل دیپ‌مایند توسعه یافته و Per-Layer Embeddings (PLE) نام دارد. این فناوری نیاز به حافظه برای مدل را کاهش می‌دهد. تعداد پارامتر خام برای Gemma 3n، ۵ میلیارد و ۸ میلیارد است، اما میزان حافظه‌ی مورد نیاز آن با مدل‌های ۲ میلیاردی و ۴ میلیاردی قابل مقایسه است. گوگل ادعا می‌کند که این مدل‌ها می‌توانند تنها با ۲ گیگابایت و ۳ گیگابایت حافظه اجرا شوند.

 

گوگل مدل هوش مصنوعی جدید Gemma 3n را با عملکرد فوق‌العاده و قابلیت اجرا روی دستگاه‌های شخصی معرفی کرد

 

علاوه بر داشتن مصرف حافظه کمتر، تکنیک‌هایی مانند PLE، اشتراک‌گذاری KVC و کوانتیزاسیون پیشرفته‌ی اکتیویشن‌ها باعث می‌شوند Gemma 3n در موبایل ۱.۵ برابر سریع‌تر از Gemma 3 4B شروع به پاسخ‌دهی کند و کیفیت بسیار بهتری داشته باشد. همچنین Gemma 3n از قابلیتی به نام mix‘n’match بهره می‌برد که به آن اجازه می‌دهد به صورت پویا زیرمدل‌هایی بسازد که بهینه‌تر برای نیازهای خاص شما باشند.

یکی دیگر از مزیت‌ها این است که Gemma 3n از اجرای محلی استفاده می‌کند، یعنی کاملاً توسط دستگاه شما اجرا می‌شود و هیچ داده‌ای به هیچ سروری ارسال نمی‌شود تا ورودی‌های شما بررسی شوند. افزون بر این، این قابلیت باعث می‌شود که بتوانید بدون اتصال به اینترنت از آن استفاده کنید که مزیت بزرگی محسوب می‌شود.

همچنین گفته شده که این مدل در دریافت ورودی‌های چندرسانه‌ای (مالتی‌مودال) بسیار بهتر عمل می‌کند، زیرا می‌تواند صدا، متن و تصویر را درک کند و گفته شده که توانایی درک ویدیو در آن به طور قابل توجهی افزایش یافته است. این ویژگی به آن امکان می‌دهد که بین ورودی‌های مختلف مانند تبدیل گفتار به متن، ترجمه و ورودی‌های ترکیبی از چند رسانه را انجام دهد و بتواند تعاملات پیچیده‌ی چندرسانه‌ای را بفهمد.

در نهایت، Gemma 3n وعده داده که در زبان‌های غیر انگلیسی نیز عملکرد بهتری داشته باشد. کاربران به ویژه شاهد بهبود عملکرد در زبان‌های ژاپنی، آلمانی، کره‌ای، اسپانیایی و فرانسوی خواهند بود. این مدل در آزمون‌های چندزبانه عملکرد قوی از خود نشان داده، مثلاً امتیاز ۵۰.۱٪ در WMT24++ کسب کرده است.

شما می‌توانید همین حالا استفاده از Gemma 3n را مستقیماً در مرورگر خود و از طریق Google AI Studio آغاز کنید، بدون اینکه نیاز به هیچ تنظیماتی داشته باشید. توسعه‌دهندگانی که می‌خواهند این مدل را به صورت محلی به کار بگیرند، می‌توانند از طریق Google AI Edge این کار را انجام دهند که ابزارها و کتابخانه‌های لازم را فراهم می‌کند. این روش دوم، قابلیت درک و تولید متن و تصویر را همین امروز در اختیار شما قرار می‌دهد و امکانات بیشتری نیز در آینده اضافه خواهد شد.

source

توسط wikiche.com