دستگاههای اندرویدی سالهاست که دارای یک قابلیت صفحهخوان داخلی به نام TalkBack هستند. این ویژگی به افراد دارای مشکلات بینایی کمک میکند تا محتوای نمایشدادهشده روی صفحهنمایش گوشی خود را درک کرده و با استفاده از صدا آن را کنترل کنند. در سال ۲۰۲۴، گوگل هوش مصنوعی Gemini را به این قابلیت اضافه کرد تا توصیف دقیقتری از تصاویر ارائه دهد.
اکنون گوگل این ویژگی را با یک لایه جدید از تعاملات راحتتر برای کاربران تقویت کرده است. تا پیش از این، Gemini فقط تصاویر را توصیف میکرد. اما اکنون کاربران هنگام مشاهده تصاویر میتوانند سوالات تکمیلی درباره آنها بپرسند و گفتوگوی دقیقتری داشته باشند.
این قابلیت چگونه به افراد با مشکلات بینایی کمک میکند؟
گوگل میگوید: دفعه بعد که یکی از دوستانتان عکسی از گیتار جدیدش برایتان بفرستد، میتوانید توصیفی از آن دریافت کرده و سوالاتی مانند نوع و رنگ آن یا حتی اینکه چه چیزهای دیگری در تصویر هستند بپرسید. این قابلیت بر پایهی ارتقای دسترسیپذیریای است که در اواخر سال گذشته، Gemini را در سیستم TalkBack ادغام کرد.

در منوی TalkBack در اندروید، اکنون گزینهای اختصاصی به نام Describe Screen (توصیف صفحه) دیده میشود که Gemini را در مرکز کنترل قرار میدهد. بهعنوان مثال، اگر کاربران در حال مرور یک کاتالوگ پوشاک باشند، Gemini نه تنها آنچه روی صفحه است را توصیف میکند، بلکه به سوالات مرتبط نیز پاسخ میدهد.
برای نمونه، کاربران میتوانند سوالاتی مانند «کدام لباس برای یک شب سرد زمستانی مناسبتر است؟» یا «کدام سس برای ساندویچ بهتر است؟» را بپرسند. Gemini همچنین قادر خواهد بود کل صفحه را تحلیل کرده و اطلاعات دقیقی درباره محصولات یا تخفیفهای موجود ارائه دهد.
در دیجینوی بخوانید:
استفاده یوتیوب از هوش مصنوعی برای تبلیغات بین ویدیوها
توصیفهای تصویری غنیتر و بهبود بزرگنمایی متن
در مرورگر Chrome، گوگل به زیرنویسهای خودکار ویدیوها بهبودهایی کوچک اما مهم داده است. فرض کنید در حال تماشای یک مسابقه فوتبال هستید؛ زیرنویسها دیگر تنها به تکرار کلمات گزارشگر بسنده نمیکنند، بلکه احساسات و لحن او را نیز منتقل خواهند کرد.
برای مثال، بهجای نمایش صرف کلمه «گل»، افراد دارای مشکلات شنوایی ممکن است ببینند «گــــــــل» که هیجان بیشتری را منتقل میکند. گوگل این نوع جدید زیرنویسها را Expressive Captions (زیرنویسهای احساسی) نامیده است.

این زیرنویسها علاوه بر گفتار انسانی، صداهای مهم دیگری مانند سوت، تشویق یا حتی صاف کردن گلو را نیز شامل خواهند شد. زیرنویسهای احساسی در دستگاههایی با سیستمعامل Android 15 یا نسخههای جدیدتر، در کشورهای آمریکا، بریتانیا، کانادا و استرالیا در دسترس خواهند بود.
یکی دیگر از تغییرات مهم در مرورگر Chrome، قابلیت بزرگنمایی تطبیقی متن (Adaptive Text Zoom) است. این ویژگی نسخهای بهبودیافته از سیستم بزرگنمایی صفحه در گوشیهای اندرویدی است. اکنون با بزرگکردن متن، چیدمان سایر بخشهای صفحه تغییر نخواهد کرد.
گوگل میگوید: «میتوانید مشخص کنید چقدر میخواهید بزرگنمایی داشته باشید و این تنظیم را بهراحتی برای تمام صفحات یا فقط صفحات خاص اعمال کنید.» کاربران میتوانند با استفاده از یک لغزنده (Slider) در پایین صفحه، دامنه بزرگنمایی را تنظیم کنند.
source