گوگل به مناسبت روز جهانی آگاهی از دسترسی‌پذیری، مجموعه‌ای از قابلیت‌های جدید هوش مصنوعی و امکانات دسترسی‌پذیری را برای اندروید و کروم معرفی کرده است. این شرکت تمرکز خود را بر ادغام هوش مصنوعی‌اش، از جمله مدل‌های جمینی، برای بهبود تجربه کاربران، مخصوصاً افرادی که مشکلات بینایی یا شنوایی دارند، گذاشته است.

یکی از به‌روزرسانی‌های مهم مربوط به صفحه‌خوان TalkBack اندروید است. این ادغام در حال گسترش است و به کاربران اجازه می‌دهد درباره تصاویر سؤالات پی‌درپی بپرسند و حتی توصیف‌هایی درباره کل صفحه خود دریافت کنند و سؤالاتی مطرح کنند. برای مثال، هنگام استفاده از یک اپلیکیشن خرید، کاربر می‌تواند از جمینی درباره جنس یک کالا یا وجود تخفیف سؤال کند.

 

 

گوگل با هوش مصنوعی جمینی، اندروید و کروم را برای نابینایان و ناشنوایان متحول کرد

 

امکان «زیرنویس‌های بیانی» اندروید که گوگل سال گذشته برای ارائه رونویسی آنی معرفی کرد نیز به‌روزرسانی شده است. این قابلیت اکنون با استفاده از هوش مصنوعی بهتر نشان می‌دهد که چگونه چیزی گفته شده است. یک ویژگی جدید مدت‌زمان صداهای کشیده را نمایش می‌دهد؛ مثلاً در زیرنویس، واژه‌هایی مثل «عاااالی» یا «نههههه» دیده می‌شوند تا تاکید و حالت گفتار بهتر منتقل شود. همچنین برچسب‌های صوتی بیشتری برای اقداماتی مانند سوت زدن یا صاف کردن گلو اضافه شده است. نسخه جدید زیرنویس‌های بیانی ابتدا به زبان انگلیسی و در کشورهای آمریکا، بریتانیا، کانادا و استرالیا برای دستگاه‌های مجهز به اندروید ۱۵ به بالا عرضه خواهد شد.

 

علاوه بر امکاناتی که مستقیماً به کاربران مربوط می‌شود، گوگل با پروژه Euphonia بهبود تشخیص گفتار را هم دنبال می‌کند تا این فناوری برای افرادی با شیوه صحبت غیرمعمول هم قابل استفاده باشد. اکنون گوگل مخزن‌های متن‌باز را از طریق صفحه گیت‌هاب پروژه Euphonia در اختیار توسعه‌دهندگان قرار داده تا آن‌ها بتوانند ابزارهای صوتی شخصی‌سازی‌شده بسازند یا مدل‌هایی برای الگوهای گفتاری متنوع آموزش دهند. همچنین این پشتیبانی به پروژه‌هایی در آفریقا مانند مرکز شمول زبان دیجیتال هم گسترش یافته تا تشخیص گفتار برای غیرانگلیسی‌زبان‌ها در ۱۰ زبان آفریقایی بهبود پیدا کند.

برای ChromeOS و مرورگر کروم هم گوگل امکانات دسترسی‌پذیری جدیدی ارائه داده است. کاربران کروم‌بوک که آزمون‌هایی مانند SAT یا Advanced Placement را با اپلیکیشن Bluebook می‌دهند، اکنون به امکانات دسترسی‌پذیری داخلی گوگل از جمله صفحه‌خوان ChromeVox و امکان دیکته دسترسی دارند. در نسخه دسکتاپ مرورگر کروم، فایل‌های PDF اسکن‌شده به طور خودکار با فناوری تشخیص نوری کاراکتر (OCR) پردازش می‌شوند تا برای صفحه‌خوان‌ها قابل خواندن و تعاملی باشند. در اندروید نیز قابلیت Page Zoom مرورگر کروم به کاربران اجازه می‌دهد اندازه متن صفحات را بزرگ‌تر کنند بدون اینکه ساختار صفحه به هم بریزد، درست مثل نسخه دسکتاپ. این ویژگی را می‌توان برای هر صفحه یا به صورت سراسری تنظیم کرد.

 

در سایر اخبار مربوط به دسترسی‌پذیری، زیرنویس فقط دیالوگ بالاخره به نتفلیکس اضافه شده است. نرم‌افزار پاورپوینت مایکروسافت هم اکنون از فایل‌های SRT پشتیبانی می‌کند که می‌توانید زیرنویس و کپشن به ارائه‌های خود اضافه کنید. همچنین، اپل هم مجموعه‌ای از امکانات دسترسی‌پذیری جدید را برای نسخه‌های بعدی iOS و macOS معرفی کرده است.

source

توسط wikiche.com