گوگل جمینای انقلابی در هوش مصنوعی موبایلی با قابلیت پردازش چندوجهی

گوگل در رویداد Google I/O 2025 از جمینای، جدیدترین عضو خانواده مدلهای هوش مصنوعی متنباز خود رونمایی کرد. این مدل که بهطور خاص برای اجرا روی گوشیهای هوشمند، تبلتها و لپتاپها طراحی شده، نخستین نمونه از نسل جدید معماری گوگل است که با همکاری شرکتهای پیشروی سختافزاری مانند کوالکام، مدیاتک و سامسونگ توسعه یافته است. جمینای نه تنها امکان پردازش همزمان متن، تصویر، صوت و ویدیو را فراهم میکند، بلکه با بهینهسازی مصرف انرژی و حافظه، تجربهای بیسابقه از هوش مصنوعیِ مبتنی بر دستگاه را ارائه میدهد.
جمینای برخلاف مدلهای ابرمحور قدیمی، بهگونهای طراحی شده که بهطور کامل روی دستگاه کاربر اجرا میشود. این معماری که از شبکههای عصبی فشرده و الگوریتمهای یادگیری تقویتی بهره میبرد، امکان پردازش لحظهای دادهها بدون نیاز به اتصال اینترنت را فراهم میکند. به گفته مهندسان گوگل، جمینای تنها به 2 گیگابایت حافظه رم نیاز دارد و میتواند روی تراشههای میانرده موجود در بازار نیز با نرخ فریم ثابت عمل کند.
کلید اصلی عملکرد این مدل، استفاده از تکنیک کوانتیزاسیون پویا است که دقت محاسبات را بر اساس نوع داده تنظیم میکند. برای مثال، هنگام پردازش متن، از دقت 8 بیتی و در تحلیل تصاویر پزشکی از دقت 16 بیتی استفاده میشود. این انعطاف، تعادل مناسبی بین سرعت و دقت ایجاد میکند.
جمینای به عنوان اولین مدل متنباز گوگل با قابلیت چندوجهی بودن، میتواند دادههای مختلف را به صورت یکپارچه تحلیل کند. برای نمونه، کاربر میتواند تصویری از یک اثر تاریخی را همراه با صوت توضیحات را بارگذاری کند و مدل به صورت همزمان متن ترجمهشده به زبان مورد نظر را نمایش دهد. این قابلیت با استفاده از ماژولهای توجه متقابل بین المللی مختلف پیادهسازی شده است.
در تستهای انجامشده، جمینای توانسته است عملیات تشخیص اشیاء در ویدیوهای 4K را با سرعت 60 فریم بر ثانیه روی گوشی پیکسل 10 پردازش کند. این عملکرد حتی از مدلهای اختصاصی برخی رقبا مانند اپل و سامسونگ نیز پیشی گرفته است.
یکی از نقاط قوت جمینای، تمرکز بر امنیت دادهها است. از آنجا که تمام پردازشها روی دستگاه کاربر انجام میشود، اطلاعات حساس مانند تصاویر پزشکی یا مکالمات صوتی به سرورهای ابری ارسال نمیشوند. گوگل برای افزایش اطمینان، از مکانیزم رمزنگاری حافظه استفاده کرده که حتی در صورت دسترسی فیزیکی به دستگاه، دادههای پردازششده قابل استخراج نیستند.
گروه مهندسی گوگل برای دستیابی به حداکثر بهرهوری، جمینای را مستقیماً روی معماریهای خاصی مانند Snapdragon 8 Gen 4 و Tensor G4 بهینهسازی کرده است. این همکاری باعث شده مدل بتواند از قابلیتهایی مانند واحدهای پردازش عصبی اختصاصی (NPU) و شتابدهندههای Tensor در تراشهها استفاده کند. بر اساس گزارشها، جمینای روی تراشه Exynos 2400 سامسونگ تا 40 درصد نسبت به مدلهای قبلی کارایی بهتری دارد.
سلامت دیجیتال: نسخه MedGemma این مدل میتواند تصاویر MRI را تحلیل و پیشنهادات اولیه پزشکی ارائه دهد.
خردهفروشی: تشخیص حالات چهره مشتریان و پیشنهاد محصولات بر اساس واکنشهای غیرکلامی.
آموزش: ایجاد مربی هوشمند ریاضی که راهحلها را گام به گام و با زبان ساده توضیح میدهد.
ترجمه همزمان: تبدیل گفتار به متن و ترجمه آن به 100 زبان زنده دنیا با تاخیر کمتر از 200 میلیثانیه.
اگرچه جمینای دستاوردی چشمگیر است، اما هنوز محدودیتهایی دارد. حجم مدل پایه حدود 3.5 گیگابایت است که برای دستگاههای ارزانقیمت چالشبرانگیز است. همچنین، پشتیبانی از زبانهای کمکاربردتر مانند فارسی هنوز در مراحل اولیه قرار دارد. گوگل اعلام کرده که تا پایان 2025 این محدودیتها را برطرف خواهد کرد.
با معرفی جمینای، گوگل گامی بلند به سوی دموکراتیکسازی هوش مصنوعی برداشته است. اکنون توسعهدهندگان سراسر جهان میتوانند بدون نیاز به زیرساختهای ابری پیچیده، برنامههای مبتنی بر هوش مصنوعی ایجاد کنند. پیشبینی میشود تا سال 2026، بیش از 300 میلیون دستگاه مجهز به این فناوری در بازار موجود باشد.
منبع : techcrunch | برای کسب اطلاعات و اخبار روز با ما در بیسلند همراه باشید.