هوش مصنوعی

گوگل جمینای انقلابی در هوش مصنوعی موبایلی با قابلیت پردازش چندوجهی

گوگل در رویداد Google I/O 2025 از جمینای، جدیدترین عضو خانواده مدل‌های هوش مصنوعی متن‌باز خود رونمایی کرد. این مدل که به‌طور خاص برای اجرا روی گوشی‌های هوشمند، تبلت‌ها و لپتاپ‌ها طراحی شده، نخستین نمونه از نسل جدید معماری گوگل است که با همکاری شرکت‌های پیشروی سخت‌افزاری مانند کوالکام، مدیاتک و سامسونگ توسعه یافته است. جمینای نه تنها امکان پردازش همزمان متن، تصویر، صوت و ویدیو را فراهم می‌کند، بلکه با بهینه‌سازی مصرف انرژی و حافظه، تجربه‌ای بی‌سابقه از هوش مصنوعیِ مبتنی بر دستگاه را ارائه می‌دهد.

جمینای برخلاف مدل‌های ابرمحور قدیمی، به‌گونه‌ای طراحی شده که به‌طور کامل روی دستگاه کاربر اجرا می‌شود. این معماری که از شبکه‌های عصبی فشرده و الگوریتم‌های یادگیری تقویتی بهره می‌برد، امکان پردازش لحظه‌ای داده‌ها بدون نیاز به اتصال اینترنت را فراهم می‌کند. به گفته مهندسان گوگل، جمینای تنها به 2 گیگابایت حافظه رم نیاز دارد و می‌تواند روی تراشه‌های میان‌رده موجود در بازار نیز با نرخ فریم ثابت عمل کند.

کلید اصلی عملکرد این مدل، استفاده از تکنیک کوانتیزاسیون پویا است که دقت محاسبات را بر اساس نوع داده تنظیم می‌کند. برای مثال، هنگام پردازش متن، از دقت 8 بیتی و در تحلیل تصاویر پزشکی از دقت 16 بیتی استفاده می‌شود. این انعطاف، تعادل مناسبی بین سرعت و دقت ایجاد می‌کند.

جمینای به عنوان اولین مدل متن‌باز گوگل با قابلیت چندوجهی بودن، می‌تواند داده‌های مختلف را به صورت یکپارچه تحلیل کند. برای نمونه، کاربر می‌تواند تصویری از یک اثر تاریخی را همراه با صوت توضیحات را بارگذاری کند و مدل به صورت همزمان متن ترجمه‌شده به زبان مورد نظر را نمایش دهد. این قابلیت با استفاده از ماژول‌های توجه متقابل بین المللی مختلف پیاده‌سازی شده است.

در تست‌های انجام‌شده، جمینای توانسته است عملیات تشخیص اشیاء در ویدیوهای 4K را با سرعت 60 فریم بر ثانیه روی گوشی پیکسل 10 پردازش کند. این عملکرد حتی از مدل‌های اختصاصی برخی رقبا مانند اپل و سامسونگ نیز پیشی گرفته است.

یکی از نقاط قوت جمینای، تمرکز بر امنیت داده‌ها است. از آنجا که تمام پردازش‌ها روی دستگاه کاربر انجام می‌شود، اطلاعات حساس مانند تصاویر پزشکی یا مکالمات صوتی به سرورهای ابری ارسال نمی‌شوند. گوگل برای افزایش اطمینان، از مکانیزم رمزنگاری حافظه استفاده کرده که حتی در صورت دسترسی فیزیکی به دستگاه، داده‌های پردازش‌شده قابل استخراج نیستند.

گروه مهندسی گوگل برای دستیابی به حداکثر بهره‌وری، جمینای را مستقیماً روی معماری‌های خاصی مانند Snapdragon 8 Gen 4 و Tensor G4 بهینه‌سازی کرده است. این همکاری باعث شده مدل بتواند از قابلیت‌هایی مانند واحدهای پردازش عصبی اختصاصی (NPU) و شتاب‌دهنده‌های Tensor در تراشه‌ها استفاده کند. بر اساس گزارش‌ها، جمینای روی تراشه Exynos 2400 سامسونگ تا 40 درصد نسبت به مدل‌های قبلی کارایی بهتری دارد.

  • سلامت دیجیتال: نسخه MedGemma این مدل می‌تواند تصاویر MRI را تحلیل و پیش‌نهادات اولیه پزشکی ارائه دهد.

  • خرده‌فروشی: تشخیص حالات چهره مشتریان و پیشنهاد محصولات بر اساس واکنش‌های غیرکلامی.

  • آموزش: ایجاد مربی هوشمند ریاضی که راه‌حل‌ها را گام به گام و با زبان ساده توضیح می‌دهد.

  • ترجمه همزمان: تبدیل گفتار به متن و ترجمه آن به 100 زبان زنده دنیا با تاخیر کمتر از 200 میلی‌ثانیه.

  • اگرچه جمینای دستاوردی چشمگیر است، اما هنوز محدودیت‌هایی دارد. حجم مدل پایه حدود 3.5 گیگابایت است که برای دستگاه‌های ارزان‌قیمت چالش‌برانگیز است. همچنین، پشتیبانی از زبان‌های کم‌کاربردتر مانند فارسی هنوز در مراحل اولیه قرار دارد. گوگل اعلام کرده که تا پایان 2025 این محدودیت‌ها را برطرف خواهد کرد.

    با معرفی جمینای، گوگل گامی بلند به سوی دموکراتیک‌سازی هوش مصنوعی برداشته است. اکنون توسعه‌دهندگان سراسر جهان می‌توانند بدون نیاز به زیرساخت‌های ابری پیچیده، برنامه‌های مبتنی بر هوش مصنوعی ایجاد کنند. پیش‌بینی می‌شود تا سال 2026، بیش از 300 میلیون دستگاه مجهز به این فناوری در بازار موجود باشد.

    منبع : techcrunch | برای کسب اطلاعات و اخبار روز با ما در بیسلند همراه باشید.

    نوشته های مشابه

    دیدگاهتان را بنویسید

    دکمه بازگشت به بالا