Gemini Nano ที่มี Google AI Edge SDK

ในอุปกรณ์ Android ที่รองรับ คุณจะมอบประสบการณ์การใช้งาน Generative AI ที่สมบูรณ์แบบได้โดยไม่ต้องเชื่อมต่อเครือข่ายหรือส่งข้อมูลไปยังระบบคลาวด์ AI ในอุปกรณ์เป็นโซลูชันที่ยอดเยี่ยมสําหรับกรณีการใช้งานที่ความล่าช้าต่ำ ต้นทุนต่ำ และการคุ้มครองความเป็นส่วนตัวเป็นข้อกังวลหลัก

สำหรับกรณีการใช้งานในอุปกรณ์ คุณสามารถใช้โมเดลพื้นฐาน Gemini Nano ของ Google แม้ว่าจะเล็กกว่ารุ่นอื่นๆ ของ Gemini ที่ทำงานแบบอนุมานในระบบคลาวด์ แต่คุณก็สามารถปรับแต่ง Gemini Nano ให้ทำงานเฉพาะทางได้เช่นเดียวกับรุ่นที่ใหญ่กว่า Gemini Nano ทำงานในบริการระบบ AICore ของ Android ซึ่งใช้ประโยชน์จากฮาร์ดแวร์ของอุปกรณ์เพื่อให้เกิดความล่าช้าในการอนุมานต่ำและทำให้โมเดลเป็นเวอร์ชันล่าสุดอยู่เสมอ

สิทธิ์เข้าถึง Gemini Nano API และ AICore มีให้โดย Google AI Edge SDK Google AI Edge คือชุดเครื่องมือที่ครอบคลุมสำหรับ ML ในอุปกรณ์ ดูข้อมูลเพิ่มเติมเกี่ยวกับ Google AI Edge

สถาปัตยกรรม

ในฐานะโมดูลระดับระบบ คุณจะเข้าถึง AICore ผ่านชุด API เพื่อเรียกใช้การอนุมานในอุปกรณ์ นอกจากนี้ AICore ยังมีฟีเจอร์ด้านความปลอดภัยในตัวหลายรายการ ซึ่งช่วยให้มั่นใจได้ว่าจะมีการประเมินอย่างละเอียดเทียบกับตัวกรองด้านความปลอดภัย แผนภาพต่อไปนี้แสดงวิธีที่แอปเข้าถึง AICore เพื่อเรียกใช้ Gemini Nano ในอุปกรณ์

Google AI Edge SDK, AICore และ Gemini Nano
รูปที่ 1 Google AI Edge SDK, AICore และ Gemini Nano

รักษาข้อมูลผู้ใช้ให้เป็นส่วนตัวและปลอดภัย

Generative AI ในอุปกรณ์จะเรียกใช้พรอมต์ในอุปกรณ์ ซึ่งจะช่วยลดการเรียกใช้เซิร์ฟเวอร์ แนวทางนี้ช่วยเพิ่มความเป็นส่วนตัวโดยเก็บข้อมูลที่ละเอียดอ่อนไว้ในอุปกรณ์ เปิดใช้ฟังก์ชันการทำงานแบบออฟไลน์ และลดค่าใช้จ่ายในการอนุมาน

AICore เป็นไปตามหลักการของ Private Compute Core โดยมีลักษณะสำคัญต่อไปนี้

การเชื่อมโยงแพ็กเกจแบบจํากัด: AICore จะแยกจากแพ็กเกจอื่นๆ ส่วนใหญ่ โดยมีข้อยกเว้นที่จํากัดสําหรับแพ็กเกจระบบที่เฉพาะเจาะจง การแก้ไขรายการที่อนุญาตนี้จะเกิดขึ้นได้ในระหว่างการอัปเดต OTA ของ Android แบบสมบูรณ์เท่านั้น

การเข้าถึงอินเทอร์เน็ตโดยอ้อม: AICore ไม่มีสิทธิ์เข้าถึงอินเทอร์เน็ตโดยตรง คำขอทั้งหมดทางอินเทอร์เน็ต รวมถึงการดาวน์โหลดโมเดลจะส่งผ่าน APK ของPrivate Compute Services ที่ทำงานร่วมกันแบบโอเพนซอร์ส API ภายในบริการประมวลผลข้อมูลส่วนตัวต้องแสดงให้เห็นอย่างชัดเจนว่ามุ่งเน้นความเป็นส่วนตัว

นอกจากนี้ AICore ยังสร้างขึ้นเพื่อแยกคำขอแต่ละรายการและไม่จัดเก็บระเบียนข้อมูลอินพุตหรือเอาต์พุตที่ได้หลังจากประมวลผลเพื่อปกป้องความเป็นส่วนตัวของผู้ใช้ อ่านข้อมูลเพิ่มเติมได้ในบล็อกโพสต์ข้อมูลเบื้องต้นเกี่ยวกับความเป็นส่วนตัวและความปลอดภัยสำหรับ Gemini Nano

ภาพประกอบสถาปัตยกรรม AICore
รูปที่ 2 สถาปัตยกรรม AICore

ประโยชน์ของการเข้าถึงโมเดลพื้นฐาน AI ด้วย AICore

AICore ช่วยให้ระบบปฏิบัติการ Android ให้บริการและจัดการโมเดลพื้นฐาน AI ได้ ซึ่งจะช่วยลดต้นทุนในการใช้โมเดลขนาดใหญ่เหล่านี้ในแอปได้อย่างมาก โดยสาเหตุหลักๆ มีดังนี้

การติดตั้งใช้งานที่ง่ายดาย: AICore จะจัดการการเผยแพร่ Gemini Nano และจัดการการอัปเดตในอนาคต คุณจึงไม่ต้องกังวลเกี่ยวกับการดาวน์โหลดหรืออัปเดตโมเดลขนาดใหญ่ผ่านเครือข่าย รวมถึงไม่ส่งผลต่องบประมาณหน่วยความจำของดิสก์และรันไทม์ของแอป

การอนุมานที่เร็วขึ้น: AICore ใช้ประโยชน์จากฮาร์ดแวร์ในอุปกรณ์เพื่อเร่งการอนุมาน แอปของคุณจะมีประสิทธิภาพดีที่สุดในอุปกรณ์แต่ละเครื่อง และคุณไม่จําเป็นต้องกังวลเกี่ยวกับอินเทอร์เฟซฮาร์ดแวร์พื้นฐาน

ฟังก์ชันที่รองรับ

AICore รองรับอุปกรณ์และรูปแบบต่อไปนี้

  • อุปกรณ์ที่รองรับ: ปัจจุบัน AICore พร้อมให้บริการในอุปกรณ์ซีรีส์ Pixel 9, อุปกรณ์ Google Pixel 8 Series ซึ่งรวมถึง Pixel 81 และ Pixel 8a2, อุปกรณ์ Samsung S24 Series, Samsung Z Fold6, Samsung Z Flip6, Realme GT 6, Motorola Edge 50 Ultra, Motorola Razr 50 Ultra, Xiaomi 14T/Pro และ Xiaomi MIX FLIP
  • รูปแบบที่รองรับ: ปัจจุบัน AICore รองรับรูปแบบข้อความสำหรับ Gemini Nano

การรองรับอุปกรณ์และรูปแบบเพิ่มเติมเป็นพื้นที่ที่เรากำลังลงทุนอยู่

กรณีการใช้งาน

เนื่องจากอุปกรณ์เคลื่อนที่มีทรัพยากรจํากัดเมื่อเทียบกับเซิร์ฟเวอร์ระบบคลาวด์ โมเดล Generative AI ในอุปกรณ์จึงออกแบบโดยเน้นที่ประสิทธิภาพและขนาด การเพิ่มประสิทธิภาพนี้จะให้ความสำคัญกับงานที่เจาะจงและระบุไว้อย่างชัดเจนมากกว่าแอปพลิเคชันทั่วไป กรณีการใช้งานที่เหมาะสม ได้แก่

  • การปรับแก้ข้อความ: แก้ไขระดับภาษาและรูปแบบของข้อความ (เช่น จากภาษาที่เป็นกันเองเป็นทางการ)
  • ช่วยตอบ: สร้างคำตอบที่เกี่ยวข้องกับบริบทภายในชุดข้อความแชท
  • การพิสูจน์อักษร: ระบุและแก้ไขข้อผิดพลาดด้านการสะกดคำและไวยากรณ์
  • การสรุป: ย่อเอกสารที่ยาวเป็นสรุปที่กระชับ (ย่อหน้าหรือหัวข้อย่อย)

ดูเอกสารประกอบเกี่ยวกับกลยุทธ์พรอมต์เพื่อประสิทธิภาพที่ดีที่สุด หากต้องการสำรวจกรณีการใช้งานเหล่านี้ด้วยตนเอง ให้ดาวน์โหลดแอปตัวอย่างของเราและเริ่มทดสอบด้วย Gemini Nano

แอป Google หลายแอปใช้ Gemini Nano ตัวอย่างเช่น

  • Talkback: แอปการช่วยเหลือพิเศษของ Android อย่าง Talkback ใช้ประโยชน์จากความสามารถของอินพุตแบบหลายรูปแบบของ Gemini ในการปรับปรุงคำอธิบายรูปภาพสำหรับผู้ใช้ที่มีความบกพร่องทางสายตา
  • โปรแกรมอัดเสียงของ Pixel: แอปโปรแกรมอัดเสียงของ Pixel ใช้ Gemini Nano และ AICore เพื่อขับเคลื่อนฟีเจอร์การสรุปในอุปกรณ์ ทีมโปรแกรมอัดเสียงได้นำโมเดล Gemini Nano ล่าสุดมาใช้เพื่อรองรับไฟล์บันทึกเสียงที่ยาวขึ้นและสร้างสรุปที่มีคุณภาพสูงขึ้น
  • Gboard: ฟีเจอร์ช่วยตอบของ Gboard ใช้ประโยชน์จาก Gemini Nano ในอุปกรณ์ร่วมกับ AICore เพื่อให้ฟีเจอร์ช่วยตอบที่แม่นยำ

  1. คุณเปิดใช้ Gemini Nano ในอุปกรณ์ Pixel 8 เป็นตัวเลือกสำหรับนักพัฒนาซอฟต์แวร์ได้ 

  2. คุณเปิดใช้ Gemini Nano ในอุปกรณ์ Pixel 8a เป็นตัวเลือกสำหรับนักพัฒนาซอฟต์แวร์ได้