Gemini Nano ช่วยให้คุณมอบประสบการณ์การใช้งาน Generative AI ที่สมบูรณ์แบบได้โดยไม่ต้องเชื่อมต่อเครือข่ายหรือส่งข้อมูลไปยังระบบคลาวด์ AI ในอุปกรณ์เป็นโซลูชันที่ยอดเยี่ยมสำหรับกรณีการใช้งานที่ความล่าช้าต่ำ ต้นทุนต่ำ และการปกป้องความเป็นส่วนตัวคือข้อกังวลหลัก
สำหรับกรณีการใช้งานในอุปกรณ์ คุณสามารถใช้โมเดลพื้นฐาน Gemini Nano ของ Google Gemini Nano ทำงานในบริการระบบ AICore ของ Android ซึ่งใช้ประโยชน์จากฮาร์ดแวร์ของอุปกรณ์เพื่อลดเวลาในการตอบสนองของการอนุมานและทำให้โมเดลเป็นเวอร์ชันล่าสุดอยู่เสมอ
ปัจจุบันคุณเข้าถึง Gemini Nano ผ่านช่องทางต่อไปนี้ได้
- ML Kit GenAI API ซึ่งให้บริการอินเทอร์เฟซระดับสูงสำหรับฟีเจอร์ต่างๆ เช่น การสรุป การพิสูจน์อักษร การเขียนใหม่ และคำอธิบายรูปภาพ
- Google AI Edge SDK ซึ่งให้สิทธิ์เข้าถึงเวอร์ชันทดลองแก่นักพัฒนาแอปที่ต้องการทดสอบการปรับปรุงแอปด้วยความสามารถของ AI ในอุปกรณ์
สถาปัตยกรรม
ในฐานะโมดูลระดับระบบ คุณจะเข้าถึง AICore ผ่านชุด API เพื่อเรียกใช้การอนุมานในอุปกรณ์ นอกจากนี้ AICore ยังมีฟีเจอร์ด้านความปลอดภัยในตัวหลายรายการ ซึ่งช่วยให้มั่นใจได้ว่าจะมีการประเมินอย่างละเอียดเทียบกับตัวกรองด้านความปลอดภัย แผนภาพต่อไปนี้แสดงวิธีที่แอปเข้าถึง AICore เพื่อเรียกใช้ Gemini Nano ในอุปกรณ์

รักษาข้อมูลผู้ใช้ให้เป็นส่วนตัวและปลอดภัย
Generative AI ในอุปกรณ์จะแสดงข้อความแจ้งในอุปกรณ์ ซึ่งจะช่วยลดการเรียกใช้เซิร์ฟเวอร์ แนวทางนี้ช่วยเพิ่มความเป็นส่วนตัวโดยเก็บข้อมูลที่มีความละเอียดอ่อนไว้ในอุปกรณ์ เปิดใช้ฟังก์ชันการทำงานแบบออฟไลน์ และลดค่าใช้จ่ายในการอนุมาน
AICore เป็นไปตามหลักการของ Private Compute Core โดยมีลักษณะสำคัญต่อไปนี้
การเชื่อมโยงแพ็กเกจแบบจํากัด: AICore จะแยกจากแพ็กเกจอื่นๆ ส่วนใหญ่ โดยมีข้อยกเว้นที่จํากัดสําหรับแพ็กเกจระบบที่เฉพาะเจาะจง การแก้ไขรายการที่อนุญาตนี้จะเกิดขึ้นได้ในระหว่างการอัปเดต OTA ของ Android แบบสมบูรณ์เท่านั้น
การเข้าถึงอินเทอร์เน็ตโดยอ้อม: AICore ไม่มีสิทธิ์เข้าถึงอินเทอร์เน็ตโดยตรง คำขอทั้งหมดทางอินเทอร์เน็ต รวมถึงการดาวน์โหลดโมเดลจะส่งผ่าน APK ของPrivate Compute Services ที่ทำงานร่วมกันแบบโอเพนซอร์ส API ภายในบริการประมวลผลข้อมูลส่วนตัวต้องแสดงให้เห็นอย่างชัดเจนว่ามุ่งเน้นความเป็นส่วนตัว
นอกจากนี้ AICore ยังสร้างขึ้นเพื่อแยกคำขอแต่ละรายการและไม่จัดเก็บระเบียนข้อมูลอินพุตหรือเอาต์พุตที่ได้หลังจากประมวลผลเพื่อปกป้องความเป็นส่วนตัวของผู้ใช้ อ่านข้อมูลเพิ่มเติมได้ในบล็อกโพสต์ข้อมูลเบื้องต้นเกี่ยวกับความเป็นส่วนตัวและความปลอดภัยสำหรับ Gemini Nano

ประโยชน์ของการเข้าถึงโมเดลพื้นฐาน AI ด้วย AICore
AICore ช่วยให้ระบบปฏิบัติการ Android ให้บริการและจัดการโมเดลพื้นฐาน AI ได้ ซึ่งจะช่วยลดต้นทุนในการใช้โมเดลขนาดใหญ่เหล่านี้ในแอปได้อย่างมาก โดยสาเหตุหลักๆ มีดังนี้
ติดตั้งใช้งานได้ง่าย: AICore จะจัดการการเผยแพร่ Gemini Nano และจัดการการอัปเดตในอนาคต คุณจึงไม่ต้องกังวลเกี่ยวกับการดาวน์โหลดหรืออัปเดตโมเดลขนาดใหญ่ผ่านเครือข่าย รวมถึงไม่ส่งผลต่องบประมาณหน่วยความจำของดิสก์และรันไทม์ของแอป
การอนุมานที่เร็วขึ้น: AICore ใช้ประโยชน์จากฮาร์ดแวร์ในอุปกรณ์เพื่อเร่งการอนุมาน แอปของคุณจะมีประสิทธิภาพดีที่สุดในอุปกรณ์แต่ละเครื่อง และคุณไม่จําเป็นต้องกังวลเกี่ยวกับอินเทอร์เฟซฮาร์ดแวร์พื้นฐาน
ฟังก์ชันที่รองรับ
- อุปกรณ์ที่รองรับ: ปัจจุบัน Gemini Nano ที่มี Google AI Edge SDK พร้อมให้ทดลองใช้ในอุปกรณ์ Pixel 9 Series
- รูปแบบที่รองรับ: ปัจจุบัน AICore รองรับรูปแบบข้อความสำหรับ Gemini Nano
การรองรับอุปกรณ์และรูปแบบเพิ่มเติมเป็นประเด็นที่เรากำลังลงทุนอยู่
กรณีการใช้งาน
เนื่องจากอุปกรณ์เคลื่อนที่มีข้อจำกัดด้านทรัพยากรเมื่อเทียบกับเซิร์ฟเวอร์ระบบคลาวด์ โมเดล Generative AI ในอุปกรณ์จึงได้รับการออกแบบโดยเน้นที่ประสิทธิภาพและขนาด การเพิ่มประสิทธิภาพนี้จะให้ความสำคัญกับงานที่เจาะจงและระบุไว้อย่างชัดเจนมากกว่าแอปพลิเคชันทั่วไป กรณีการใช้งานที่เหมาะสม ได้แก่
- การปรับแก้ข้อความ: แก้ไขโทนและสไตล์ของข้อความ (เช่น จากไม่เป็นทางการเป็นทางการ)
- ช่วยตอบ: สร้างคำตอบที่เกี่ยวข้องกับบริบทภายในชุดข้อความแชท
- การพิสูจน์อักษร: ระบุและแก้ไขข้อผิดพลาดด้านการสะกดคำและไวยากรณ์
- การสรุป: ย่อเอกสารที่มีความยาวเป็นสรุปที่กระชับ (ย่อหน้าหรือหัวข้อย่อย)
ดูเอกสารประกอบเกี่ยวกับกลยุทธ์พรอมต์เพื่อประสิทธิภาพที่ดีที่สุด หากต้องการสำรวจกรณีการใช้งานเหล่านี้ด้วยตนเอง ให้ดาวน์โหลดแอปตัวอย่างของเราและเริ่มทดสอบด้วย Gemini Nano
แอปหลายแอปของ Google ใช้ Gemini Nano ตัวอย่างเช่น
- TalkBack: แอปการช่วยเหลือพิเศษของ Android อย่าง TalkBack ใช้ประโยชน์จากความสามารถของอินพุตแบบหลายรูปแบบของ Gemini ในการปรับปรุงคำอธิบายรูปภาพสำหรับผู้ใช้ที่มีความบกพร่องทางสายตา
- โปรแกรมอัดเสียงของ Pixel: แอปโปรแกรมอัดเสียงของ Pixel ใช้ Gemini Nano และ AICore เพื่อขับเคลื่อนฟีเจอร์สรุปในอุปกรณ์ ทีมโปรแกรมอัดเสียงได้นำโมเดล Gemini Nano ล่าสุดมาใช้เพื่อรองรับไฟล์บันทึกเสียงที่ยาวขึ้นและส่งสรุปที่มีคุณภาพสูงขึ้น
- Gboard: การช่วยตอบอัจฉริยะของ Gboard ใช้ประโยชน์จาก Gemini Nano ในอุปกรณ์ที่มี AICore เพื่อให้การช่วยตอบอัจฉริยะที่ถูกต้อง