SDK ของ Google AI Edge

Google AI Edge SDK อนุญาตให้เข้าถึงเวอร์ชันทดลองสำหรับนักพัฒนาแอปที่ต้องการทดสอบ การเพิ่มประสิทธิภาพแอปด้วยความสามารถของ AI ในอุปกรณ์ผ่าน Gemini Nano

สถาปัตยกรรมผ่าน AICore

ในฐานะโมดูลระดับระบบ คุณจะเข้าถึง AICore ผ่านชุด API เพื่อ เรียกใช้การอนุมานในอุปกรณ์ นอกจากนี้ AICore ยังมีฟีเจอร์ความปลอดภัยในตัวหลายอย่าง เพื่อให้มั่นใจว่ามีการประเมินอย่างละเอียดเทียบกับตัวกรองความปลอดภัยของเรา แผนภาพต่อไปนี้แสดงวิธีที่แอปเข้าถึง AICore เพื่อเรียกใช้ Gemini Nano ในอุปกรณ์

Google AI Edge SDK, AICore และ Gemini Nano
รูปที่ 1 Google AI Edge SDK, AICore และ Gemini Nano

จัดเก็บข้อมูลผู้ใช้อย่างเป็นส่วนตัวและปลอดภัย

Generative AI ในอุปกรณ์จะดำเนินการตามพรอมต์ในเครื่อง จึงไม่ต้องเรียกเซิร์ฟเวอร์ แนวทางนี้ช่วยเพิ่มความเป็นส่วนตัวด้วยการเก็บข้อมูลที่ละเอียดอ่อนไว้ในอุปกรณ์ เปิดใช้ฟังก์ชันการทำงานแบบออฟไลน์ และลดต้นทุนการอนุมาน

AICore ปฏิบัติตามหลักการของ Private Compute Core โดยมีลักษณะสำคัญดังนี้

  • การเชื่อมโยงแพ็กเกจแบบจำกัด: AICore จะแยกจากแพ็กเกจอื่นๆ ส่วนใหญ่ โดยมีข้อยกเว้นแบบจำกัดสำหรับแพ็กเกจระบบที่เฉพาะเจาะจง การแก้ไขรายการที่อนุญาตนี้จะเกิดขึ้นได้เฉพาะในระหว่างการอัปเดต OTA ของ Android แบบเต็ม
  • การเข้าถึงอินเทอร์เน็ตโดยอ้อม: AICore ไม่มีสิทธิ์เข้าถึงอินเทอร์เน็ตโดยตรง คำขอทั้งหมดบนอินเทอร์เน็ต รวมถึงการดาวน์โหลดโมเดล จะได้รับการกำหนดเส้นทางผ่าน APK ของ Private Compute Services แบบโอเพนซอร์ส API ภายในบริการประมวลผลส่วนตัวต้องแสดงให้เห็นอย่างชัดเจนว่ามุ่งเน้นความเป็นส่วนตัว

นอกจากนี้ AICore ยังสร้างขึ้นเพื่อแยกแต่ละคำขอและไม่จัดเก็บ บันทึกข้อมูลอินพุตหรือเอาต์พุตที่ได้หลังจากการประมวลผล เพื่อปกป้องความเป็นส่วนตัวของผู้ใช้ อ่านข้อมูลเพิ่มเติมได้ในบล็อกโพสต์An Introduction to Privacy and Safety for Gemini Nano

ภาพประกอบสถาปัตยกรรม AICore
รูปที่ 2 สถาปัตยกรรม AICore

ประโยชน์ของการเข้าถึงโมเดลพื้นฐานของ AI ด้วย AICore

AICore ช่วยให้ระบบปฏิบัติการ Android สามารถจัดหาและจัดการโมเดลพื้นฐานของ AI ได้ ซึ่งจะช่วยลดต้นทุนในการใช้โมเดลขนาดใหญ่เหล่านี้ในแอปได้อย่างมาก โดยมีสาเหตุหลักๆ ดังนี้

  • ติดตั้งใช้งานง่าย: AICore จัดการการเผยแพร่ Gemini Nano และ จัดการการอัปเดตในอนาคต คุณไม่ต้องกังวลเรื่องการดาวน์โหลดหรืออัปเดตโมเดลขนาดใหญ่ผ่านเครือข่าย รวมถึงผลกระทบต่อพื้นที่ดิสก์และงบประมาณหน่วยความจำรันไทม์ของแอป
  • การอนุมานที่เร่งความเร็ว: AICore ใช้ประโยชน์จากฮาร์ดแวร์ในอุปกรณ์เพื่อเร่ง การอนุมาน แอปของคุณจะได้รับประสิทธิภาพที่ดีที่สุดในอุปกรณ์แต่ละเครื่อง และคุณไม่ จำเป็นต้องกังวลเกี่ยวกับอินเทอร์เฟซฮาร์ดแวร์พื้นฐาน

ฟังก์ชันที่รองรับ

  • อุปกรณ์ที่รองรับ: Gemini Nano ที่มี Google AI Edge SDK พร้อมให้ทดลองใช้งานในอุปกรณ์ Pixel 9 Series
  • รูปแบบที่รองรับ: AICore รองรับรูปแบบข้อความสำหรับ Gemini Nano

การรองรับอุปกรณ์และรูปแบบเพิ่มเติมเป็นส่วนที่เรากำลังลงทุนอย่างต่อเนื่อง

กรณีการใช้งาน

เนื่องจากข้อจำกัดด้านทรัพยากรของอุปกรณ์เคลื่อนที่เมื่อเทียบกับเซิร์ฟเวอร์ระบบคลาวด์ โมเดล Generative AI ในอุปกรณ์จึงได้รับการออกแบบโดยเน้นที่ประสิทธิภาพและขนาด การเพิ่มประสิทธิภาพนี้จะจัดลำดับความสำคัญของงานที่เฉพาะเจาะจงและกำหนดไว้อย่างชัดเจนเหนือแอปพลิเคชันที่ทั่วไปมากกว่า กรณีการใช้งานที่เหมาะสมมีดังนี้

  • การปรับแก้ข้อความ: ปรับเปลี่ยนโทนและสไตล์ของข้อความ (เช่น จากไม่เป็นทางการเป็น ทางการ)
  • ช่วยตอบ: สร้างคำตอบที่เกี่ยวข้องตามบริบทภายในชุดข้อความแชท
  • การพิสูจน์อักษร: ระบุและแก้ไขข้อผิดพลาดด้านการสะกดคำและไวยากรณ์
  • การสรุป: ย่อเอกสารที่มีความยาวให้เป็นข้อมูลสรุปที่กระชับ (ย่อหน้าหรือหัวข้อย่อย)

ดูกลยุทธ์การแจ้งในเอกสารประกอบเพื่อประสิทธิภาพสูงสุด หากต้องการสำรวจกรณีการใช้งานเหล่านี้ด้วยตนเอง ให้ดาวน์โหลดแอปตัวอย่างและเริ่มทดลองใช้ Gemini Nano

แอปต่างๆ ของ Google ใช้ Gemini Nano ตัวอย่างเช่น

  • TalkBack: แอปการช่วยเหลือพิเศษ TalkBack ของ Android ใช้ประโยชน์จากความสามารถในการป้อนข้อมูลหลายรูปแบบของ Gemini Nano เพื่อปรับปรุงคำอธิบายรูปภาพสำหรับผู้ใช้ที่มีความบกพร่องทางสายตา
  • โปรแกรมอัดเสียงของ Pixel: แอปโปรแกรมอัดเสียงของ Pixel ใช้ Gemini Nano และ AICore เพื่อขับเคลื่อนฟีเจอร์สรุปในอุปกรณ์ ทีมโปรแกรมอัดเสียง ใช้โมเดล Gemini Nano ล่าสุดเพื่อรองรับการบันทึกเสียงที่ยาวขึ้นและให้ สรุปที่มีคุณภาพสูงขึ้น
  • Gboard: ฟีเจอร์ช่วยตอบอัจฉริยะของ Gboard ใช้ Gemini Nano ในอุปกรณ์ที่มี AICore เพื่อ ให้คำตอบช่วยตอบที่ถูกต้อง