Generative AI ใน Android

ในงาน Google I/O 2024 เราได้เปิดตัววิสัยทัศน์ของ Android เวอร์ชันใหม่ที่ใช้ AI เป็นหัวใจ ดูการอัปเดต 3 อันดับแรกสำหรับการสร้างด้วย AI ใน Android สําหรับนักพัฒนาแอป Android ได้ในวิดีโอนี้

เลือกโซลูชัน Generative AI ที่เหมาะกับคุณ

เอกสารนี้ให้ภาพรวมของ Generative AI ใน Android รวมถึงโมเดล Gemini ที่มีและ SDK ที่เกี่ยวข้อง

AI ในอุปกรณ์ที่มีประสิทธิภาพสูง

ไอคอน Gemini

ในอุปกรณ์ Android ที่รองรับ คุณจะมอบประสบการณ์การใช้งาน Generative AI ที่สมบูรณ์แบบได้โดยไม่ต้องเชื่อมต่อเครือข่ายหรือย้ายข้อมูลออกจากอุปกรณ์ โมเดล Generative AI ในอุปกรณ์ เช่น Gemini Nano เป็นโซลูชันที่ยอดเยี่ยมสำหรับกรณีการใช้งานที่ความล่าช้าต่ำ ต้นทุนต่ำ และการคุ้มครองความเป็นส่วนตัวเป็นข้อกังวลหลัก

กรณีการใช้งาน

  • การบริโภคเนื้อหาที่ปรับปรุงโดย AI: การสรุปข้อความ การตอบคำถามในเอกสาร และการแยกเอนทิตี
  • การสร้างเนื้อหาด้วยความช่วยเหลือจาก AI: การพิสูจน์อักษร การแก้ไขไวยากรณ์ ความช่วยเหลือด้านการเขียน และช่วยตอบตามบริบท
  • การจัดประเภทข้อความ: การวิเคราะห์ความรู้สึกหรืออารมณ์
  • ความเป็นส่วนตัว: ปลดล็อกฟีเจอร์ Generative AI ขณะเก็บข้อมูลไว้ในอุปกรณ์

โซลูชัน

ใช้ Google AI Edge SDK เพื่อใช้ประโยชน์จากการอนุมานของ Gemini Nano ในอุปกรณ์ Gemini Nano พร้อมให้ทดลองใช้แบบสาธารณะแล้ว

ดูข้อมูลเพิ่มเติมเกี่ยวกับ Gemini Nano

แสดงโมเดลที่กําหนดเองสําหรับฟีเจอร์ AI ในอุปกรณ์ได้อย่างมีประสิทธิภาพมากขึ้นด้วย Play สำหรับ AI ในอุปกรณ์ Google Play ลดความซับซ้อนในการเปิดตัว การกำหนดเป้าหมาย การกำหนดเวอร์ชัน การดาวน์โหลด และการอัปเดตโมเดลในอุปกรณ์ ซึ่งจะช่วยให้คุณปรับปรุงประสบการณ์ของผู้ใช้ได้ในขณะที่ยังคงเพิ่มประสิทธิภาพขนาดของแอป เล่นเพลินไปกับ AI ในอุปกรณ์โดยไม่มีค่าใช้จ่ายเพิ่มเติม กรอกแบบฟอร์มนี้หากคุณสนใจทดลองใช้ Play สำหรับ AI ในอุปกรณ์ก่อนเปิดตัว

ลงชื่อสมัครใช้ Play เพื่อรับสิทธิ์ทดลองใช้ AI ในอุปกรณ์ก่อนเปิดตัว

AI แบบหลายรูปแบบในระบบคลาวด์ด้วยโมเดลที่มีประสิทธิภาพสูงสุดของ Google

คุณสามารถสร้างประสบการณ์การใช้งาน Generative AI แบบหลายรูปแบบในแอปได้ด้วยการใช้ประโยชน์จากโมเดลพื้นฐานที่ทำงานแบบอนุมานในระบบคลาวด์ เช่น โมเดล Gemini Pro รุ่นเหล่านี้เป็นโซลูชันที่ยอดเยี่ยมเมื่อคุณต้องการรองรับอุปกรณ์ Android หลากหลายรุ่นมากที่สุด

กรณีการใช้งาน

  • คำอธิบายและคำบรรยายแทนเสียงของรูปภาพและวิดีโอ: การระบุวัตถุและอธิบายเป็นข้อความ
  • การอนุมานแบบมัลติโมดัล: ประมวลผลเนื้อหาข้อความ รูปภาพ และวิดีโอ
  • การสร้างข้อความ: สรุปบทความ ตอบคําถามเกี่ยวกับเนื้อหาที่เป็นข้อความ ดึงข้อมูลเอนทิตี
  • การจัดรูปแบบการตอบกลับ: จัดรูปแบบการตอบกลับของโมเดลเป็น JSON หรือ Markdown

โซลูชัน

หากต้องการสร้างต้นแบบฟีเจอร์ Generative AI ให้เริ่มต้นด้วย Google AI Client SDK SDK นี้จะช่วยให้คุณเข้าถึง Gemini API และลดความซับซ้อนในการโต้ตอบของแอปกับโมเดล Gemini Google AI Client SDK อยู่ในรุ่นทดลองและควรใช้สำหรับการสร้างต้นแบบเท่านั้น

ดูข้อมูลเพิ่มเติมเกี่ยวกับ SDK ไคลเอ็นต์ AI ของ Google

หากต้องการนําประสบการณ์ AI ไปใช้ในเวอร์ชันที่ใช้งานจริง ให้ใช้ Vertex AI ใน Firebase เช่นเดียวกับ SDK ไคลเอ็นต์ AI ของ Google Firebase SDK นี้ให้สิทธิ์เข้าถึงโมเดล Gemini รวมถึงมีตัวเลือกด้านความปลอดภัยและการกําหนดค่าที่สําคัญสําหรับแอปเวอร์ชันที่ใช้งานจริง นอกจากนี้ Firebase ยังมีการสนับสนุนและฟีเจอร์ระดับเวอร์ชันที่ใช้งานจริงในแพลตฟอร์มอุปกรณ์เคลื่อนที่ต่างๆ

ดูข้อมูลเพิ่มเติมเกี่ยวกับ Vertex AI ใน Firebase

AI สำหรับองค์กร

ไอคอน Vertex AI

Vertex AI เป็นแพลตฟอร์มการพัฒนา AI แบบรวมศูนย์ที่มีการจัดการโดยสมบูรณ์ของ Google องค์กรต่างๆ สามารถใช้แพลตฟอร์ม Vertex AI ของ Google เพื่อมอบประสบการณ์การใช้งาน AI ที่ปรับแต่งเองให้กับอุปกรณ์ Android โดยใช้การผสานรวมแบ็กเอนด์ สร้าง ฝึก และทำให้แอปพลิเคชัน AI ใช้งานได้บนโครงสร้างพื้นฐานระดับโลกที่ปรับขนาดได้ของ Google เครื่องมือนี้เป็นโซลูชันที่ยอดเยี่ยมสำหรับ AI ระดับองค์กร โดยมีสิทธิ์เข้าถึงโมเดลและเครื่องมือกว่า 130 รายการ รวมถึง AI Studio, Agent Builder และโมเดล Gemini

กรณีการใช้งาน

  • การฝึกและการนำส่งโมเดลที่กำหนดเอง
  • การสร้างรูปภาพและวิดีโอ
  • ตัวแทนเสมือน ฝ่ายสนับสนุนลูกค้า
  • การแปลงคำพูดเป็นข้อความ การประมวลผลภาษาธรรมชาติ

โซลูชัน

ใช้แพลตฟอร์ม Vertex AI ของ Google เพื่อสร้างแอปพลิเคชัน AI ที่กําหนดเองและเชื่อมต่อแอป Android กับเลเยอร์บริการ

ดูข้อมูลเพิ่มเติมเกี่ยวกับ Vertex AI

แหล่งข้อมูลเพิ่มเติม

เครื่องมือ Generative AI อย่างมีความรับผิดชอบ

โมเดล AI ควรสอดคล้องกับนโยบายด้านความปลอดภัย ได้รับการประเมินความยุติธรรมและความถูกต้อง และออกแบบมาให้โปร่งใส ชุดเครื่องมือ Generative AI ที่มีความรับผิดชอบให้ความช่วยเหลือและคำแนะนำในการช่วยคุณออกแบบ สร้าง ประเมิน และใช้งานโมเดล AI แบบเปิดอย่างมีความรับผิดชอบ

Gemini ใน Android Studio

Gemini ใน Android Studio เป็นผู้ช่วยในการเขียนโค้ดสำหรับการพัฒนาแอป Android ซึ่งทำงานด้วยระบบปัญญาประดิษฐ์ (AI) และเข้าใจภาษาธรรมชาติ ซึ่งจะช่วยให้คุณทำงานได้อย่างมีประสิทธิภาพมากขึ้นด้วยการตอบคำถามเกี่ยวกับการพัฒนา Android Gemini ช่วยคุณค้นหาแหล่งข้อมูลที่เกี่ยวข้อง เรียนรู้แนวทางปฏิบัติแนะนำ และประหยัดเวลาได้

เทมเพลตเริ่มต้นของ Gemini API

เทมเพลตเริ่มต้นของ Gemini API เป็นไปตามบทแนะนำแบบออนไลน์สําหรับการเริ่มต้นใช้งาน Gemini ใน Android อย่างใกล้ชิด ซึ่งใช้ประโยชน์จาก Google AI Client SDK สําหรับ Android และแสดงวิธีทํางานกับพรอมต์ข้อความและรูปแบบคําตอบ

ข้อมูลอ้างอิง

Google API และ SDK สําหรับ Gen AI ใน Android

สภาพแวดล้อม

API หรือ SDK

รุ่นที่รองรับ

ความพร้อมใช้งาน

การใช้งานที่แนะนำ

การผสานรวม Android กับการอนุมานในอุปกรณ์

Google AI Edge SDK

Gemini Nano

การเข้าถึงแบบสาธารณะเพื่อทดลองใช้

รุ่นทดลอง

การผสานรวม Android กับการอนุมานจากระบบคลาวด์

Google AI Client SDK

Gemini 1.5 Flash
Gemini 1.5 Pro
Gemini 1.0 Pro

เวอร์ชันตัวอย่างแบบสาธารณะ

การสร้างต้นแบบเท่านั้น

Vertex AI ใน Firebase SDK

Gemini 1.5 Flash
Gemini 1.5 Pro
Gemini 1.0 Pro

เวอร์ชันสำหรับผู้ใช้ทั่วไป (GA)

แนะนำสำหรับเวอร์ชันที่ใช้งานจริง

การผสานรวมแบ็กเอนด์กับการอนุมานข้อมูลในระบบคลาวด์

แพลตฟอร์ม Vertex AI

โมเดลฐานรากกว่า 130 รุ่น (รวมถึงโมเดล Gemini 1.5)

เวอร์ชันสำหรับผู้ใช้ทั่วไป (GA)

แนะนำสำหรับเวอร์ชันที่ใช้งานจริง

การผสานรวม Android กับการอนุมานในอุปกรณ์

การอนุมาน LLM ของ MediaPipe

Gemma 2B
Falcon 1B
LM 3B ที่เสถียร
Phi-2

รุ่นทดลอง

โมเดล Generative AI ของ Google

Google มีโมเดล Generative AI หลายรูปแบบที่คุณใช้ในแอป Android ได้

สภาพแวดล้อม

โมเดล

ประเภท (ต้นทุน)

รูปแบบอินพุตที่รองรับ

เอาต์พุตข้อมูล

ในอุปกรณ์

Gemini Nano

ไม่มีค่าใช้จ่าย

ข้อความ รูปภาพ

ข้อความ

เมฆ

Gemini 1.5 Flash

ไม่มีค่าใช้จ่าย/มีค่าใช้จ่าย

ข้อความ รูปภาพ วิดีโอ เสียง

ข้อความ

Gemini 1.5 Pro

ไม่มีค่าใช้จ่าย/มีค่าใช้จ่าย

ข้อความ รูปภาพ วิดีโอ เสียง

ข้อความ

Gemini 1.0 Pro

ไม่มีค่าใช้จ่าย/มีค่าใช้จ่าย

ข้อความ

ข้อความ

ในอุปกรณ์, คลาวด์

Gemma & Gemma 2

ไม่มีค่าใช้จ่าย (รูปแบบเปิด)

ข้อความ

ข้อความ

ดูรายละเอียดทั้งหมดเกี่ยวกับความสามารถของโมเดลแต่ละรุ่น รวมถึงขีดจํากัดของโทเค็นและอัตราได้ที่โมเดล Gemini