ข่าวผลิตภัณฑ์

Prompt API ของ ML Kit: ปลดล็อกประสบการณ์การใช้งาน Gemini Nano ในอุปกรณ์ที่กำหนดเอง

อ่าน 2 นาที
ผู้เขียน 3 คน
Caren Chang, Chengji Yan, Penny Li

AI ช่วยให้การสร้างประสบการณ์การใช้งานแอปที่ปรับเปลี่ยนในแบบของคุณง่ายขึ้น ซึ่งจะแปลงเนื้อหาเป็นรูปแบบที่เหมาะสมสำหรับผู้ใช้ ก่อนหน้านี้เราได้เปิดใช้ให้นักพัฒนาซอฟต์แวร์ผสานรวมกับ Gemini Nano ผ่านML Kit GenAI API ที่ปรับให้เหมาะกับกรณีการใช้งานที่เฉพาะเจาะจง เช่น การสรุปและการอธิบายรูปภาพ

วันนี้ถือเป็นก้าวสำคัญของ Generative AI ในอุปกรณ์ของ Android เราขอประกาศเปิดตัว Prompt API ของ ML Kit GenAI ในเวอร์ชันอัลฟ่า API นี้ช่วยให้คุณส่งคำขอในรูปแบบภาษาธรรมชาติและคำขอแบบมัลติโมดัลไปยัง Gemini Nano ได้ ซึ่งตอบโจทย์ความต้องการในการควบคุมและความยืดหยุ่นที่มากขึ้นเมื่อสร้างด้วยโมเดล Generative

พาร์ทเนอร์อย่าง Kakao ได้เริ่มสร้างด้วย Prompt API แล้ว ซึ่งสร้างประสบการณ์ที่ไม่เหมือนใครและส่งผลกระทบต่อโลกแห่งความเป็นจริง คุณสามารถทดลองใช้ฟีเจอร์ที่มีประสิทธิภาพของ Prompt API ได้แล้ววันนี้ด้วยโค้ดเพียงเล็กน้อย

 

 

ก้าวข้าม GenAI ในอุปกรณ์ที่สร้างไว้ล่วงหน้าไปสู่ GenAI ในอุปกรณ์ที่กำหนดเอง

Prompt API ก้าวข้ามฟังก์ชันการทำงานที่สร้างไว้ล่วงหน้าเพื่อรองรับกรณีการใช้งาน GenAI ที่กำหนดเองและเฉพาะแอป ซึ่งช่วยให้คุณสร้างฟีเจอร์ที่ไม่เหมือนใครด้วยการแปลงข้อมูลที่ซับซ้อนได้ Prompt API ใช้ Gemini Nano ในอุปกรณ์เพื่อประมวลผลข้อมูลในอุปกรณ์ ซึ่งช่วยให้ใช้งานแบบออฟไลน์ได้และปรับปรุงความเป็นส่วนตัวของผู้ใช้

กรณีการใช้งานหลักของ Prompt API

Prompt API รองรับกรณีการใช้งาน GenAI ที่ปรับแต่งได้สูง ตัวอย่างที่แนะนำมีดังนี้

  • การทำความเข้าใจรูปภาพ: วิเคราะห์รูปภาพเพื่อจัดประเภท (เช่น การสร้างโพสต์โซเชียลมีเดียฉบับร่างหรือการระบุแท็ก เช่น "สัตว์เลี้ยง" "อาหาร" หรือ "การเดินทาง")
  • การสแกนเอกสารอัจฉริยะ: ใช้โมเดล ML แบบเดิมเพื่อแยกข้อความจากใบเสร็จ แล้วจัดหมวดหมู่แต่ละรายการด้วย Prompt API
  • การแปลงข้อมูลสำหรับ UI: วิเคราะห์เนื้อหาแบบยาวเพื่อสร้างชื่อการแจ้งเตือนแบบสั้นที่น่าสนใจ
  • การแจ้งเตือนเนื้อหา: แนะนำหัวข้อสำหรับรายการบันทึกใหม่ตามค่ากำหนดธีมของผู้ใช้
  • การวิเคราะห์เนื้อหา: จัดประเภทรีวิวของลูกค้าเป็นหมวดหมู่เชิงบวก กลางๆ หรือเชิงลบ
  • การแยกข้อมูล: แยกรายละเอียดที่สำคัญเกี่ยวกับกิจกรรมที่จะจัดขึ้นจากเธรดอีเมล

การติดตั้งใช้งาน
Prompt API ช่วยให้คุณสร้างพรอมต์ที่กำหนดเองและตั้งค่าพารามิเตอร์การสร้างที่ไม่บังคับได้ด้วยโค้ดเพียงไม่กี่บรรทัด ดังนี้

Generation.getClient().generateContent(
   generateContentRequest(
       ImagePart(bitmapImage),
       TextPart("Categorize this image as one of the following: car, motorcycle, bike, scooter, other. Return only the category as the response."),
   ) {
       // Optional parameters
       temperature = 0.2f
       topK = 10
       candidateCount = 1
       maxOutputTokens = 10
   },
)

ดูตัวอย่างการติดตั้งใช้งาน Prompt API โดยละเอียดเพิ่มเติมได้ในเอกสารประกอบอย่างเป็นทางการและตัวอย่างใน GitHub

Gemini Nano, ประสิทธิภาพ และการสร้างต้นแบบ

ปัจจุบัน Prompt API ทำงานได้ดีที่สุดในอุปกรณ์ Pixel 10 Series ซึ่งใช้ Gemini Nano เวอร์ชันล่าสุด (nano-v3) Gemini Nano เวอร์ชันนี้สร้างขึ้นบนสถาปัตยกรรมเดียวกับ Gemma 3n ซึ่งเป็นโมเดลที่เราแชร์กับชุมชนโมเดลแบบเปิดเป็นครั้งแรกในงาน I/O

รากฐานที่ใช้ร่วมกันระหว่าง Gemma 3n กับ nano-v3 ช่วยให้นักพัฒนาซอฟต์แวร์สร้างต้นแบบฟีเจอร์ได้ง่ายขึ้น สำหรับผู้ที่ไม่มีอุปกรณ์ Pixel 10 คุณสามารถเริ่มทดลองใช้พรอมต์ได้แล้ววันนี้โดยสร้างต้นแบบด้วย Gemma 3n ในอุปกรณ์

ดูรายการอุปกรณ์ทั้งหมดที่รองรับ GenAI API ได้ในเอกสารประกอบการรองรับอุปกรณ์

ดูข้อมูลเพิ่มเติม

เริ่มติดตั้งใช้งาน Prompt API ในแอป Android ได้แล้ววันนี้โดยใช้คำแนะนำจากเอกสารประกอบอย่างเป็นทางการและตัวอย่างใน GitHub

เขียนโดย

อ่านต่อ