ข่าวสารเกี่ยวกับผลิตภัณฑ์

การอนุมานแบบผสมผสานเวอร์ชันทดลองและโมเดล Gemini ใหม่สำหรับ Android

อ่าน 3 นาที
Thomas Ezan
วิศวกรนักพัฒนาซอฟต์แวร์สัมพันธ์อาวุโส

หากคุณเป็นนักพัฒนาแอป Android ที่ต้องการใช้ฟีเจอร์ AI ที่ล้ำสมัยในแอป เราเพิ่งเปิดตัวการอัปเดตใหม่ที่มีประสิทธิภาพดังนี้

  • การอนุมานแบบผสมผสาน ซึ่งเป็น API ใหม่สำหรับ Firebase AI Logic เพื่อใช้ประโยชน์จากการอนุมานทั้งในอุปกรณ์และในระบบคลาวด์
  • การรองรับโมเดล Gemini ใหม่ ซึ่งรวมถึงโมเดล Nano Banana ล่าสุดสำหรับการสร้างรูปภาพ

ไปดูกันเลย

ทดลองใช้การอนุมานแบบผสมผสาน

ด้วย Firebase API สำหรับการอนุมานแบบผสมผสานใหม่ เราได้ใช้แนวทางการกำหนดเส้นทางตามกฎอย่างง่ายๆ เป็นโซลูชันเริ่มต้นเพื่อให้คุณใช้การอนุมานทั้งในอุปกรณ์และในระบบคลาวด์ผ่าน API ที่รวมเป็นหนึ่งเดียวได้ และเราวางแผนที่จะมอบความสามารถในการกำหนดเส้นทางที่ซับซ้อนมากขึ้นในอนาคต

ซึ่งจะช่วยให้แอปสลับระหว่าง Gemini Nano ที่ทำงานในอุปกรณ์กับโมเดล Gemini ที่โฮสต์ในระบบคลาวด์ได้แบบไดนามิก การดำเนินการในอุปกรณ์ใช้ Prompt API ของ ML Kit การอนุมานในระบบคลาวด์รองรับโมเดล Gemini ทั้งหมดจาก Firebase AI Logic ทั้งใน Vertex AI และ Developer API

หากต้องการใช้งาน ให้เพิ่มการขึ้นต่อกัน firebase-ai-ondevice ลงในแอปพร้อมกับ Firebase AI Logic

dependencies {
 [...] 
 implementation("com.google.firebase:firebase-ai:17.10.1")
 implementation("com.google.firebase:firebase-ai-ondevice:16.0.0-beta01")
}

ในระหว่างการเริ่มต้น คุณจะสร้างอินสแตนซ์ GenerativeModel และกำหนดค่าด้วยโหมดการอนุมานที่เฉพาะเจาะจง เช่น PREFER_ON_DEVICE (กลับไปใช้ระบบคลาวด์หาก Gemini Nano ไม่พร้อมใช้งานในอุปกรณ์) หรือ PREFER_IN_CLOUD (กลับไปใช้การอนุมานในอุปกรณ์หากออฟไลน์)

val model = Firebase.ai(backend = GenerativeBackend.googleAI())
    .generativeModel(
        modelName = "gemini-3.1-flash-lite",
        onDeviceConfig = OnDeviceConfig(
           mode = InferenceMode.PREFER_ON_DEVICE
        )
    )

val response = model.generateContent(prompt)

Firebase API สำหรับการอนุมานแบบผสมผสานสำหรับ Android ยังอยู่ในเวอร์ชันทดลอง และเราขอแนะนำให้คุณลองใช้ในแอป โดยเฉพาะอย่างยิ่งหากคุณใช้ Firebase AI Logic อยู่แล้ว

ปัจจุบัน โมเดลในอุปกรณ์มีความเชี่ยวชาญในการสร้างข้อความแบบครั้งเดียวโดยอิงตามข้อความหรืออินพุตรูปภาพ Bitmap เดียว ดูรายละเอียดเพิ่มเติมได้ที่ ข้อจำกัด

เราเพิ่งเผยแพร่ ตัวอย่างใหม่ในแคตตาล็อกตัวอย่าง AI ที่ใช้ประโยชน์จาก Firebase API สำหรับการอนุมานแบบผสมผสาน ซึ่งแสดงให้เห็นวิธีใช้ Firebase API สำหรับการอนุมานแบบผสมผสานเพื่อสร้างรีวิวโดยอิงตามหัวข้อที่เลือก 2-3 หัวข้อ แล้วแปลเป็นภาษาต่างๆ ดูโค้ดเพื่อดูการทำงาน

Hybrid_Inference-Inline-imagery.gif
ตัวอย่างการอนุมานแบบผสมผสานใหม่ในการทำงาน

ตัวอย่างการอนุมานแบบผสมผสานใหม่ในการทำงาน

ลองใช้โมเดลใหม่ของเรา

เราได้เปิดตัวโมเดล 2 รายการซึ่งเป็นส่วนหนึ่งของโมเดล Gemini ใหม่ ซึ่งมีประโยชน์อย่างยิ่งสำหรับนักพัฒนาแอป Android และผสานรวมเข้ากับแอปพลิเคชันของคุณได้ง่ายผ่าน Firebase AI Logic SDK

Nano Banana
เมื่อปีที่แล้ว เราได้เปิดตัว Nano Banana ซึ่งเป็นโมเดลการสร้างรูปภาพที่ล้ำสมัย และเมื่อ 2-3 สัปดาห์ที่ผ่านมา เราได้เปิดตัวโมเดล Nano Banana ใหม่ 2 รายการ

Nano Banana Pro (Gemini 3 Pro Image) ออกแบบมาสำหรับการสร้างชิ้นงานระดับมืออาชีพและสามารถแสดงข้อความที่มีความเที่ยงตรงสูง แม้ในแบบอักษรที่เฉพาะเจาะจงหรือจำลองลายมือประเภทต่างๆ

_Nano Banana 2 (Gemini 3.1 Flash Image)_ เป็นโมเดลที่มีประสิทธิภาพสูงเทียบเท่ากับ Nano Banana Pro โดยได้รับการปรับให้เหมาะกับกรณีการใช้งานที่เน้นความเร็วและปริมาณมาก และสามารถใช้ได้กับกรณีการใช้งานที่หลากหลาย (อินโฟกราฟิก สติกเกอร์เสมือนจริง ภาพประกอบตามบริบท ฯลฯ)  

โมเดล Nano Banana ใหม่ใช้ประโยชน์จากความรู้ในโลกแห่งความเป็นจริงและความสามารถในการให้เหตุผลเชิงลึกเพื่อสร้างรูปภาพที่แม่นยำและมีรายละเอียด

เราได้อัปเดตตัวอย่าง Magic Selfie (ใช้การสร้างรูปภาพเพื่อเปลี่ยนพื้นหลังของเซลฟี!) ให้ใช้ Nano Banana 2 ตอนนี้การแบ่งส่วนพื้นหลังได้รับการจัดการโดยตรงด้วยโมเดลการสร้างรูปภาพ ซึ่งทำให้การใช้งานง่ายขึ้นและช่วยให้ Nano Banana 2 แสดงความสามารถในการสร้างรูปภาพที่ดียิ่งขึ้น ดูการทำงานได้ ที่นี่.

magic_selfie.png
ตัวอย่าง Magic Selfie ที่อัปเดตแล้วใช้ Nano Banana 2 เพื่ออัปเดตพื้นหลังเซลฟี

คุณสามารถใช้โมเดลนี้ผ่าน Firebase AI Logic SDK อ่านข้อมูลเพิ่มเติมได้ใน เอกสารประกอบสำหรับ Android.

Gemini 3.1 Flash-Lite

นอกจากนี้ เรายังได้เปิดตัว Gemini 3.1 Flash-Lite ซึ่งเป็น Gemini Flash-Lite เวอร์ชันใหม่ โมเดล Gemini Flash-Lite ได้รับความนิยมเป็นพิเศษจากนักพัฒนาแอป Android เนื่องจากมีอัตราส่วนคุณภาพ/เวลาในการตอบสนองที่ดีและมีค่าใช้จ่ายในการอนุมานต่ำ นักพัฒนาแอป Android ใช้โมเดลนี้สำหรับกรณีการใช้งานต่างๆ เช่น การแปลข้อความในแอปหรือการสร้างสูตรอาหารจากรูปภาพอาหาร

Gemini 3.1 Flash-Lite ซึ่งปัจจุบันอยู่ในเวอร์ชันตัวอย่างจะช่วยให้ใช้กรณีการใช้งานที่ซับซ้อนมากขึ้นได้โดยมีเวลาในการตอบสนองเทียบเท่ากับ Gemini 2.5 Flash-Lite

ดูข้อมูลเพิ่มเติมเกี่ยวกับโมเดลนี้ได้ที่เอกสารประกอบของ Firebase

สรุป

ตอนนี้เป็นเวลาที่เหมาะที่จะสำรวจตัวอย่างแบบผสมผสานใหม่ในแคตตาล็อกของเราเพื่อดูความสามารถเหล่านี้ในการทำงานและทำความเข้าใจถึงประโยชน์ของการกำหนดเส้นทางระหว่างการอนุมานในอุปกรณ์และการอนุมานในระบบคลาวด์ นอกจากนี้ เราขอแนะนำให้คุณดูเอกสารประกอบเพื่อทดสอบโมเดล Gemini ใหม่

เขียนโดย

อ่านต่อ