Hướng dẫn này được thiết kế để giúp bạn tích hợp các giải pháp trí tuệ nhân tạo tạo sinh và học máy (AI/ML) của Google vào ứng dụng của mình. Hướng dẫn này sẽ giúp bạn tìm hiểu các giải pháp trí tuệ nhân tạo và học máy hiện có, đồng thời chọn giải pháp phù hợp nhất với nhu cầu của bạn. Mục tiêu của tài liệu này là giúp bạn xác định công cụ cần sử dụng và lý do sử dụng công cụ đó, bằng cách tập trung vào nhu cầu và trường hợp sử dụng của bạn.
Để giúp bạn chọn giải pháp AI/ML phù hợp nhất với các yêu cầu cụ thể của mình, tài liệu này có một hướng dẫn về các giải pháp. Bằng cách trả lời một loạt câu hỏi về mục tiêu và các hạn chế của dự án, hướng dẫn này sẽ hướng bạn đến các công cụ và công nghệ phù hợp nhất.
Hướng dẫn này giúp bạn chọn giải pháp AI tốt nhất cho ứng dụng của mình. Hãy cân nhắc các yếu tố sau: loại dữ liệu (văn bản, hình ảnh, âm thanh, video), độ phức tạp của nhiệm vụ (từ tóm tắt đơn giản đến các nhiệm vụ phức tạp cần kiến thức chuyên môn) và kích thước dữ liệu (dữ liệu đầu vào ngắn so với tài liệu lớn). Điều này sẽ giúp bạn quyết định nên sử dụng Gemini Nano trên thiết bị hay AI dựa trên đám mây của Firebase (Gemini Flash hoặc Gemini Pro).
Khai thác sức mạnh của tính năng suy luận trên thiết bị
Khi thêm các tính năng AI và ML vào ứng dụng Android, bạn có thể chọn nhiều cách để phân phối các tính năng đó – trên thiết bị hoặc sử dụng đám mây.
Các giải pháp trên thiết bị như Gemini Nano cung cấp kết quả mà không tốn thêm chi phí, tăng cường quyền riêng tư cho người dùng và cung cấp chức năng ngoại tuyến đáng tin cậy vì dữ liệu đầu vào được xử lý cục bộ. Những lợi ích này có thể rất quan trọng đối với một số trường hợp sử dụng, chẳng hạn như tóm tắt tin nhắn, ưu tiên sử dụng trên thiết bị khi chọn giải pháp phù hợp.
Gemini Nano cho phép bạn chạy tính năng suy luận trực tiếp trên thiết bị chạy Android. Nếu bạn đang làm việc với văn bản, hình ảnh hoặc âm thanh, hãy bắt đầu với các API GenAI của Bộ công cụ học máy để có các giải pháp dùng được ngay. Các API GenAI của Bộ công cụ học máy được hỗ trợ bởi Gemini Nano, tận dụng AICore làm dịch vụ hệ thống cơ bản và được tinh chỉnh cho các nhiệm vụ cụ thể trên thiết bị. Các API GenAI của Bộ công cụ học máy là một lộ trình lý tưởng để đưa ứng dụng của bạn vào giai đoạn sản xuất nhờ giao diện cấp cao hơn và khả năng mở rộng. Các API này cho phép bạn gửi yêu cầu bằng ngôn ngữ tự nhiên với cả dữ liệu đầu vào là văn bản và hình ảnh, cho phép nhiều trường hợp sử dụng như hiểu hình ảnh, dịch ngắn, tóm tắt có hướng dẫn và nhiều trường hợp khác.
Đối với các nhiệm vụ học máy truyền thống, bạn có thể linh hoạt triển khai các mô hình tuỳ chỉnh của riêng mình. Chúng tôi cung cấp các công cụ mạnh mẽ như Bộ công cụ học máy, MediaPipe, LiteRT, và các tính năng phân phối của Google Play để đơn giản hoá quy trình phát triển của bạn.
Đối với các ứng dụng yêu cầu các giải pháp chuyên biệt cao, bạn có thể sử dụng mô hình tuỳ chỉnh của riêng mình, chẳng hạn như Gemma hoặc một mô hình khác được điều chỉnh cho trường hợp sử dụng cụ thể của bạn. Chạy mô hình trực tiếp trên thiết bị của người dùng bằng LiteRT, cung cấp các kiến trúc mô hình được thiết kế sẵn để tối ưu hoá hiệu suất.
Bạn cũng có thể cân nhắc xây dựng một giải pháp kết hợp bằng cách tận dụng cả mô hình trên thiết bị và mô hình trên đám mây.
Các ứng dụng di động thường sử dụng mô hình cục bộ cho dữ liệu văn bản nhỏ, chẳng hạn như cuộc trò chuyện hoặc bài viết trên blog. Tuy nhiên, đối với các nguồn dữ liệu lớn hơn (như tệp PDF) hoặc khi cần thêm kiến thức, bạn có thể cần một giải pháp dựa trên đám mây với các mô hình Gemini mạnh mẽ hơn.
Tích hợp các mô hình Gemini nâng cao
Nhà phát triển Android có thể tích hợp các tính năng AI tạo sinh nâng cao của Google, bao gồm các mô hình Gemini Pro và Gemini Flash mạnh mẽ, vào ứng dụng của họ bằng SDK Firebase AI Logic. SDK này được thiết kế cho nhu cầu dữ liệu lớn hơn và cung cấp khả năng mở rộng và tính thích ứng bằng cách cho phép truy cập vào các mô hình AI đa phương thức, có hiệu suất cao này.
Với SDK Firebase AI Logic, nhà phát triển có thể thực hiện các lệnh gọi phía máy khách đến các mô hình AI của Google một cách dễ dàng. Các mô hình này, chẳng hạn như Gemini Pro và Gemini Flash, chạy tính năng suy luận trên đám mây và cho phép các ứng dụng Android xử lý nhiều loại dữ liệu đầu vào, bao gồm hình ảnh, âm thanh, video và văn bản. Gemini Pro vượt trội trong việc suy luận về các vấn đề phức tạp và phân tích dữ liệu mở rộng, trong khi dòng Gemini Flash mang lại tốc độ vượt trội và cửa sổ ngữ cảnh đủ lớn cho hầu hết các nhiệm vụ.
Trường hợp sử dụng công nghệ học máy truyền thống
Mặc dù AI tạo sinh hữu ích cho việc tạo và chỉnh sửa nội dung như văn bản, hình ảnh và mã, nhưng nhiều vấn đề trong thế giới thực được giải quyết tốt hơn bằng các kỹ thuật Học máy (ML) truyền thống. Các phương thức đã được thiết lập này vượt trội trong các nhiệm vụ liên quan đến dự đoán, phân loại, phát hiện và hiểu các mẫu trong dữ liệu hiện có, thường có hiệu quả cao hơn, chi phí tính toán thấp hơn và triển khai đơn giản hơn so với các mô hình tạo sinh.
Các khung ML truyền thống cung cấp các giải pháp mạnh mẽ, được tối ưu hoá và thường thực tế hơn cho các ứng dụng tập trung vào việc phân tích dữ liệu đầu vào, xác định các tính năng hoặc đưa ra dự đoán dựa trên các mẫu đã học – thay vì tạo ra dữ liệu đầu ra hoàn toàn mới. Các công cụ như Bộ công cụ học máy, LiteRT và MediaPipe của Google cung cấp các tính năng mạnh mẽ được điều chỉnh cho các trường hợp sử dụng không tạo sinh này, đặc biệt là trong môi trường điện toán di động và biên.
Bắt đầu tích hợp công nghệ học máy bằng Bộ công cụ học máy
Bộ công cụ học máy cung cấp các giải pháp sẵn sàng sản xuất, được tối ưu hoá cho thiết bị di động cho các nhiệm vụ học máy phổ biến, không yêu cầu kiến thức chuyên môn trước về ML. SDK dành cho thiết bị di động dễ sử dụng này mang kiến thức chuyên môn về ML của Google trực tiếp đến các ứng dụng Android và iOS của bạn, cho phép bạn tập trung vào việc phát triển tính năng thay vì huấn luyện và tối ưu hoá mô hình. Bộ công cụ học máy cung cấp các API dựng sẵn và mô hình dùng được ngay cho các tính năng như quét mã vạch, nhận dạng văn bản (OCR), phát hiện khuôn mặt, gắn nhãn hình ảnh, phát hiện và theo dõi vật thể, nhận dạng ngôn ngữ và trả lời thông minh.
Các mô hình này thường được tối ưu hoá để thực thi trên thiết bị, đảm bảo độ trễ thấp, chức năng ngoại tuyến và tăng cường quyền riêng tư cho người dùng vì dữ liệu thường vẫn còn trên thiết bị. Chọn Bộ công cụ học máy để nhanh chóng thêm các tính năng ML đã được thiết lập vào ứng dụng di động mà không cần huấn luyện mô hình hoặc yêu cầu dữ liệu đầu ra tạo sinh. Đây là giải pháp lý tưởng để nâng cao hiệu quả các ứng dụng có tính năng "thông minh" bằng các mô hình được tối ưu hoá của Google hoặc bằng cách triển khai các mô hình TensorFlow Lite tuỳ chỉnh.
Bắt đầu sử dụng các hướng dẫn và tài liệu toàn diện của chúng tôi tại trang web dành cho nhà phát triển Bộ công cụ học máy.
Triển khai ML tuỳ chỉnh bằng LiteRT
Để kiểm soát tốt hơn hoặc triển khai các mô hình học máy của riêng bạn, hãy sử dụng ngăn xếp học máy tuỳ chỉnh được xây dựng trên LiteRT và Dịch vụ Google Play. Ngăn xếp này cung cấp những yếu tố cần thiết để triển khai các tính năng ML hiệu suất cao. LiteRT là một bộ công cụ được tối ưu hoá để chạy các mô hình TensorFlow một cách hiệu quả trên các thiết bị di động, nhúng và biên có tài nguyên hạn chế, cho phép bạn chạy các mô hình nhỏ hơn và nhanh hơn đáng kể, đồng thời tiêu thụ ít bộ nhớ, năng lượng và bộ nhớ hơn. Thời gian chạy LiteRT được tối ưu hoá cao cho nhiều bộ tăng tốc phần cứng (GPU, DSP, NPU) trên các thiết bị biên, cho phép suy luận có độ trễ thấp.
Chọn LiteRT khi bạn cần triển khai hiệu quả các mô hình ML đã huấn luyện (thường là để phân loại, hồi quy hoặc phát hiện) trên các thiết bị có công suất tính toán hoặc thời lượng pin hạn chế, chẳng hạn như điện thoại thông minh, thiết bị IoT hoặc bộ vi điều khiển. Đây là giải pháp ưu tiên để triển khai các mô hình dự đoán tuỳ chỉnh hoặc tiêu chuẩn ở biên, nơi tốc độ và việc bảo tồn tài nguyên là tối quan trọng.
Tìm hiểu thêm về việc triển khai ML bằng LiteRT.
Xây dựng khả năng nhận thức theo thời gian thực vào ứng dụng của bạn bằng MediaPipe
MediaPipe cung cấp các giải pháp học máy mã nguồn mở, nhiều nền tảng và có thể tuỳ chỉnh được thiết kế cho nội dung nghe nhìn trực tiếp và phát trực tuyến. Hưởng lợi từ các công cụ được tối ưu hoá, dựng sẵn cho các nhiệm vụ phức tạp như theo dõi cử động của tay, ước tính tư thế, phát hiện lưới khuôn mặt và phát hiện đối tượng, tất cả đều cho phép tương tác theo thời gian thực, hiệu suất cao ngay cả trên thiết bị di động.
Các quy trình dựa trên biểu đồ của MediaPipe có thể tuỳ chỉnh cao, cho phép bạn điều chỉnh các giải pháp cho ứng dụng Android, iOS, web, máy tính và phụ trợ. Chọn MediaPipe khi ứng dụng của bạn cần hiểu và phản ứng ngay lập tức với dữ liệu cảm biến trực tiếp, đặc biệt là luồng video, cho các trường hợp sử dụng như nhận dạng cử chỉ, hiệu ứng AR, theo dõi thể dục hoặc điều khiển hình đại diện – tất cả đều tập trung vào việc phân tích và diễn giải dữ liệu đầu vào.
Khám phá các giải pháp và bắt đầu xây dựng bằng MediaPipe.
Tích hợp ứng dụng của bạn với trợ lý thiết bị
Mặc dù việc tích hợp AI truyền thống tập trung vào việc "đưa AI vào ứng dụng của bạn", nhưng bạn cũng có thể "đưa ứng dụng của bạn vào AI". Bằng cách đóng góp chức năng của ứng dụng vào các tính năng AI của hệ thống, bạn cho phép các trợ lý ở cấp hệ thống (chẳng hạn như Gemini) khám phá và gọi các khả năng của ứng dụng một cách tự động. AppFunctions là cách chính để đạt được quá trình tích hợp này, cho phép ứng dụng của bạn trở thành một thành phần trong hệ sinh thái AI Android rộng lớn hơn.
Chọn một phương pháp tiếp cận
Khi kết hợp AI để cải thiện ứng dụng Android, bạn nên cân nhắc 3 phương pháp tiếp cận chính: thực hiện quá trình xử lý trên thiết bị, tận dụng các mô hình dựa trên đám mây hoặc thêm chức năng của ứng dụng vào AI ở cấp hệ thống. Các công cụ như Bộ công cụ học máy, Gemini Nano và LiteRT cho phép các tính năng trên thiết bị, trong khi các API đám mây Gemini có Firebase AI Logic cung cấp khả năng xử lý mạnh mẽ dựa trên đám mây. AppFunctions đại diện cho một phương pháp thứ ba, cho phép bạn "đưa ứng dụng của bạn vào AI" bằng cách cung cấp các tính năng của ứng dụng cho hệ thống một cách tự động.
Hãy cân nhắc các yếu tố sau khi chọn phương pháp tiếp cận:
| Thừa số | Giải pháp trên thiết bị | Giải pháp trên đám mây |
|---|---|---|
| Khả năng kết nối và chức năng ngoại tuyến | Lý tưởng để sử dụng ngoại tuyến; hoạt động mà không cần kết nối mạng. | Yêu cầu kết nối mạng để giao tiếp với các máy chủ từ xa. |
| Quyền riêng tư đối với dữ liệu | Xử lý và lưu trữ dữ liệu nhạy cảm cục bộ trên thiết bị. | Dữ liệu được truyền đến đám mây, yêu cầu tin tưởng vào tính bảo mật của nhà cung cấp bảo mật. |
| Tiềm năng khám phá và phạm vi tiếp cận | Tính năng tích hợp trực tiếp với hệ điều hành (AppFunctions) cho phép trợ lý khám phá các tính năng. | Tính năng khám phá thường bị giới hạn ở giao diện người dùng nội bộ của ứng dụng hoặc các tính năng tích hợp API cụ thể. |
| Khả năng của mô hình | Được tối ưu hoá cho độ trễ thấp và các nhiệm vụ cụ thể, ít chuyên sâu hơn. | Các mô hình mạnh mẽ có khả năng xử lý độ phức tạp cao và dữ liệu đầu vào lớn. |
| Cân nhắc chi phí | Không có phí trực tiếp cho mỗi lần sử dụng; tận dụng phần cứng hiện có của thiết bị. | Thường liên quan đến giá dựa trên mức sử dụng hoặc chi phí thuê bao liên tục. |
| Tài nguyên thiết bị | Tận dụng bộ nhớ cục bộ, RAM và thời lượng pin. | Tác động cục bộ tối thiểu; công việc nặng nhọc được chuyển sang máy chủ. |
| Tinh chỉnh | Tính linh hoạt hạn chế; bị giới hạn bởi khả năng phần cứng cục bộ. | Tính linh hoạt cao hơn để tuỳ chỉnh mở rộng và tinh chỉnh quy mô lớn. |
| Tính nhất quán trên nhiều nền tảng | Phạm vi cung cấp có thể khác nhau tuỳ thuộc vào hệ điều hành và khả năng hỗ trợ phần cứng hỗ trợ. | Trải nghiệm nhất quán trên mọi nền tảng có quyền truy cập Internet. |
Bằng cách cân nhắc kỹ các yêu cầu về trường hợp sử dụng và các lựa chọn hiện có, bạn có thể tìm thấy giải pháp AI/ML hoàn hảo để nâng cao ứng dụng Android của mình và mang đến trải nghiệm thông minh và được cá nhân hoá cho người dùng.
Hướng dẫn về các giải pháp AI/ML
Hướng dẫn về các giải pháp này có thể giúp bạn xác định các công cụ dành cho nhà phát triển phù hợp để tích hợp các công nghệ AI/ML vào dự án Android của mình.
Mục tiêu chính của tính năng AI là gì?
- A) Tạo nội dung mới (văn bản, nội dung mô tả hình ảnh) hoặc thực hiện quá trình xử lý văn bản đơn giản (tóm tắt, đọc và sửa lỗi hoặc viết lại văn bản)? → Chuyển đến phần AI tạo sinh
- B) Phân tích dữ liệu/dữ liệu đầu vào hiện có để dự đoán, phân loại, phát hiện, hiểu các mẫu hoặc xử lý luồng theo thời gian thực (như video/âm thanh)? → Chuyển đến phần ML và nhận thức truyền thống
- C) Nâng cao chức năng của ứng dụng để tích hợp với các tính năng AI của hệ thống (đưa ứng dụng của bạn vào AI)? → Chuyển đến phần Đưa ứng dụng của bạn vào AI
ML và nhận thức truyền thống
Bạn cần phân tích dữ liệu đầu vào, xác định các tính năng hoặc đưa ra dự đoán dựa trên các mẫu đã học, thay vì tạo ra dữ liệu đầu ra hoàn toàn mới.
Bạn đang thực hiện nhiệm vụ cụ thể nào?
- A) Cần tích hợp nhanh các tính năng ML phổ biến, dựng sẵn cho thiết bị di động?
(ví dụ: quét mã vạch, nhận dạng văn bản (OCR), phát hiện khuôn mặt, gắn nhãn hình ảnh, phát hiện đối tượng và theo dõi, nhận dạng ngôn ngữ, trả lời thông minh cơ bản)
- → Sử dụng: Bộ công cụ học máy (API truyền thống)
- Lý do: Tích hợp dễ dàng nhất cho các nhiệm vụ ML đã được thiết lập trên thiết bị di động, thường được tối ưu hoá để sử dụng trên thiết bị (độ trễ thấp, ngoại tuyến, quyền riêng tư).
- B) Cần xử lý dữ liệu phát trực tuyến theo thời gian thực (như video hoặc âm thanh) cho các nhiệm vụ nhận thức? (ví dụ: theo dõi cử động của tay, ước tính tư thế, lưới khuôn mặt, phát hiện đối tượng và phân đoạn vật thể theo thời gian thực trong video)
- → Sử dụng: MediaPipe
- Lý do: Khung chuyên biệt cho các quy trình nhận thức theo thời gian thực, hiệu suất cao trên nhiều nền tảng.
- C) Cần chạy hiệu quả mô hình ML được huấn luyện tuỳ chỉnh của riêng bạn (ví dụ: để phân loại, hồi quy, phát hiện) trên thiết bị, ưu tiên hiệu suất và mức sử dụng tài nguyên thấp?
- → Sử dụng: LiteRT (Thời gian chạy TensorFlow Lite)
- Lý do: Thời gian chạy được tối ưu hoá để triển khai hiệu quả các mô hình tuỳ chỉnh trên thiết bị di động và biên (kích thước nhỏ, suy luận nhanh, tăng tốc phần cứng).
- D) Cần huấn luyện mô hình ML tuỳ chỉnh của riêng bạn cho một nhiệm vụ cụ thể?
- → Sử dụng: LiteRT (Thời gian chạy TensorFlow Lite) + huấn luyện mô hình tuỳ chỉnh
- Lý do: Cung cấp các công cụ để huấn luyện và triển khai các mô hình tuỳ chỉnh, được tối ưu hoá cho thiết bị di động và biên thiết bị.
- E) Cần phân loại nội dung nâng cao, phân tích cảm xúc hoặc dịch nhiều ngôn ngữ với sắc thái cao?
- Hãy cân nhắc xem các mô hình ML truyền thống (có thể được triển khai bằng LiteRT hoặc đám mây) có phù hợp hay không, hoặc liệu NLU nâng cao có yêu cầu các mô hình tạo sinh hay không (quay lại phần Bắt đầu, chọn A). Đối với việc phân loại, phân tích tình cảm hoặc dịch dựa trên đám mây:
- → Sử dụng: Các giải pháp dựa trên đám mây (ví dụ: Google Cloud Natural Language API, Google Cloud Translation API, có thể truy cập bằng cách sử dụng một phần phụ trợ tuỳ chỉnh hoặc Vertex AI). (Mức độ ưu tiên thấp hơn so với các lựa chọn trên thiết bị nếu ngoại tuyến hoặc quyền riêng tư là yếu tố quan trọng).
- Lý do: Các giải pháp trên đám mây cung cấp các mô hình mạnh mẽ và hỗ trợ nhiều ngôn ngữ, nhưng yêu cầu kết nối và có thể phát sinh chi phí.
AI tạo sinh
Bạn cần tạo nội dung mới, tóm tắt, viết lại hoặc thực hiện các nhiệm vụ hiểu hoặc tương tác phức tạp.
Bạn có yêu cầu AI hoạt động ngoại tuyến, cần quyền riêng tư tối đa đối với dữ liệu (giữ dữ liệu người dùng trên thiết bị) hoặc muốn tránh chi phí suy luận trên đám mây?
- A) Có, ngoại tuyến, quyền riêng tư tối đa hoặc không tốn chi phí trên đám mây là yếu tố quan trọng.
- → Chuyển đến phần AI tạo sinh trên thiết bị
- B) Không, có kết nối và có thể chấp nhận được, các khả năng và khả năng mở rộng trên đám mây quan trọng hơn hoặc các tính năng cụ thể yêu cầu đám mây.
- → Chuyển đến phần AI tạo sinh trên đám mây
AI tạo sinh trên thiết bị (Sử dụng Gemini Nano)
Lưu ý: Yêu cầu thiết bị Android tương thích, hỗ trợ iOS hạn chế, các mô hình kém mạnh mẽ hơn so với các mô hình tương đương trên đám mây.
Với Prompt API của Bộ công cụ học máy, bạn có thể gửi yêu cầu bằng ngôn ngữ tự nhiên với dữ liệu đầu vào chỉ là văn bản hoặc văn bản và hình ảnh cho nhiều trường hợp sử dụng, chẳng hạn như hiểu hình ảnh, dịch ngắn và tóm tắt có hướng dẫn. Nếu các trường hợp sử dụng của bạn có thể đáp ứng các giới hạn về token này, thì các API GenAI của Bộ công cụ học máy là lựa chọn tốt nhất cho AI tạo sinh trên thiết bị. Bộ công cụ học máy cũng cung cấp các API được đơn giản hoá cho các nhiệm vụ phổ biến như tóm tắt và trả lời thông minh.
- → Sử dụng: Các API GenAI của Bộ công cụ học máy (được hỗ trợ bởi Gemini Nano)
- Lý do: Cách dễ nhất để tích hợp các nhiệm vụ AI tạo sinh trên thiết bị bằng cách sử dụng câu lệnh bằng ngôn ngữ tự nhiên, giải pháp trên thiết bị có mức độ ưu tiên cao nhất.
AI tạo sinh trên đám mây
Sử dụng các mô hình mạnh mẽ hơn, yêu cầu kết nối, thường liên quan đến chi phí suy luận, cung cấp phạm vi tiếp cận thiết bị rộng hơn và tính nhất quán trên nhiều nền tảng (Android và iOS) dễ dàng hơn.
Mức độ ưu tiên của bạn là gì: Dễ dàng tích hợp trong Firebase HAY tính linh hoạt/khả năng kiểm soát tối đa?
- A) Thích tích hợp dễ dàng hơn, trải nghiệm API được quản lý và có thể đã sử dụng Firebase?
- → Sử dụng: SDK Firebase AI Logic → Chuyển đến phần Firebase AI Logic
- B) Cần tính linh hoạt tối đa, quyền truy cập vào nhiều mô hình nhất (bao gồm cả mô hình của bên thứ ba/tuỳ chỉnh), tinh chỉnh nâng cao và sẵn sàng quản lý quá trình tích hợp phụ trợ của riêng bạn (phức tạp hơn)?
- → Sử dụng: Gemini API với Phụ trợ đám mây tuỳ chỉnh (sử dụng Google Cloud Platform)
- Lý do: Cung cấp khả năng kiểm soát cao nhất, quyền truy cập mô hình rộng nhất và các lựa chọn huấn luyện tuỳ chỉnh nhưng yêu cầu nỗ lực phát triển phụ trợ đáng kể. Phù hợp với các nhu cầu phức tạp, quy mô lớn hoặc được tuỳ chỉnh cao.
(Bạn đã chọn SDK Firebase AI Logic) Bạn cần loại nhiệm vụ tạo sinh và hồ sơ hiệu suất nào?
- A) Cần cân bằng giữa hiệu suất và chi phí, phù hợp với việc tạo văn bản, tóm tắt hoặc ứng dụng trò chuyện chung, nơi tốc độ là quan trọng?
- → Sử dụng: SDK Firebase AI Logic với Gemini Flash
- Lý do: Được tối ưu hoá cho tốc độ và hiệu quả trong môi trường được quản lý của Vertex AI.
- B) Cần chất lượng và khả năng cao hơn cho việc tạo văn bản phức tạp, suy luận, NLU nâng cao hoặc tuân theo hướng dẫn?
- → Sử dụng: SDK Firebase AI Logic với Gemini Pro
- Lý do: Mô hình văn bản mạnh mẽ hơn cho các nhiệm vụ đòi hỏi khắt khe, được truy cập thông qua Firebase.
AppFunctions
Bạn cần nâng cao chức năng của ứng dụng để tích hợp với các tính năng AI của hệ thống (đưa ứng dụng của bạn vào AI).
- → Sử dụng: AppFunctions
- Lý do: Cho phép các tính năng AI của hệ thống, chẳng hạn như Trợ lý, khám phá và gọi các khả năng của ứng dụng.