Создавайте изображения с помощью Imagen

Imagen — это модель генерации изображений. Её можно использовать для создания индивидуальных аватаров для профилей пользователей или для интеграции персонализированных визуальных ресурсов в существующие экранные потоки для повышения вовлечённости пользователей.

Доступ к моделям Imagen из вашего Android-приложения осуществляется с помощью Firebase AI Logic SDK. Модели Imagen доступны через API обоих поставщиков Firebase AI Logic: Gemini Developer API (рекомендуется для большинства разработчиков) и Vertex AI.

Диаграмма, иллюстрирующая архитектуру интеграции Firebase AI Logic для доступа к Gemini Developer API. Приложение Android использует Firebase Android SDK для подключения к Firebase. Затем Firebase взаимодействует с Gemini Developer API, который обеспечивает доступ к Gemini Pro и Flash в облаке.
Рисунок 1. Доступ к моделям Imagen с помощью Firebase AI Logic.

Экспериментируйте с подсказками

Создание идеальных подсказок часто требует нескольких попыток. Вы можете поэкспериментировать с изображениями в Vertex AI Studio — IDE для проектирования и создания прототипов подсказок. Советы по улучшению подсказок см. в руководстве по атрибутам подсказок и изображений .

Скриншот интерфейса Google Cloud Vertex AI Studio, на котором показаны четыре сгенерированных изображения тираннозавра рекса с синим рюкзаком в доисторическом лесу. На левой боковой панели отображаются такие элементы навигации, как «Панель управления», «Сад моделей» и «Видение», а на правой панели находятся параметры настройки генерации изображений.
Рисунок 2. Vertex AI Studio поможет вам усовершенствовать подсказки по созданию изображений.

Настройте проект Firebase и подключите свое приложение

Следуйте инструкциям в документации Firebase, чтобы добавить Firebase в свой проект Android .

Добавьте зависимость Gradle

Добавьте следующие зависимости в файл build.gradle :

dependencies {
  // Import the BoM for the Firebase platform
  implementation(platform("com.google.firebase:firebase-bom:34.2.0"))

  // Add the dependency for the Firebase AI Logic library. When using the BoM,
  // you don't specify versions in Firebase library dependencies
  implementation("com.google.firebase:firebase-ai")
}

Создать изображение

Чтобы создать изображение в приложении Android, начните с создания экземпляра ImagenModel с дополнительной конфигурацией.

Параметр generationConfig позволяет задать отрицательное приглашение, количество изображений, соотношение сторон выходного изображения, формат изображения и добавить водяной знак. Параметр safetySettings позволяет настроить фильтры безопасности и по лицам.

Котлин

val config = ImagenGenerationConfig {
    numberOfImages = 2,
    aspectRatio = ImagenAspectRatio.LANDSCAPE_16x9,
    imageFormat = ImagenImageFormat.jpeg(compressionQuality = 100),
    addWatermark = false
}

// Initialize the Gemini Developer API backend service
// For Vertex AI use Firebase.ai(backend = GenerativeBackend.vertexAI())
val model = Firebase.ai(backend = GenerativeBackend.googleAI()).imagenModel(
    modelName = "imagen-3.0-generate-002",
    generationConfig = config,
    safetySettings = ImagenSafetySettings(
       safetyFilterLevel = ImagenSafetyFilterLevel.BLOCK_LOW_AND_ABOVE,
       personFilterLevel = ImagenPersonFilterLevel.BLOCK_ALL
    )
)

Ява

ImagenGenerationConfig config = new ImagenGenerationConfig.Builder()
    .setNumberOfImages(2)
    .setAspectRatio(ImagenAspectRatio.LANDSCAPE_16x9)
    .setImageFormat(ImagenImageFormat.jpeg(100))
    .setAddWatermark(false)
    .build();

// For Vertex AI use Firebase.ai(backend = GenerativeBackend.vertexAI())
ImagenModelFutures model = ImagenModelFutures.from(
    FirebaseAI.ai(backend = GenerativeBackend.googleAI()).imagenModel(
       "imagen-3.0-generate-002",
       config,
       ImagenSafetySettings.builder()
          .setSafetyFilterLevel(ImagenSafetyFilterLevel.BLOCK_LOW_AND_ABOVE)
          .setPersonFilterLevel(ImagenPersonFilterLevel.BLOCK_ALL)
          .build())
);

После создания экземпляра ImagenModel вы можете генерировать изображения, вызывая generateImages :

Котлин

val imageResponse = model.generateImages(
  prompt = "An astronaut riding a horse",
)
val image = imageResponse.images.first
val bitmapImage = image.asBitmap()

Ява

CompletableFuture<GenerateContentResponse> futureResponse =
    model.generateContent(
        Content.newBuilder()
            .addParts(
                Part.newBuilder()
                    .setText("An astronaut riding a horse")
                    .build())
            .build());

try {
  GenerateContentResponse imageResponse = futureResponse.get();
  List<GeneratedImage> images =
      imageResponse
          .getCandidates(0)
          .getContent()
          .getParts(0)
          .getInlineData()
          .getImagesList();

  if (!images.isEmpty()) {
    GeneratedImage image = images.get(0);
    Bitmap bitmapImage = image.asBitmap();
    // Use bitmapImage
  }
} catch (ExecutionException | InterruptedException e) {
  e.printStackTrace();
}