Información general
NEW STATE Mobile es un juego de batalla masiva de Krafton que se lanzó en noviembre de 2021 en todo el mundo y alcanzó más de 45 millones de descargas en el primer mes de su lanzamiento. KRAFTON, Inc. es un colectivo de estudios independientes de desarrollo de juegos que se reúnen con el fin de crear experiencias de entretenimiento innovadoras y atractivas para los gamers de todo el mundo. La empresa está formada por PUBG Studios, Bluehole Studio, Striking Distance Studios, RisingWings, Dreamotion y Unknown Worlds, cada uno con su propia experiencia única. NEW STATE Mobile se creó con Unreal Engine 4 y se realizaron varios intentos para reducir el consumo de calor y batería causado por el alto uso de la GPU a partir de sus características distintivas de videojuegos.
Los gamers pueden jugar batallas a largo alcance, por lo que el motor de juego debe poder renderizar escenas a una distancia considerable. Además, hay numerosas plantas presentes en el campo de batalla, lo que hace que su superposición tenga un impacto significativo en la disminución del rendimiento. Como resultado, el equipo decidió utilizar el Inspector de GPU de Android (AGI) para optimizar el uso de la GPU del juego y eliminar los cuellos de botella.
Figura 1: Captura de pantalla de NEW STATE Mobile
Qué hizo la empresa
NEW STATE Mobile usó AGI para acceder a mucha información del contador de GPU y optimizar su uso de GPU según corresponda. Identificaron pases de renderización innecesarios con la ayuda de los datos de generación de perfiles de actividad de la GPU proporcionados por AGI. Después de identificar qué segmentos consumían el uso de la GPU y el ancho de banda de la memoria, siguieron verificando el progreso de la optimización con el contador de GPU y la actividad de la GPU de un lado a otro para verificar si estaban en la dirección correcta.
Figura 2: Captura de pantalla de NEW STATE Mobile
Estos son algunos datos que aprendieron sobre el rendimiento del juego con AGI:
Optimización del pase base: El paso previo de profundidad, una tecnología que aumenta el uso de Early-z, ayudó a disminuir el uso del sombreado de fragmentos. El paso previo a la profundidad se usó específicamente para el nivel de detalle (LOD0), que ocupa la mayor parte del espacio de la pantalla, lo que minimiza la carga que puede generar las llamadas de dibujo adicionales. Además, el uso del formato de Scenecolor de 32 bits puede aumentar el rendimiento de todo el pase de renderización. El formato predeterminado de SceneColor de UnrealEngine4 es FloatRGBA, que es de 64 bits. Si se usa un formato de 32 bits, el ancho de banda de la memoria se puede reducir a la mitad.
Impacto medido: Después de aplicar la previa de profundidad, el uso de GPU disminuyó en un 7.5%. Debido a la separación de profundidad, más fragmentos podrían ser Early-Z. La tasa de tiempo necesaria para el sombreado de fragmentos se redujo un 2%. Con el formato de Scenecolor de 32 bits, el uso de GPU se redujo en un 5.3%. Los sombreadores ocupados disminuyeron un 2% y la lectura total de GPU de la memoria del sistema disminuyó 330 MB/s. La cantidad de escrituras de la GPU en la memoria del sistema se redujo en 78 MB/s y la lectura de memoria de textura también se redujo en 43 MB/s.
Optimización de paso de sombras: Cuando se usan mallas como aplicadores de sombras, el nivel de detalle de polígonos alto no genera una diferencia en la calidad. Es preferible usar un nivel de detalle de polígonos bajos, que ayuda a reducir la cantidad de triángulos. En Unreal Engine 4, se puede usar el nivel de detalle de polígonos bajos mediante el comando de la consola "ForceLODShadow".
Impacto medido: La cantidad de triángulos que se usan para las sombras disminuyó alrededor de 120,000. Los datos del contador de GPU en AGI mostraron que el uso de GPU disminuyó alrededor del 2%, la cantidad de memoria de GPU que se leía en la memoria del sistema disminuyó 130 MB/s y la cantidad escrita desde la GPU a la memoria del sistema disminuyó alrededor de 23 MB.
Instalación automática: La instalación automática, que se puede aplicar para la optimización del pase paralelo y base, te permite combinar los mismos comandos de renderización en el tiempo de ejecución y, luego, renderizarlos todos a la vez. Esto permitió a los dispositivos móviles NEWSTATE aplicar iluminación global a objetos individuales sin perder rendimiento. La instalación automática es una función básica de UnrealEngine4.
Medición del impacto: Se redujeron 500 las llamadas de dibujo. Redujo aproximadamente el 48% de las llamadas de dibujo. El uso de GPU disminuyó alrededor de un 3.5%. Estas mediciones se tomaron con OpenGL.
Figura 3: Datos internos que muestran la reducción del uso de GPU
Resultados
Gracias a AGI, NEW STATE Mobile redujo su uso de GPU en un 22%. A partir de la optimización del pase de profundidad y pase de sombra, el uso de GPU disminuyó un 19% y un 3%, respectivamente. También se redujeron de forma significativa las llamadas de dibujo y la memoria total leída y escrita por la GPU desde la memoria del sistema.
Comenzar
Obtén información para analizar el impacto de tu juego en dispositivos Android identificando problemas de rendimiento y áreas para optimizar con el Inspector de GPU de Android (AGI).