Android GPU 검사기를 사용하여 GPU 사용량을 22% 줄인 NEW STATE Mobile

배경

Krafton의 배틀 로열 게임인 NEW STATE Mobile은 2021년 11월 전 세계에 출시되었으며 출시 첫 달에 4, 500만 회 이상의 다운로드를 기록했습니다. KRAFTON, Inc. 는 전 세계 게이머를 위한 혁신적이고 매력적인 엔터테인먼트 환경을 만들기 위해 모인 독립적인 게임 개발 스튜디오입니다. 이 회사는 PUBG Studios, Bluehole Studio, Striking Distance Studios, RizingWings, Dreamotion, Unknown Worlds로 구성되어 있으며 각각 고유한 전문성을 갖추고 있습니다. NEW STATE Mobile은 Unreal Engine 4로 제작되었으며, 독특한 게임 기능을 통해 높은 GPU 사용으로 인해 발생하는 열과 배터리 소모를 줄이기 위해 다양한 시도를 해왔습니다.

게이머는 장거리 전투를 할 수 있으므로 게임 엔진은 꽤 멀리서 장면을 렌더링할 수 있어야 합니다. 또한 전장에 수많은 초목이 있기 때문에 이러한 식생을 과도하게 사용하면 실적이 크게 저하됩니다. 이를 위해 팀은 게임의 GPU 사용을 최적화하고 병목 현상을 제거하는 데 도움이 되는 Android GPU 검사기 (AGI)를 채택했습니다.

NEW STATE Mobile의 스크린샷

그림 1: NEW STATE Mobile의 스크린샷

진행한 작업

NEW STATE Mobile은 AGI를 사용하여 수많은 GPU 카운터 정보에 액세스하고 그에 따라 GPU 사용을 최적화했습니다. 팀은 AGI에서 제공하는 GPU 활동 프로파일링 데이터를 활용하여 불필요한 렌더링 패스를 식별했습니다. 어떤 세그먼트가 GPU 사용량과 메모리 대역폭을 차지하는지 파악한 후 GPU 카운터와 GPU 활동을 사용해 최적화 진행 상황을 계속 확인하여 올바른 방향으로 나아가고 있는지 확인했습니다.

NEW STATE Mobile의 스크린샷

그림 2: NEW STATE Mobile의 스크린샷

다음은 AGI를 사용하여 게임의 실적에 관해 알게 된 몇 가지 사항입니다.

  • 기본 패스 최적화: Early-z 사용을 늘리는 기술인 깊이 프리패스는 프래그먼트 셰이딩 사용을 줄이는 데 도움이 되었습니다. 깊이 프리패스는 특히 화면 공간의 대부분을 차지하는 LOD0에 사용되어 추가 그리기 호출에서 비롯될 수 있는 부담을 최소화했습니다. 또한 32비트 장면 색상 형식을 사용하면 전체 렌더링 패스의 성능이 향상될 수 있습니다. UnrealEngine4의 기본 SceneColor 형식은 64비트인 FloatRGBA입니다. 32비트 형식을 사용하는 경우 메모리 대역폭을 절반으로 줄일 수 있습니다.

  • 영향 측정됨: 깊이 프리패스를 적용한 후 GPU 사용률이 7.5% 감소했습니다. 깊이 프리패스로 인해 더 많은 프래그먼트가 Early-Z일 수 있습니다. 프래그먼트 셰이딩에 필요한 시간 비율이 2% 감소했습니다. 32비트 장면 색상 형식을 통해 GPU 사용률이 5.3% 감소했습니다. Shaders Busy는 2% 감소했으며 시스템 메모리의 총 GPU 읽기는 330MB/s로 감소했습니다. GPU가 시스템 메모리에 쓰는 양은 초당 78MB, 텍스처 메모리 읽기도 43MB/초로 줄었습니다.

  • 섀도우 패스 최적화: 메시를 섀도우 캐스터로 사용할 때 하이 폴리곤 LOD를 사용해도 품질에는 아무런 영향이 없습니다. 삼각형 수를 줄이는 데 도움이 되는 로우 폴리곤 LOD를 사용하는 것이 좋습니다. Unreal Engine 4에서는 콘솔 명령어 'ForceLODShadow'를 통해 로우 폴리곤 LOD를 사용할 수 있습니다.

  • 영향 측정: 그림자에 사용되는 삼각형 수가 약 120,000개 감소했습니다. AGI의 GPU 카운터 데이터에 따르면 GPU 사용량은 약 2%, 시스템 메모리에서 읽는 GPU 메모리의 양은 130MB/s, GPU에서 시스템 메모리로 쓰이는 양이 약 23MB 감소했습니다.

  • 자동 인스턴스 생성: 섀도 패스와 기본 패스 최적화 모두에 적용할 수 있는 자동 인스턴스를 사용하면 런타임에 동일한 렌더링 명령어를 병합한 다음 한 번에 모두 렌더링할 수 있습니다. 이를 통해 NEWSTATE 모바일에서는 성능 저하 없이 개별 객체에 전역 조명을 적용할 수 있었습니다. 자동 인스턴스 생성은 UnrealEngine4에서 제공하는 기본 기능입니다.

  • 영향 측정: 그리기 호출이 500회 감소했습니다. 그리고 그리기 호출의 약 48% 를 줄였습니다. GPU 사용률은 약 3.5% 감소했습니다. 이 측정은 OpenGL을 사용하여 측정되었습니다.

GPU 사용량 감소를 보여주는 내부 데이터

그림 3: GPU 사용량 감소를 보여주는 내부 데이터

결과

NEW STATE Mobile은 AGI를 사용하여 GPU 사용량을 22% 줄였습니다. 깊이 프리패스와 섀도 패스 최적화로 인해 GPU 사용량이 각각 19%, 3% 감소했습니다. 그리기 호출과 GPU가 시스템 메모리에서 읽고 쓰는 총 메모리도 크게 줄었습니다.

시작하기

성능 문제와 Android GPU 검사기 (AGI)로 최적화할 영역을 파악하여 Android 기기에 미치는 게임의 영향을 분석하는 방법을 알아보세요.