Estudos de caso
O Datadog oferece milhões de insights de desempenho detalhados com o ProfilingManager
Leitura de 4 minutos
As regressões de desempenho são notoriamente difíceis de reproduzir, o que as torna um gargalo enorme para desenvolvedores de dispositivos móveis. Embora indicadores como taxas de ANR indiquem quais problemas ocorrem na produção, identificar a linha de código específica que resultou no problema de desempenho historicamente exigiu uma reprodução manual exaustiva ou uma experimentação especulativa de tentativa e erro.
O Datadog colaborou com o Google para atenuar essa frustração integrando a API ProfilingManager (disponível em dispositivos Android 15 e mais recentes) às plataformas de monitoramento de usuários reais (RUM, na sigla em inglês) e de criação de perfil contínua. Essa integração transforma o fluxo de trabalho de depuração, permitindo que os desenvolvedores vão além dos sintomas superficiais para detectar o motivo de um gargalo de desempenho.
Ao aproveitar essa API no nível do sistema, o Datadog agora processa milhões de perfis de produção semanalmente em todo o mundo, de acordo com dados internos do Datadog de junho de 2026. Ele oferece às equipes de engenharia um novo nível de visibilidade sobre o desempenho real, mantendo uma baixa sobrecarga de execução para o monitoramento de desempenho em escala de produção.
O impacto do ProfilingManager
O ProfilingManager é um serviço do sistema introduzido no Android 15 que permite que os apps coletem dados de performance de maneira programática, como amostras de pilha de chamadas, rastreamentos de campo e despejos de heap de memória diretamente de ambientes de produção. Essa capacidade muda o paradigma de engenharia da reprodução manual reativa para a análise de campo proativa.
Por exemplo, um app de comunicação do Google usou rastreamentos de campo para investigar por que os tempos de inicialização a frio eram mais lentos em hardware mais novo e potente. Ao analisar os rastreamentos coletados em campo e comparar rastreamentos em diferentes tipos de dispositivos, o engenheiro descobriu um problema de programação oculto: um serviço de conversão de texto em voz em segundo plano estava sendo pré-aquecido desnecessariamente durante a inicialização do app. Os rastreamentos revelaram que esse processo em segundo plano estava monopolizando o maior núcleo de CPU de alto desempenho do dispositivo, forçando a linha de execução principal do app a ficar inativa enquanto o pré-aquecimento ocorria.
Como resolver o desafio de visibilidade no nível do código do Android
Antes da implementação do ProfilingManager, o monitoramento de usuários reais (RUM) do Datadog se concentrava na integridade do aplicativo de alto nível e na telemetria no nível da sessão para avaliar a jornada do usuário. As equipes de engenharia podiam monitorar indicadores de desempenho do Android, como tempo até a exibição inicial, taxas de ANR, carga da CPU e frames congelados. Esses insights se estendiam a interações granulares, como latência de rede, eventos de toque e travamentos da linha de execução principal. No entanto, embora esses dados destacassem efetivamente quais gargalos de desempenho estavam surgindo no campo, eles não forneciam um caminho claro para identificar a causa raiz dessas falhas.
Para resolver isso, o Datadog precisava de um mecanismo de criação de perfil capaz de capturar rastreamentos do Android diretamente de dispositivos em produção com impacto mínimo no desempenho. Depois de avaliar abordagens alternativas, como escrever o próprio processador de rastreamento usando as APIs de depuração do Android, a equipe selecionou o ProfilingManager porque ele é a solução de criação de perfil mais eficiente das opções avaliadas e descarrega a sobrecarga de decisões de amostragem para o SO.
O ProfilingManager oferece suporte a uma ampla variedade de métodos de coleta, incluindo rastreamentos de CPU, amostragem de pilha de chamadas, análise de memória por meio de despejos de heap Java e perfis de heap nativos. Ele permite que os desenvolvedores criem perfis de builds de produção, façam upload de arquivos de rastreamento para armazenamento externo e os analisem na interface do analisador de rastreamento do Perfetto. Como um provedor de SaaS, o Datadog faz upload, visualiza e analisa esses perfis coletados pelo SDK, fornecendo uma visualização unificada da integridade do aplicativo.
Ao centralizar a telemetria de alta fidelidade em uma API de observabilidade unificada, o ProfilingManager capacita o Datadog e os clientes a monitorar, investigar e corrigir proativamente regressões complexas de desempenho do Android por meio de vantagens técnicas importantes:
- Diagnóstico granular da sessão : o Profil0ingManager melhora a capacidade de depuração ao fornecer dados de rastreamento diretos no nível do SO, superando os desafios de visibilidade e alinhamento típicos do registro personalizado com serviços do sistema. Para se aprofundar, os desenvolvedores podem fazer o download desses rastreamentos do Datadog para investigar mais a fundo em ferramentas de visualização, como a interface do Perfetto.
- Acionadores de telemetria automatizados : ao aproveitar eventos nativos do sistema para iniciar gravações de rastreamento em pontos de otimização importantes, o Datadog reduz a necessidade de criar uma lógica de coleta personalizada. Embora a implementação inicial se concentre no indicador APP_FULLY_DRAWN, já existem planos para expandir essa observabilidade para incluir acionadores ANR, OOM e COLD_START.
- Snapshots de rastreamento proativos : ao fazer a interface diretamente com o serviço Perfetto no nível do sistema (rastreado), o ProfilingManager usa um modelo de gravação em segundo plano proativo projetado para capturar problemas imprevisíveis. Isso garante que os desenvolvedores recebam uma visualização precisa dos eventos que levam a uma anomalia de desempenho, oferecendo um nível de insight que excede o que é possível por meio da instrumentação manual.
- Detecção de gargalos em escala: o Datadog pode sintetizar a telemetria de toda a base de clientes global do Datadog para descobrir regressões que só surgem em configurações de hardware exclusivas e ambientes de rede variáveis.
- Estabilidade de recursos imposta pelo sistema : a API aproveita a coleta de rastreamento de amostragem para garantir que os impactos no desempenho e na experiência do usuário permaneçam imperceptíveis.
- Controles de dados no dispositivo : o ProfilingManager filtra informações irrelevantes de outros processos no dispositivo antes que o perfil seja entregue ao app. Isso minimiza os tamanhos dos arquivos e garante que apenas os dados relevantes para os processos do app sejam fornecidos.
Processamento de milhões de perfis semanais para otimizar apps reais
A integração de uma API de criação de perfil no nível do sistema a um SDK de monitoramento global exigiu a solução de desafios de infraestrutura. Como o ProfilingManager gera rastreamentos de desempenho altamente detalhados, a equipe de engenharia do Datadog precisou criar um pipeline capaz de analisar e analisar esses perfis no lado do servidor em escala. Além da coleta de perfis, o Datadog também enfatiza a importância de equilibrar a frequência de amostragem com a coleta de dados suficientes para gerar insights significativos sobre o aplicativo. O Datadog depende da limitação de taxa integrada do ProfilingManager como uma proteção de estabilidade essencial, evitando que solicitações excessivas de telemetria sobrecarreguem os dispositivos do usuário.
A equipe tem criado perfis do próprio app Android nativo do Datadog e de vários aplicativos de usuários iniciais há meses, coletando milhões de perfis para garantir uma experiência de lançamento rápida e sem erros e para refinar os algoritmos de detecção de desempenho. Hoje, a integração de produção é dimensionada perfeitamente em vários dispositivos Android.
Conclusão
Ao integrar a API ProfilingManager do Android, o Datadog conseguiu fechar a lacuna de visibilidade entre os sistemas de back-end e os aplicativos cliente para dispositivos móveis dos clientes. Ao processar milhões de perfis semanalmente com uma sobrecarga de dispositivo insignificante, o Datadog equipa os desenvolvedores Android com os insights no nível do código necessários para diagnosticar bugs de desempenho complexos instantaneamente, ajudando os desenvolvedores a criar aplicativos mais suaves e melhorar os indicadores de desempenho do app na Google Play Store. Para adotar a API ProfilingManager diretamente na estrutura de observabilidade de desempenho, consulte nossa documentação.
No futuro, o Datadog pretende tornar os dados de criação de perfil do Android uma entrada de primeira classe para que os agentes de codificação resolvam de forma autônoma os gargalos de desempenho, fechando o loop de feedback entre detecção e correção. O Datadog está trabalhando para tornar a criação de perfil do Android amplamente acessível aos desenvolvedores.
Para começar a usar o recurso de monitoramento de usuários reais do Datadog com tecnologia ProfilingManager, acesse Monitoramento de usuários reais do Datadog para dispositivos móveis.
Continuar lendo
-
Estudos de caso
O Karrot é um app de marketplace hiperlocal e orientado pela comunidade que permite que os usuários comprem, vendam e troquem itens com outros usuários verificados. Desde o lançamento na Coreia do Sul em 2015, a plataforma se expandiu para mercados globais, acumulando mais de 43 milhões de usuários registrados.
Thomas Ezan, Tracy Agyemang • Leitura de 2 minutos
-
Tutoriais
Embora o desempenho do app seja frequentemente equiparado a uma interface suave e tempos de inicialização rápidos, a memória serve como a base silenciosa em que essas métricas visíveis são criadas. Não é segredo que estamos vendo uma mudança em que a memória do dispositivo é mais importante do que nunca.
Alice Yuan, Ajesh Pai, Fung Lam • Leitura de 10 minutos
-
Estudos de caso
O FotMob registrou recentemente o maior aumento em um único dia no Wear OS entre o público instalado em 5 anos, com uma média diária de 2 a 3 vezes. O segredo? Um fluxo de instalação simples entre dispositivos que ajuda os usuários a descobrir o app para Wear OS diretamente no smartphone.
Garan Jenkin • Leitura de 3 minutos
Fique por dentro
Receba os insights mais recentes sobre o desenvolvimento do Android na sua caixa de entrada semanalmente.