Previsão de demanda com R

Guilherme Mori - 2016/02/20

Olá, este é o primeiro de uma série de posts que faremos sobre a área de Business Intelligence e Análise de Dados da 99.

Sempre que quiser, você encontrará tudo na área de 99 Dados.

Aqui na 99 buscamos trazer qualidade para uma tomada de decisão mais assertiva. Fazemos isso com dois objetivos:

  1. Do lado do Taxista, maximizar o número de corridas aumentando a rentabilidade de todos;
  2. Do lado do passageiro, garantir que haverá um taxista pronto para atender sua corrida.

Cumprir estes objetivos exige modelagens complexas, análises históricas, previsões e entendimento de comportamento do mercado. Esta é uma tarefa bastante complicada, mas é o desafio que nos move e nos faz querer ir mais longe.

Análise complexa e profunda é O trabalho para a equipe de Business Intelligence e Market & Insights da 99 – queremos maximizar a experiência com a 99 (taxista e usuário) e levar cada vez mais pessoas para seus destinos.

Antes de entrarmos em alguns detalhes, precisamos esclarecer algo sobre economia básica: curva de oferta e demanda. Em qualquer livro de introdução à economia, nos primeiro capítulos serão abordados os aspectos destas curvas.

Curvas de oferta e demanda são a chave para garantir nossos objetivos. Entendemos que ambas são elásticas e sujeitas a alterações com variações, principalmente, no preço. Mas como isso afeta a 99?

Com a entrada de novas promoções ocorre uma variação das tarifas. Assim, a previsão da oferta e da demanda sofrerão alterações proporcionais à variação do preço das corridas. Cabe ao time de Inteligência da 99 entender essas mudanças e montar modelos de previsão de oferta e demanda.

Para chegar na previsão, fazemos uso de:

  • Dados internos históricos
  • Informações de promoções oferecidas
  • R-Project com Shiny

Dados Internos Históricos

Ao longo dos últimos três anos de 99, geramos dados sobre 7,5 milhões de usuários e 140 mil motoristas de táxi em todo o Brasil. São mais de 40 milhões de corridas realizadas pelo país.

Olhar para o passado pode nos ajudar a entender o comportamento de expansão do mercado, melhorar a maneira como oferecemos nossos serviços e trazer insights sobre mobilidade urbana. Essas informações tornam-se úteis não só para nossa tomada de decisão, mas também para trabalharmos com órgãos públicos e criar cidades mais inteligentes e integradas.

Dados Internos

Diversos tópicos relacionados aos dados internos históricos ainda serão explorados em outros posts. Focaremos aqui no caso onde esses dados foram utilizados para dimensionar o tamanho mercado (curva de oferta e de demanda), receitas e modelagens dos cenários diante das variações de preço por conta de promoções.

Informações de Promoções Oferecidas

Claro Clube (50% de desconto) e Johnnie Walker® (até R$30 reais de desconto) são apenas dois exemplos das diversas campanhas realizadas pela 99. Em conjunto com os dados históricos, pode-se analisar o efeito das promoções no número de corridas e no comportamento de nossos usuários e taxistas, bem como de suas corridas.

R-Project com Shiny

Com os dados em mãos, é preciso ter uma boa ferramenta para importar, filtrar e analisar os dados para, finalmente, fazer sua modelagem. Utilizamos o R, um projeto open-source e gratuito (GNU General Public License version 2) com uma linguagem poderosa que exige conhecimentos em lógica de programação.

R Language

Sua interface é totalmente via scripts e linha de comando. Por mais assustadora que pareça, é uma linguagem fácil de ser aprendida e com uma grande comunidade disposta a dar todo o suporte, independente do nível de conhecimento do usuário. Uma vez interado de suas funcionalidades, o R promove a experimentação e a exploração por ser uma linguagem interativa, trabalhando em tempo real dos dados.

Visualização de dados e gráficos é uma parte essencial do R implementado desde seu core e por diversas bibliotecas públicas (como Lattice e ggplot2). Um conjunto de ferramentas estastíticas são padrões do software, como as mais tradicionais regressões e ANOVA, mas também manipulação de dados como transformação e agregar.

Como mencionei antes, existem diversas bibliotecas disponíveis publicamente para o R em seu repositório CRAN (Comprehensive R Archive Network), mas uma em especial chama a atenção para a criação de modelagens dinâmicas. A biblioteca Shiny, mantida pelos mesmos desenvolvedores do RStudio (interface gráfica para desenvolvimento em R), é uma ferramenta que permite a criação de páginas web com interação com as funcionalidades do R.

Google Analytics

Sem a necessidade de conhecimento técnico ou de programação, criar um aplicativo Shiny o acesso e a simulação a todos os usuários interessados em simular e entender o modelo sugerido. Assim, garantimos que todos tenham acesso às mesmas informações.

Resultado

Esta modelagem, em conjunto com suas simulações, fornece para os diferentes times da 99 hipóteses e perspectivas para uma melhor tomada de decisão visando atingir nossos objetivos de melhor a experiência do usuário e maximizar o resultado dos taxista

Gostou? Entre em contato com o time de BI clicando aqui!


: 99 Dados