Autor(es):
Ano:
[INTRODUÇÃO] O estudo da mobilidade urbana, ainda mais em cidades do porte e volume de fluxos como São Paulo, é essencial para a compreensão das dinâmicas entre as regiões da cidade e para o diagnóstico de problemas de acessibilidade às oportunidades no tecido urbano. Considerando a importância da produção de dados confiáveis para o auxílio à tomada de decisão no setor público e considerando também o uso crescente de estratégias intensivas em dados dentro do contexto de Big Data, o presente trabalho busca investigar a possibilidade de usar dados simulados a partir de ferramentas de Big Data para gerar informações sobre a mobilidade no município de São Paulo em modais públicos e privados. Diante da relativa inovação dessa estratégia, a importância de validar esses dados para uso futuro é fundamental. [METODOLOGIA] O processo de trabalho ocorreu em duas etapas: A simulação de viagens e a análise de dados. A simulação foi feita a partir da ferramenta Google Distance Matrix API, um serviço de roteamento da Google com a possibilidade de acesso remoto. Um programa instalado na nuvem realizou chamadas a essa ferramenta em períodos regularmente distribuídos durante o dia, em dias úteis, por quase três meses a partir de coordenadas de origem e destino parcialmente aleatorizadas. As chamadas foram feitas para transporte de carro e de transporte público. A análise dos dados foi feita a partir de medidas comparativas entre os diferentes modais – a diferença de tempos de viagem e a razão de tempos de viagem. Foi feita a estatística descritiva das medidas, além de análises exploratórias da distribuição espacial dos resultados. Por último, utilizando regressões lineares simples e especializadas (modelos SAR e GWR) foram exploradas as relações dessas medidas com variáveis a nível distrital de infraestrutura de transporte público e variáveis socioeconômicas de controle para checar a responsividade dos dados ao contexto físico da cidade registrado nessas variáveis. [Resultados] A análise da estrutura dos dados indicou uma distribuição normal dos tempos de viagens e uma distribuição normal das medidas elaboradas, com algum desvio para tempos de viagem mais longos. A distribuição espacial dos dados pelo município segue padrões reconhecidos na cidade de São Paulo, com indicações de maior gasto relativo de tempo de transporte público para as regiões norte, sul e no sul da zona leste do município. A modelagem dos dados indicou padrões consistentes de relação com algumas variáveis – a presença de estações de Metrô e de estações da CPTM próximas ao distrito - havendo reflexo dos resultados entre os diferentes modelos. Ao mesmo tempo algumas variáveis socioeconômicas também registraram relações com os dados, como a proporção da população de não brancos no distrito. Também foram identificados vieses decorrentes da estratégia de simulação, que ao partir de uma distribuição de coordenadas de origem e destino seguindo a densidade populacional privilegiou distâncias de viagem acompanhando essa densidade de distribuição de pontos, além de seguir as relações espaciais entre as regiões do município. [CONCLUSÃO] A partir do trabalho foi possível validar a responsividade dos dados às variáveis que refletem as condições de mobilidade de São Paulo. Ao mesmo tempo foram identificados vieses importantes, que podem ser evitados em futuras estratégias semelhantes. Futuras validações mais aprofundadas e com o uso de dados mais diretos de origem e destino – como os dados decorrentes da Pesquisa OD do Metrô – são interessantes para caracterizar melhor a capacidade dos dados simulados de refletir a realidade.