Big Data e o Uso da Linguagem R para Análises de Dados Meteorológicos da Cidade de Marília, SP
Palavras-chave:
big data, linguagem R, análise de dados, meteorologiaResumo
Introdução: O Big Data é um sistema complexo de fontes de dados, tecnologias e metodologias que resultam em um volume extremo de dados de vários tipos, que podem ser rapidamente coletados, registrados e analisados. Para exemplificar sua aplicação, foi selecionada a meteorologia, que é a ciência que estuda os fenômenos que ocorrem na atmosfera, gerando grande volume de dados. Desta forma, objetivou-se usar a linguagem R para manipulação e análise dos dados coletados por estações meteorológicas. Metodologia: Assim, a linguagem R, que possui diversos recursos estatísticos e gráficos, foi usada para manipular e analisar os dados meteorológicos, que foram retirados do site do Instituto Nacional de Meteorologia, da estação automática de Marília, SP, no período de 2020 a 2022, resultando em planilha .xlsx. Dessa planilha foram selecionadas as colunas referentes a: data, hora (UTC) e chuva (mm). Resultados: Os dados foram importados para a interface RStudio, onde foram elaborados códigos para a manipulação e análise. Primeiramente, agrupou-se os dados utilizando a função bind.rows(), seguida do cálculo da média mensal de cada mês, finalizando com a geração de gráficos de linhas, representando as médias mensais referente às chuvas do período. Conclusão: A linguagem R facilitou a realização das análises dos dados meteorológicos para estabelecer as médias mensais da chuva da região de Marília, evidenciando que a linguagem R é eclética para o tratamento de grandes volumes de dados.