Skip to content

Syds674/Meteol_Project

Repository files navigation

PROJETO METEOL

Overview

O projeto Meteol visa extrair e processar dados meteorológicos, proporcionando análises fundamentais para diversas aplicações. Utilizando técnicas avançadas de engenharia de dados, busca-se fornecer insights valiosos e apoiar decisões informadas em setores como agricultura, energia e previsão climática. Este projeto também cria um ambiente configurado para a realização destes processos.

Clone o repositório em sua máquina local Linux e acesse a pasta Meteol_Project
git clone https://github.com/Syds674/Meteol_Project.git
cd Meteol_Project
Entre no diretório meteol e conceda permisões necessárias para o arquivo de criação de pastas
cd meteol
sed -i -e 's/\r$//' cria_dir.sh
Volte para a pasta Meteol_Project e execute o seguinte ocmando para a construção do ambiente:
sudo docker-compose -f all-docker-compose.yaml up
Em seguida, para realizar a cópia da estrutura de scripts para dentro do namenode, abra um novo terminal no diretório Meteol_Project e executar:
chmod +x copy_meteol_structure.sh
./copy_indicium_structure.sh

Obs.: Após a ultima execução irá conectar automáticamente no namenode.

Estando conectado no namenode, executar:
chmod 775 /meteol/cria_dir.sh
./meteol/cria_dir.sh

Obs.: Este comando irá criar a estrutura de pastas do HDFS

Executar o comando de criação de database no Hive:
spark-submit /meteol/create_database.py

Extração e exportação dos dados

Para a extração dos dados temos a pasta /meteol/scripts contendo os scripts que executarão todo processo de ETL

extracao_{data_de_extração_de_dados}.py
process_{nome_tabela}.py 
  • Script que une os asquivos csv em um data frame chamado table_{data_dos_dados_extraídos} e salva a tabela no hive.
Exemplo de execução do scripts
spark-submit spark-submit /meteol/scripts/extract_{data_dos_dados_extraídos}.py
spark-submit /indicium/scripts/process_{data_dos_dados_extraídos}.py 

Para consulta ao Hive e acesso as tabelas, utilize a seguinte URL

Applicação Url
Hue http://localhost:8888

User login: hue Password: hue

Dependências

Para a realização deste desafio foi utilizado o repositório:

https://github.com/mrugankray/Big-Data-Cluster

About

Investigating the correlation between weather conditions and aviation accidents to address safety concerns during air travel. Utilizing meteorological data from the Brazilian National Institute of Meteorology for evidence-based insights.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors