Este projeto demonstra um fluxo completo de Engenharia e Análise de Dados: desde a estruturação do banco de dados (SQL Server), passando pela automação de inserção de dados via Python, até a geração de insights visuais com bibliotecas de Data Science.
- Database Setup: Criação de banco de dados e tabelas com restrições de integridade (
PRIMARY KEY). - Escrita Automatizada: Script Python para inserção de registros diretamente no SQL Server via
pyodbc. - Análise & Business Intelligence: Extração de dados via
Pandase geração de gráficos de barras comMatplotlib. - Tratamento de Dados: Padronização de strings para evitar duplicatas em categorias (Case Sensitivity).
- Python 3.13 (Ambiente Conda)
- SQL Server (T-SQL)
- Pandas: Manipulação e tratamento de DataFrames.
- Matplotlib: Plotagem de gráficos profissionais.
- Pyodbc: Conexão robusta entre Python e SQL.
Abaixo, a distribuição de SKUs (produtos) por categoria de cor, gerada automaticamente pelo script de análise:
Insight: O gráfico revela o predomínio de cores neutras (Preto, Branco e Prata) no inventário da Contoso, informação vital para decisões de compras e logística.
- Configurar o Banco: Execute o arquivo
setup_banco_e_tabelas.sqlno seu SQL Server Management Studio. - Instalar Dependências:
pip install -r requirements.txt
