QAgent 🚀

Pipeline multi-stage com agentes especializados e roteamento condicional para análise de QA, geração de testes e aprendizado contínuo em repositórios automatizados.

Visão Geral

O QAgent é um pipeline multi-stage que coordena agentes de IA especializados para garantir qualidade e extrair inteligência dos ciclos de pull request. Cada etapa do pipeline produz um artefato estruturado que alimenta a etapa seguinte, com handoffs explícitos e contratos tipados via Pydantic.

Agente / Componente	Descrição
QA Agent	Analisa mudanças de código a partir do diff, identificando riscos, tipo de mudança e sugerindo cenários de testes.
TokenBudgetPlanner	Etapa determinística que escolhe `skip`, `standard` ou `cooperative`, define nível de contexto e registra a política aplicada.
High Risk Strategy Agent	Agente especializado acionado seletivamente quando o risco é classificado como HIGH. Enriquece a estratégia de testes via LLM.
Test Generator Agent	Gera código real de testes automatizados com base na análise e estratégia, submetendo PRs automáticos no repositório alvo.
Memory Agent	Extrai lições aprendidas de comentários de Code Review e as persiste em banco vetorial (LanceDB) para futuras gerações.

📚 Documentação detalhada: Sistema de Memórias & Code Review — como o QAgent captura lições de PRs e as reutiliza via busca vetorial.

Arquitetura Atual

O QAgent utiliza uma arquitetura multi-stage com contratos estruturados entre etapas, roteamento condicional por nível de risco e um orquestrador explícito que coordena o pipeline para cada arquivo analisado.

Princípios

Contratos tipados — cada etapa produz e consome schemas Pydantic (ContextResult, ReviewResult, TestStrategyResult, FileAnalysisArtifact)
Handoffs explícitos — os dados fluem por artefatos estruturados, sem estado implícito
Roteamento condicional — o nível de risco determina qual política de estratégia é aplicada e se o agente HIGH risk é acionado
Orçamento de tokens — antes das chamadas LLM, o TokenBudgetPlanner define fluxo, contexto e uso de memória por arquivo
Fallback determinístico — regras de decisão são determinísticas; o LLM é acionado apenas onde agrega valor (enriquecimento HIGH risk)
Observabilidade — cada etapa registra duração, execução/skip e políticas aplicadas no próprio artefato

Fluxo do Pipeline

flowchart TD
    subgraph TRIGGER ["🔔 Trigger"]
        PUSH["Push / PR no Repo Alvo"]
    end

    subgraph ANALYSIS ["🔍 Pipeline de Análise (por arquivo)"]
        DIFF["Extrai diff dos<br/>arquivos alterados"]
        BUDGET["TokenBudgetPlan<br/><i>skip · standard · cooperative</i>"]
        CTX["ContextResult<br/><i>adaptativo por orçamento</i>"]
        QA["🤖 QA Agent<br/><i>CrewAI · Groq LLM</i>"]
        SKIP["Review determinístico<br/><i>sem LLM</i>"]
        RR["ReviewResult<br/><i>findings · summary · test_needs</i>"]

        EVAL["artifact_evaluator<br/><i>classifica risco</i>"]
        RISK{{"Nível de Risco"}}
        STRAT_LOW["Estratégia LOW"]
        STRAT_MED["Estratégia MEDIUM"]
        STRAT_HIGH["Estratégia HIGH"]

        HR_AGENT["🔬 High Risk Strategy Agent<br/><i>enriquecimento via LLM</i>"]
        TSR["TestStrategyResult"]
        EVAL_FINAL["artifact_evaluator<br/><i>avaliação final</i>"]
        ARTIFACT["📦 FileAnalysisArtifact"]
    end

    subgraph TESTGEN ["🧪 Geração de Testes"]
        TEST_AGENT["🤖 Test Generator Agent<br/><i>CrewAI · Groq LLM</i>"]
        CODE["📝 Código de testes"]
        PR_OPEN["🚀 Branch + PR automático"]
    end

    subgraph EXPORT ["📊 Exportação"]
        JSON["artifacts.json"]
        SUMMARY["run_summary.json"]
    end

    subgraph MEM_FLOW ["💾 Memória"]
        MEM_AGENT["🤖 Memory Agent"]
        LANCEDB[("🗄️ LanceDB")]
    end

    PUSH --> DIFF --> BUDGET
    BUDGET -->|skip| SKIP --> RR
    BUDGET -->|standard/cooperative| CTX --> QA --> RR
    RR --> EVAL --> RISK
    RISK -->|LOW| STRAT_LOW --> TSR
    RISK -->|MEDIUM| STRAT_MED --> TSR
    RISK -->|HIGH| STRAT_HIGH --> HR_AGENT --> TSR
    TSR --> EVAL_FINAL --> ARTIFACT

    ARTIFACT --> TEST_AGENT --> CODE --> PR_OPEN
    ARTIFACT --> JSON
    ARTIFACT --> SUMMARY

    PR_OPEN -.->|"comentário em PR"| MEM_AGENT --> LANCEDB
    LANCEDB -.->|"lições via RAG"| TEST_AGENT

Componentes Principais

Componente	Localização	Responsabilidade
AnalysisOrchestrator	`src/services/analysis_orchestrator.py`	Coordena o pipeline pós-QA review para um arquivo: avaliação de risco → estratégia → enriquecimento HIGH risk → avaliação final.
FileAnalysisArtifact	`src/schemas/file_analysis_artifact.py`	Artefato consolidado que carrega todos os dados de uma análise (review, estratégia, risco, observabilidade).
TokenBudgetPlanner	`src/services/token_budget_planner.py`	Calcula `TokenBudgetPlan`, reduz análise cooperativa em mudanças pequenas, compacta arquivos grandes e limita contexto/memória.
artifact_evaluator	`src/services/artifact_evaluator.py`	Avalia o artefato e preenche campos de orquestração (risk_level, review_quality, test_generation_recommendation) com regras determinísticas.
test_strategy_builder	`src/services/test_strategy_builder.py`	Constrói a estratégia de testes com políticas adaptativas por nível de risco (LOW/MEDIUM/HIGH).
HighRiskTestStrategyRunner	`src/crew/high_risk_strategy_crew.py`	Agente LLM especializado que refina a estratégia de testes para arquivos HIGH risk. Inclui fallback seguro para a estratégia base.
artifact_exporter	`src/services/artifact_exporter.py`	Exporta artefatos estruturados para JSON e gera resumo da execução.
RepoContextBuilder	`src/services/context_builder.py`	Extrai contexto do repositório (estrutura, dependências, convenções) para alimentar os agentes.

Stack

Componente	Tecnologia
Linguagem	Python
Orquestração de Agentes	CrewAI
LLM Provider	Groq (configurável via variáveis de ambiente)
Banco Vetorial	LanceDB
Embeddings	sentence-transformers
CI/CD	GitHub Actions

Estrutura do Projeto

qagent/
├─ docs/                      # Documentações técnicas
├─ data/lancedb/              # Banco vetorial versionado com memórias iniciais do MVP
├─ src/
│  ├─ agent/                  # Perfis dos Agentes (Role, Goal, Backstory)
│  ├─ crew/                   # Runners CrewAI (QA, TestGen, HighRisk, Memory)
│  ├─ config/                 # Settings e LLM
│  ├─ prompts/                # Prompts de sistema
│  ├─ schemas/                # Contratos estruturados (Pydantic)
│  │  ├─ file_analysis_artifact.py
│  │  ├─ token_budget.py
│  │  ├─ context_result.py
│  │  ├─ review_result.py
│  │  └─ test_strategy_result.py
│  ├─ services/               # Lógica de negócio e orquestração
│  │  ├─ analysis_orchestrator.py
│  │  ├─ artifact_evaluator.py
│  │  ├─ artifact_exporter.py
│  │  ├─ context_builder.py
│  │  ├─ token_budget_planner.py
│  │  └─ test_strategy_builder.py
│  ├─ tools/                  # Ferramentas customizadas (Memory, Repo)
│  ├─ utils/                  # Git, formatação, PR utils
│  ├─ main.py                 # Entrypoint — Análise de QA
│  └─ main_test_generator.py  # Entrypoint — Geração de Testes
├─ tests/                     # Testes unitários do QAgent
├─ templates/                 # Exemplos de GitHub Actions
└─ requirements.txt

Como Instalar

Versões suportadas: Python 3.11 ou 3.12. As dependências principais do stack de agentes ainda não declaram suporte a Python 3.14.

# 1. Crie e ative um ambiente virtual
python -m venv .venv
# Windows
.\.venv\Scripts\Activate.ps1
# Linux / macOS
source .venv/bin/activate

# 2. Instale as dependências
pip install -r requirements.txt

# 3. Configure as variáveis de ambiente
cp .env.example .env
# Edite .env e defina GROQ_API_KEY, LLM_MODEL, etc.

Como Usar Localmente

Agente de QA (Analisador de Diff)

python -m src.main \
    --repo-path ./meu-repo \
    --base-sha COMMIT_A \
    --head-sha COMMIT_B \
    --output-file review.md

Análise cooperativa experimental

O fluxo padrão continua usando um QA Agent único e o AnalysisOrchestrator determinístico. Para experimentar uma Crew hierárquica com gerente coordenando especialistas, use:

python -m src.main \
    --repo-path ./meu-repo \
    --base-sha COMMIT_A \
    --head-sha COMMIT_B \
    --output-file review.md \
    --cooperative-analysis

Nesse modo, um gerente coordena agentes de QA, estratégia de testes e crítica. O TokenBudgetPlanner pode reduzir automaticamente mudanças pequenas para o fluxo padrão, ou pular análise LLM para arquivos triviais. Se a execução cooperativa falhar, o QAgent volta automaticamente para o QA Agent padrão e registra o fallback no artefato.

Observabilidade do fluxo escolhido

Cada arquivo analisado recebe um token_budget_plan em artifacts.json, com analysis_mode, context_level, include_full_file, include_memory, max_context_chars e reason. O run_summary.json também inclui analysis_flow_distribution e context_level_distribution, permitindo ver rapidamente quantos arquivos usaram skip, standard ou cooperative.

Agente Gerador de Testes

python -m src.main_test_generator --repo-path ./meu-repo

Status do Projeto

Em desenvolvimento ativo. A arquitetura evolui de forma incremental, priorizando mudanças pequenas e seguras. O pipeline atualmente conta com:

Orquestração explícita por arquivo via AnalysisOrchestrator
Contratos estruturados entre todas as etapas
Roteamento condicional com políticas adaptativas por risco
Token Saver Flow determinístico antes das chamadas LLM
Agente especializado para cenários de alto risco
Observabilidade integrada (duração, steps, políticas)
Exportação de artefatos para JSON

O sistema mantém fallbacks determinísticos e regras de decisão explícitas. A intervenção humana é esperada na revisão dos PRs gerados.

Name		Name	Last commit message	Last commit date
Latest commit History 194 Commits
.agents/rules		.agents/rules
.github		.github
.pytest_tmp/test_cooperative_runner_uses_h0/src		.pytest_tmp/test_cooperative_runner_uses_h0/src
data/lancedb/memories.lance		data/lancedb/memories.lance
docs		docs
examples		examples
scripts		scripts
site		site
src		src
templates		templates
tests		tests
.env.example		.env.example
.gitignore		.gitignore
0_qa-review.txt		0_qa-review.txt
AGENTS.md		AGENTS.md
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
README.md		README.md
pytest.ini		pytest.ini
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

QAgent 🚀

Visão Geral

Arquitetura Atual

Princípios

Fluxo do Pipeline

Componentes Principais

Stack

Estrutura do Projeto

Como Instalar

Como Usar Localmente

Agente de QA (Analisador de Diff)

Análise cooperativa experimental

Observabilidade do fluxo escolhido

Agente Gerador de Testes

Status do Projeto

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

QAgent 🚀

Visão Geral

Arquitetura Atual

Princípios

Fluxo do Pipeline

Componentes Principais

Stack

Estrutura do Projeto

Como Instalar

Como Usar Localmente

Agente de QA (Analisador de Diff)

Análise cooperativa experimental

Observabilidade do fluxo escolhido

Agente Gerador de Testes

Status do Projeto

About

Resources

License

Contributing

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages