l17728
diff --git a/‎docs/REPORT_DASHBOARD_DESIGN.md‎
Lines changed: 32 additions & 31 deletions b/‎docs/REPORT_DASHBOARD_DESIGN.md‎
Lines changed: 32 additions & 31 deletions
diff --git a/‎tools/reportgen/README.md‎
Lines changed: 54 additions & 5 deletions b/‎tools/reportgen/README.md‎
Lines changed: 54 additions & 5 deletions
diff --git a/‎tools/reportgen/generator.go‎
Lines changed: 19 additions & 0 deletions b/‎tools/reportgen/generator.go‎
Lines changed: 19 additions & 0 deletions
diff --git a/‎tools/reportgen/queries_phase6.go‎
Lines changed: 18 additions & 10 deletions b/‎tools/reportgen/queries_phase6.go‎
Lines changed: 18 additions & 10 deletions
@@ -1,7 +1,7 @@
 # PairProxy 分析报告大屏设计文档
 
-> 版本: v1.0 | 日期: 2026-04-04
-> 状态: 设计阶段
+> 版本: v1.0 | 日期: 2026-04-04  
+> 状态: 已完成 (v2.25.0)
 
 ---
 
@@ -682,35 +682,36 @@ func percentile(sorted []int64, p float64) int64 {
 
 ## 八、实现优先级与路线图
 
-### Phase 1：核心报告（MVP）
-
-- [ ] CLI 框架 + 数据库连接
-- [ ] 核心聚合查询（15 个基础查询）
-- [ ] HTML 模板（ECharts 嵌入）
-- [ ] KPI 数字卡片 + 环比变化
-- [ ] 趋势图（Token、费用、请求量）
-- [ ] TOP10 用户横向柱状图
-- [ ] 模型分布饼图
-- [ ] 基础文字洞察（环比、TOP贡献者）
-
-### Phase 2：深度分析
-
-- [ ] 箱线图（延迟分布、Token 分布）
-- [ ] 热力图（24h × 7天 请求密度）
-- [ ] 直方图（用户频次、I/O 比率）
-- [ ] 散点图（Input vs Output）
-- [ ] 帕累托图
-- [ ] 雷达图（模型多维度对比）
-- [ ] 留存曲线
-- [ ] 异常检测算法
-
-### Phase 3：智能洞察
-
-- [ ] 成本预测（线性外推）
-- [ ] 模型替代建议（高价→低价）
-- [ ] 配额耗尽预测
-- [ ] 用户参与度评分
-- [ ] Prompt 效率建议
+### Phase 1：核心报告（MVP）✅
+
+- [x] CLI 框架 + 数据库连接
+- [x] 核心聚合查询（15 个基础查询）
+- [x] HTML 模板（ECharts 嵌入）
+- [x] KPI 数字卡片 + 环比变化
+- [x] 趋势图（Token、费用、请求量）
+- [x] TOP10 用户横向柱状图
+- [x] 模型分布饼图
+- [x] 基础文字洞察（环比、TOP贡献者）
+
+### Phase 2：深度分析 ✅
+
+- [x] 箱线图（延迟分布、Token 分布）
+- [x] 热力图（24h × 7天 请求密度）
+- [x] 直方图（用户频次、I/O 比率）
+- [x] 散点图（Input vs Output）
+- [x] 帕累托图
+- [x] 雷达图（模型多维度对比）
+- [x] 留存曲线
+- [x] 异常检测算法
+
+### Phase 3：智能洞察 ✅
+
+- [x] 成本预测（线性外推）
+- [x] 模型替代建议（高价→低价）
+- [x] 配额耗尽预测
+- [x] 用户参与度评分
+- [x] Prompt 效率建议
+- [x] LLM 深度分析（Anthropic/OpenAI，AES-GCM Key 解密，自动降级重试）
 
 ---
 
 
@@ -4,8 +4,8 @@
 
 reportgen 是 PairProxy 的可视化分析报告生成工具，能够从 SQLite 数据库中提取使用数据，生成交互式 HTML 报告。报告包含 16+ 个可视化卡片，覆盖用户、运维和管理三个视角的分析需求。
 
-**最新版本**: v2.24.0  
-**发布日期**: 2026-04-04
+**最新版本**: v2.26.0  
+**发布日期**: 2026-04-07
 
 ---
 
@@ -231,6 +231,44 @@ CREATE TABLE usage_logs (
 
 ---
 
+## LLM 智能洞察
+
+除规则洞察外，reportgen 支持调用上游 LLM（Anthropic 或 OpenAI）对完整报告数据进行深度分析，生成三视角（使用者/运维/管理者）的中文洞察报告。
+
+### 启用条件
+
+1. **数据库中存在活跃 LLM 目标**：`llm_targets` 表需有 `is_active=1` 且 `provider` 为 `anthropic` 或 `openai` 的行，并关联有效的 `api_keys` 记录。
+2. **设置环境变量**：API Key 在数据库中以 AES-GCM 加密存储，解密需提供密钥加密密钥：
+
+```bash
+export KEY_ENCRYPTION_KEY="your-key-encryption-key"
+./reportgen -db pairproxy.db -from 2026-04-01 -to 2026-04-07
+```
+
+### 工作原理
+
+- reportgen 读取第一个活跃的 LLM 目标，解密 API Key。
+- 将完整报告 JSON 发送给 LLM，要求其从三个视角各给出 3~5 条洞察。
+- 若报告 JSON 超出 LLM 上下文窗口，自动去除 `error_requests`、`slow_requests`、`io_scatter_plot`、`retention_data` 等大数组后重试。
+- 洞察以纯文本形式附加到报告末尾的"🤖 AI 智能洞察"面板。
+
+### 模型选择
+
+| Provider | 使用模型 | 说明 |
+|---|---|---|
+| Anthropic | `claude-haiku-4-5-20251001` | 速度快、成本低，适合分析任务 |
+| OpenAI | `gpt-4o-mini` | 成本较低的替代方案 |
+
+### 跳过 LLM 洞察
+
+若不需要 LLM 洞察，不设置 `KEY_ENCRYPTION_KEY` 环境变量即可。reportgen 会在 stderr 打印提示并继续生成规则洞察：
+
+```
+⚠️  LLM insights skipped: KEY_ENCRYPTION_KEY env var not set; skipping LLM insights
+```
+
+---
+
 ## 进阶使用
 
 ### 构建自定义模板
@@ -442,9 +480,10 @@ tools/reportgen/
 ├── queries.go           # Phase 1-2 查询 (基础 + 延迟)
 ├── queries_phase3.go    # Phase 3 查询 (留存 + 成本)
 ├── queries_phase4.go    # Phase 4 查询 (趋势 + 配额)
-├── queries_phase6.go    # Phase 6 查询 (雷达 + 采用率)
+├── queries_phase6.go    # Phase 6 查询 (雷达 + 采用率 + 请求统计)
 ├── types.go             # 数据结构定义
-├── insights.go          # 洞察计算 (分层、Pareto等)
+├── insights.go          # 规则洞察计算 (分层、Pareto等)
+├── insights_llm.go      # LLM 智能洞察 (Anthropic/OpenAI)
 ├── templates/
 │   └── report.html      # HTML 模板
 ├── cmd/test_db/
@@ -510,6 +549,16 @@ A: 当前报告是全局视角。扩展功能可参考"开发和扩展"章节。
 
 ## 变更日志
 
+### v2.26.0 (2026-04-07)
+- ✨ 新增模型每日用量堆叠面积图（按模型×日期）
+- ✨ 新增峰值 RPM KPI 卡片
+- ✨ 全部设计文档特性补全，16 类图表 100% 实现
+
+### v2.25.0 (2026-04-07)
+- ✨ 新增 LLM 智能洞察 (Anthropic/OpenAI 双提供商，AES-GCM API Key 解密，上下文超限自动重试)
+- ✨ Phase 7: 用户请求次数箱线图统计
+- 📝 更新使用手册，补充 LLM 洞察配置说明
+
 ### v2.24.0 (2026-04-04)
 - ✨ 补充 6 阶段可视化覆盖 (从 52% → 90%)
 - ✨ 新增 Pareto 分析、用户分层、采用率等高级分析
@@ -529,4 +578,4 @@ A: 当前报告是全局视角。扩展功能可参考"开发和扩展"章节。
 
 ---
 
-**文档版本**: v2.24.0 | **最后更新**: 2026-04-04
+**文档版本**: v2.26.0 | **最后更新**: 2026-04-07
@@ -78,6 +78,25 @@ func GenerateReport(params QueryParams, templatePath, outputPath string) error {
 	// Phase 7: Request-count analytics
 	data.UserRequestBoxPlot, _ = q.QueryUserRequestBoxPlot(params.From, params.To)
 
+	// Phase 8: Missing/partial features
+	data.LatencyHistogram, _ = q.QueryLatencyHistogram(params.From, params.To)
+	data.LatencyScatter, _ = q.QueryLatencyScatter(params.From, params.To, 1000)
+	data.TokenThroughputHeatmap, _ = q.QueryTokenThroughputHeatmap(params.From, params.To)
+	data.UpstreamShare, _ = q.QueryUpstreamShare(params.From, params.To)
+	data.UpstreamLatencyTrend, _ = q.QueryUpstreamLatencyTrend(params.From, params.To)
+	data.CostPerTokenTrend, _ = q.QueryCostPerTokenTrend(params.From, params.To)
+	data.IORatioTrend, _ = q.QueryIORatioTrend(params.From, params.To)
+	data.ModelInputBoxPlots, _ = q.QueryModelTokenBoxPlots(params.From, params.To, "input_tokens")
+	data.ModelOutputBoxPlots, _ = q.QueryModelTokenBoxPlots(params.From, params.To, "output_tokens")
+	data.SourceNodeDist, _ = q.QuerySourceNodeDist(params.From, params.To)
+	data.StreamingBoxPlot, _ = q.QueryStreamingBoxPlot(params.From, params.To)
+	data.ModelDailyTrend, _ = q.QueryModelDailyTrend(params.From, params.To)
+	data.KPI.PeakRPM, _ = q.QueryPeakRPM(params.From, params.To)
+
+	// Phase 9: remaining gaps
+	data.UserTierDist, _ = q.QueryUserTierDist(params.From, params.To)
+	data.UserTokenPercentiles, _ = q.QueryUserTokenPercentiles(params.From, params.To)
+
 	// Generate rule-based insights
 	data.Insights = GenerateInsights(&data)
 
 
@@ -20,7 +20,8 @@ func (q *Querier) QueryModelRadarData(from, to time.Time) ([]ModelRadarData, err
 			COALESCE(AVG(duration_ms), 0) as avg_lat,
 			COALESCE(SUM(cost_usd), 0) as total_cost,
 			COALESCE(SUM(total_tokens), 0) as total_tokens,
-			SUM(CASE WHEN status_code NOT IN (200,201,204) THEN 1 ELSE 0 END) as errors
+			SUM(CASE WHEN status_code NOT IN (200,201,204) THEN 1 ELSE 0 END) as errors,
+			COUNT(DISTINCT user_id) as distinct_users
 		FROM usage_logs
 		WHERE created_at >= ? AND created_at < ?
 		GROUP BY model
@@ -31,25 +32,30 @@ func (q *Querier) QueryModelRadarData(from, to time.Time) ([]ModelRadarData, err
 	defer rows.Close()
 
 	type modelStats struct {
-		model       string
-		count       int64
-		avgLatency  float64
-		totalCost   float64
-		totalTokens int64
-		errors      int64
+		model         string
+		count         int64
+		avgLatency    float64
+		totalCost     float64
+		totalTokens   int64
+		errors        int64
+		distinctUsers int64
 	}
 	var stats []modelStats
 	var totalRequests int64
+	var totalUsers int64
 	var maxLatency float64
 	var minCostPerToken float64 = math.MaxFloat64
 
 	for rows.Next() {
 		var m modelStats
-		if err := rows.Scan(&m.model, &m.count, &m.avgLatency, &m.totalCost, &m.totalTokens, &m.errors); err != nil {
+		if err := rows.Scan(&m.model, &m.count, &m.avgLatency, &m.totalCost, &m.totalTokens, &m.errors, &m.distinctUsers); err != nil {
 			continue
 		}
 		stats = append(stats, m)
 		totalRequests += m.count
+		if m.distinctUsers > totalUsers {
+			totalUsers = m.distinctUsers
+		}
 
 		if m.avgLatency > maxLatency {
 			maxLatency = m.avgLatency
@@ -105,8 +111,10 @@ func (q *Querier) QueryModelRadarData(from, to time.Time) ([]ModelRadarData, err
 			rd.ReliabilityScore = math.Round((1 - errorRate) * 100 * 10) / 10
 		}
 
-		// 5. Adoption Score: same as throughput score (request volume percentage)
-		rd.AdoptionScore = rd.ThroughputScore
+		// 5. Adoption Score: distinct users using this model / max distinct users any model
+		if totalUsers > 0 {
+			rd.AdoptionScore = math.Round(float64(ms.distinctUsers) / float64(totalUsers) * 100 * 10) / 10
+		}
 
 		result = append(result, rd)
 	}