-
Notifications
You must be signed in to change notification settings - Fork 952
Open
Description
问题描述
在 gemini-3-pro-image-preview 下,图片任务可成功返回,但图内中文文本经常出现乱码/错字(例如“携程”相关词语被渲染成无意义字符)。
另外,前端偶发出现 生成失败: network error,但同一任务中通常已有部分页面成功生成,容易误判为整批失败。
运行环境
- 项目版本:当前主分支(2026-02-26 本地复现)
- 启动方式:
python backend/app.py - 图片服务商:
google_genai - 模型:
gemini-3-pro-image-preview - 代理:本地日志显示通过
127.0.0.1:1082出口
复现步骤
- 在
image_providers.yaml中设置:active_provider: geminiproviders.gemini.model: gemini-3-pro-image-preview
- 在前端发起多页图文生成(包含中文标题/副标题文案)。
- 观察结果图中文字。
实际结果
- 后端日志确认调用成功且模型为
gemini-3-pro-image-preview。 - 生成图内中文出现乱码/错字,影响可用性。
- 偶发前端显示
network error,但任务可能已部分成功(SSE 中断场景)。
期望结果
- 中文文本渲染可读、无乱码。
- SSE 中断时前端错误提示能区分“全部失败”与“部分成功”。
关键日志(节选)
Google GenAI 生成图片: model=gemini-3-pro-image-preview, aspect_ratio=3:4
HTTP Request: POST https://generativelanguage.googleapis.com/v1beta/models/gemini-3-pro-image-preview:streamGenerateContent?alt=sse "HTTP/1.1 200 OK"
✅ Google GenAI 图片生成成功: 419727 bytes
备注
我本地已尝试切换 gemini-2.5-flash-image,稳定性更好,但质量和风格偏好仍希望使用 3-preview。希望项目层面能提供:
- “无字底图 + 前端叠字”可选流程
- 或更严格的提示词与后处理策略,降低中文乱码概率
Reactions are currently unavailable
Metadata
Metadata
Assignees
Labels
No labels