Skip to content

Gemini 3-preview 生成图中文乱码(同时偶发 network error 误报) #62

@2shou-clone

Description

@2shou-clone

问题描述

gemini-3-pro-image-preview 下,图片任务可成功返回,但图内中文文本经常出现乱码/错字(例如“携程”相关词语被渲染成无意义字符)。

另外,前端偶发出现 生成失败: network error,但同一任务中通常已有部分页面成功生成,容易误判为整批失败。

运行环境

  • 项目版本:当前主分支(2026-02-26 本地复现)
  • 启动方式:python backend/app.py
  • 图片服务商:google_genai
  • 模型:gemini-3-pro-image-preview
  • 代理:本地日志显示通过 127.0.0.1:1082 出口

复现步骤

  1. image_providers.yaml 中设置:
    • active_provider: gemini
    • providers.gemini.model: gemini-3-pro-image-preview
  2. 在前端发起多页图文生成(包含中文标题/副标题文案)。
  3. 观察结果图中文字。

实际结果

  • 后端日志确认调用成功且模型为 gemini-3-pro-image-preview
  • 生成图内中文出现乱码/错字,影响可用性。
  • 偶发前端显示 network error,但任务可能已部分成功(SSE 中断场景)。

期望结果

  • 中文文本渲染可读、无乱码。
  • SSE 中断时前端错误提示能区分“全部失败”与“部分成功”。

关键日志(节选)

Google GenAI 生成图片: model=gemini-3-pro-image-preview, aspect_ratio=3:4
HTTP Request: POST https://generativelanguage.googleapis.com/v1beta/models/gemini-3-pro-image-preview:streamGenerateContent?alt=sse "HTTP/1.1 200 OK"
✅ Google GenAI 图片生成成功: 419727 bytes

备注

我本地已尝试切换 gemini-2.5-flash-image,稳定性更好,但质量和风格偏好仍希望使用 3-preview。希望项目层面能提供:

  • “无字底图 + 前端叠字”可选流程
  • 或更严格的提示词与后处理策略,降低中文乱码概率

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions