选品部-图片去多余文字

LuTong cb1f0ef643 功能基 1 bulan lalu
src cb1f0ef643 功能基 1 bulan lalu
template cb1f0ef643 功能基 1 bulan lalu
README.md cb1f0ef643 功能基 1 bulan lalu
main.py cb1f0ef643 功能基 1 bulan lalu
requirements.txt cb1f0ef643 功能基 1 bulan lalu

README.md

选品部图片去文字

PyQt5 桌面客户端:选择 Excel 文件,对「商品图片」列(E 列,从第 3 行起)中的图片做去文字处理,并保存到指定目录。

功能

  • 选择文件:仅支持 .xlsx.xls;建议使用 .xlsx 以完整支持图片处理。
  • 文件路径:选择后显示所选文件全路径。
  • 保存路径:选择目录后在该行右侧显示;新文件保存为该目录下 原文件名_0000.xlsx,重复写入时序号递增(0001、0002…)。
  • 转化:点击后下方出现进度条,与处理过程同步;处理完成后弹出保存路径。

处理逻辑:

  1. 读取上传的 Excel(格式参考 template/raw_template.xlsx),定位 E 列从第 3 行开始的所有图片。
  2. 对每张图片做去文字(图中商品身上的文字尽量保留);当前使用 OpenCV 实现,大模型 Key 可从 D:\AllePro\upaibm_system 的配置读取,用于后续扩展 AI 去文字。
  3. 复制整份文档,用处理后的图片按原顺序替换原图(同一媒体文件在多处使用时会被统一替换)。
  4. 将新文档写入「保存路径」,文件名:原文件名_四位数字.xlsx,从 0000 起递增。

环境与运行

# 建议使用 Python 3.8+
pip install -r requirements.txt
python main.py

配置说明

  • 大模型 API Key 从项目 D:\AllePro\upaibm_system 读取:优先使用 claude-config.json 中第一个带 api_key 的 Provider,若无则尝试 common/app/schemas/vllm_model.py 中的 API_BASEAPI_KEY。当前去文字仍以 OpenCV 为主,该配置预留用于后续接入 AI 图像编辑接口。