手机导入的照片、各种截图、下载的网络图片、旅游照片……这些图片堆在一起,想整理却总是没时间?找张图要翻遍整个文件夹?

本次分享一套 基于本地 AI 模型的自动图片分类工具链,使用开源工具,完全离线运行,无需担心隐私与费用问题。系统可自动识别图片内容,并按“类型 + 内容”进行分类,助你快速构建整洁有序的图片库。


一、方案概览

✅ 核心功能

  • AI 内容识别:大模型自动判断图片类型与具体内容
  • 分类文件夹自动创建:自动建目录、分类归档
  • 支持批量处理:可处理单张或整个文件夹
  • 多种格式兼容:支持 PNG、JPG、GIF、BMP、TIFF、WebP、HEIC 等格式
  • 纯本地运行:无联网需求,保障隐私与数据安全
  • 自动重命名:避免文件重名覆盖

🧠 分类逻辑

系统采用二维分类法:

  • 类型维度

    • 照片(生活照、人物照、风景照等)
    • 截图(屏幕截屏、软件界面等)
    • 票据(发票、收据、车票等)
    • 文档(证件、扫描件等)
  • 内容维度

    • 人物
    • 风景
    • 文本
    • 物品

最终命名采用:类型_内容,如 照片_人物截图_文本票据_表单 等。

🛠 技术架构

  • amo:工作流调度与自动化工具
  • ollama:本地大模型运行平台
  • qwen2.5-vl:7b:阿里多模态模型,图像识别主力
  • ImageMagick:图片格式与尺寸处理
  • JavaScript 工作流:分类逻辑执行

二、环境搭建指南

1. 安装 amo

amo 是核心工作流调度器,负责串联所有组件。

安装参考:amo 安装与使用指南

2. 安装 ollama 与视觉模型

前往 ollama 官网 下载并安装。

拉取视觉识别模型:

ollama pull qwen2.5vl:7b

推荐配置:内存 ≥ 8GB。如配置有限可选更小模型。

3. 安装辅助工具

安装图片处理与模型调用组件:

amo tool install imagemagick
amo tool install llm-caller

4. 下载图片分类工作流脚本

amo workflow get https://github.com/nodewee/amo-workflows/blob/main/workflows/image-class.js

三、使用方法

🔹 单张图片分类

amo run image-class.js --input /path/to/image.jpg
# 指定输出目录
amo run image-class.js --input /path/to/image.jpg --output /path/to/organized

🔹 批量分类整个文件夹

amo run image-class.js --input /path/to/photos --output /path/to/organized

四、分类效果示例

处理完成后,文件夹结构如下:

organized/
├── 照片_人物/
│   ├── IMG_001.jpg
│   ├── IMG_005.jpg
├── 照片_风景/
│   ├── IMG_002.jpg
├── 截图_文本/
│   ├── screenshot_001.png
├── 票据_表单/
│   ├── receipt_001.jpg
│   └── invoice_001.pdf

五、适用场景

  • 📷 个人照片整理:生活照、旅行照、人物照等快速分类,方便查找回忆。
  • 🧾 工作资料归档:合同、票据、白板照片等自动分类,便于归档管理。
  • 🎨 设计素材库构建:UI截图、产品图、logo、插画等自动分类,高效查找使用。

六、进阶用法:自定义分类规则

如默认分类不满足需求,可自定义模型提示词:

  1. 查看模板文件路径:

    llm-caller template list
    
  2. 修改模板文件 ollama-image-class.json 中的 prompt 字段,定义你自己的分类逻辑。


将持续分享自动化相关的工具、工作流以及智能体,欢迎关注/订阅「缓坡漫步」


推广:
阿里云百炼大模型 9折优惠 + 所有模型各百万免费Token →
即梦 免费AI画图、生成视频。每日领免费额度,可累加 →