手机导入的照片、各种截图、下载的网络图片、旅游照片……这些图片堆在一起,想整理却总是没时间?找张图要翻遍整个文件夹?
本次分享一套 基于本地 AI 模型的自动图片分类工具链,使用开源工具,完全离线运行,无需担心隐私与费用问题。系统可自动识别图片内容,并按“类型 + 内容”进行分类,助你快速构建整洁有序的图片库。
一、方案概览
✅ 核心功能
- AI 内容识别:大模型自动判断图片类型与具体内容
- 分类文件夹自动创建:自动建目录、分类归档
- 支持批量处理:可处理单张或整个文件夹
- 多种格式兼容:支持 PNG、JPG、GIF、BMP、TIFF、WebP、HEIC 等格式
- 纯本地运行:无联网需求,保障隐私与数据安全
- 自动重命名:避免文件重名覆盖
🧠 分类逻辑
系统采用二维分类法:
类型维度:
- 照片(生活照、人物照、风景照等)
- 截图(屏幕截屏、软件界面等)
- 票据(发票、收据、车票等)
- 文档(证件、扫描件等)
内容维度:
- 人物
- 风景
- 文本
- 物品
最终命名采用:类型_内容
,如 照片_人物
、截图_文本
、票据_表单
等。
🛠 技术架构
amo
:工作流调度与自动化工具ollama
:本地大模型运行平台qwen2.5-vl:7b
:阿里多模态模型,图像识别主力ImageMagick
:图片格式与尺寸处理JavaScript 工作流
:分类逻辑执行
二、环境搭建指南
1. 安装 amo
amo
是核心工作流调度器,负责串联所有组件。
安装参考:amo 安装与使用指南
2. 安装 ollama 与视觉模型
前往 ollama 官网 下载并安装。
拉取视觉识别模型:
ollama pull qwen2.5vl:7b
✅ 推荐配置:内存 ≥ 8GB。如配置有限可选更小模型。
3. 安装辅助工具
安装图片处理与模型调用组件:
amo tool install imagemagick
amo tool install llm-caller
4. 下载图片分类工作流脚本
amo workflow get https://github.com/nodewee/amo-workflows/blob/main/workflows/image-class.js
三、使用方法
🔹 单张图片分类
amo run image-class.js --input /path/to/image.jpg
# 指定输出目录
amo run image-class.js --input /path/to/image.jpg --output /path/to/organized
🔹 批量分类整个文件夹
amo run image-class.js --input /path/to/photos --output /path/to/organized
四、分类效果示例
处理完成后,文件夹结构如下:
organized/
├── 照片_人物/
│ ├── IMG_001.jpg
│ ├── IMG_005.jpg
├── 照片_风景/
│ ├── IMG_002.jpg
├── 截图_文本/
│ ├── screenshot_001.png
├── 票据_表单/
│ ├── receipt_001.jpg
│ └── invoice_001.pdf
五、适用场景
- 📷 个人照片整理:生活照、旅行照、人物照等快速分类,方便查找回忆。
- 🧾 工作资料归档:合同、票据、白板照片等自动分类,便于归档管理。
- 🎨 设计素材库构建:UI截图、产品图、logo、插画等自动分类,高效查找使用。
六、进阶用法:自定义分类规则
如默认分类不满足需求,可自定义模型提示词:
查看模板文件路径:
llm-caller template list
修改模板文件
ollama-image-class.json
中的prompt
字段,定义你自己的分类逻辑。
将持续分享自动化相关的工具、工作流以及智能体,欢迎关注/订阅「缓坡漫步」
推广:
阿里云百炼大模型 9折优惠 + 所有模型各百万免费Token →