基于视频监控识别的家庭AI智能中枢 - 项目待办事项
AIGC by Qwen-3- hexianglong
🔴 P0 - 最高优先级(基础设施 & 核心文档)
1. 完善技术架构文档
负责人: @hexianglong(技术负责人) 协助: @Archeroy 预估时长: 8-10小时(分散在1-2周内完成) 预计完成: 2026-04-23
任务详情:
- 编写完整的系统架构图(包含所有组件及其关系)
- 明确各组件的职责边界和接口定义
- 编写数据流图(从摄像头到时间线生成的完整流程)
- 编写部署架构图(单机/多设备方案)
- 完成技术选型文档(为什么选择这些技术栈)
产出物:
技术架构&开发文档/系统架构设计.md技术架构&开发文档/技术选型说明.md
2. Genapsed 组件详细设计文档
负责人: @Archeroy 协助: @hexianglong 预估时长: 6-8小时(分散在1-2周内完成) 预计完成: 2026-04-23
任务详情:
- 完善 Genapsed 的类图/模块设计
- 编写 MQTT 通讯协议的详细实现规范
- 设计插件管理系统(安装、更新、卸载、版本控制)
- 设计权限管理系统的实现方案
- 设计日志系统的实现方案
- 编写异常处理和错误恢复机制设计
产出物:
技术架构&开发文档/Genapsed详细设计.md技术架构&开发文档/MQTT通讯协议规范.md
3. Frigate NVR 集成方案文档
负责人: @CainiaovH 协助: 待定 预估时长: 4-6小时(分散在1周内完成) 预计完成: 2026-04-20
任务详情:
- 研究 Frigate NVR 的 API 和配置方式
- 编写 Frigate 与系统集成的方案
- 设计摄像头管理模块
- 设计录像存储和回放方案
- 编写 Frigate 事件捕获和转发机制
产出物:
技术架构&开发文档/开发文档/Frigate集成方案.md
🟡 P1 - 高优先级(核心组件设计)
4. MiniLVM 事件生成模块详细设计
负责人: @Tetoisnothuman 协助: @hexianglong 预估时长: 6-8小时(分散在1-2周内完成) 预计完成: 2026-04-27
任务详情:
- 研究 Qwen3-VL 模型的使用方式和 API
- 设计画面采样策略(频率、时机)
- 设计 Prompt 工程方案(如何引导模型生成有效描述)
- 设计事件去重和合并逻辑
- 设计时间线索引结构
- 编写性能优化方案(如何在家庭设备上高效运行)
产出物:
技术架构&开发文档/开发文档/MiniLVM详细设计.md技术架构&开发文档/Prompt设计方案.md
5. 时间线存储 & 查询模块设计
负责人: @hexianglong 协助: @Tetoisnothuman 预估时长: 5-7小时(分散在1周内完成) 预计完成: 2026-04-30
任务详情:
- 设计时间线数据结构(JSON Schema)
- 选择并设计数据库方案(SQLite/其他轻量级方案)
- 设计时间线索引策略(时间、事件类型、位置等)
- 设计自然语言查询接口方案(如何对接 LLM)
- 设计数据备份和迁移方案
产出物:
技术架构&开发文档/时间线存储设计.md技术架构&开发文档/查询接口设计.md
6. LLM 查询引擎设计
负责人: @Tetoisnothuman 协助: 待定 预估时长: 5-6小时(分散在1周内完成) 预计完成: 2026-05-04
任务详情:
- 设计 LLM 对接方案(DeepSeek API 使用方式)
- 编写 Prompt 模板设计(如何提问时间线数据)
- 设计上下文管理策略(对话历史、时间范围)
- 设计视频片段精准定位和返回机制
- 编写查询优化方案(减少不必要的 API 调用)
产出物:
技术架构&开发文档/LLM查询引擎设计.md
7. 插件系统架构设计
负责人: @Archeroy 协助: @CainiaovH 预估时长: 6-8小时(分散在1-2周内完成) 预计完成: 2026-05-04
任务详情:
- 设计插件接口规范(Plugin API)
- 设计插件生命周期管理
- 设计插件配置管理
- 编写插件开发指南和示例
- 设计插件安全沙箱方案
- 设计插件市场/分发机制(长期规划)
产出物:
技术架构&开发文档/插件系统架构.md技术架构&开发文档/插件开发指南.md
🟢 P2 - 中优先级(系统完善 & 开发准备)
8. 开发环境 & 工具链准备
负责人: @CainiaovH 协助: 全员 预估时长: 3-4小时(分散在3-5天内完成) 预计完成: 2026-04-16
任务详情:
- 搭建 Git 工作流规范(分支策略、Commit 规范)
- 配置 CI/CD 基础流程(自动化测试、代码检查)
- 准备开发环境配置文档(Python 版本、依赖管理)
- 配置代码格式化工具(Black/Ruff)
- 准备调试和日志查看工具
产出物:
开发环境配置指南.mdGit工作流规范.md
9. 项目管理系统搭建
负责人: @Archeroy 协助: 全员 预估时长: 2-3小时(1-2天内完成) 预计完成: 2026-04-11
任务详情:
- 搭建 Issue 追踪系统(GitLab Issues 或飞书)
- 创建项目看板(待办/进行中/审核/完成)
- 制定每周同步会议模板
- 设置文档评审流程
产出物:
项目管理/项目管理规范.md
10. 核心组件原型开发(Vibe Coding)
负责人: 全员分工协作 预估时长: 15-20小时(分散在2-3周内完成) 预计完成: 2026-05-18
任务详情:
10.1 Genapsed 核心框架
负责人: @Archeroy @hexianglong时长: 6-8小时
- 实现基础 Daemon 框架
- 实现 MQTT Broker 连接和管理
- 实现消息路由和转发逻辑
- 实现基础的日志系统
- 实现配置加载
10.2 Frigate 集成适配层
负责人: @CainiaovH时长: 4-5小时
- 实现 Frigate API 客户端
- 实现事件捕获和转发
- 实现摄像头状态监控
10.3 MiniLVM 原型
负责人: @Tetoisnothuman时长: 5-7小时
- 实现 Qwen3-VL 模型调用
- 实现画面采样和预处理
- 实现基础的事件描述生成
- 测试不同 Prompt 的效果
产出物:
src/genapsed/核心代码src/frigate_adapter/适配代码src/minilvm/原型代码
11. 时间线存储实现
负责人: @hexianglong 协助: @Tetoisnothuman 预估时长: 4-5小时(分散在1周内完成) 预计完成: 2026-05-25
任务详情:
- 实现数据库初始化和迁移
- 实现时间线数据写入
- 实现基础查询接口
- 实现数据索引优化
产出物:
src/timeline/代码
12. LLM 查询接口实现
负责人: @Tetoisnothuman 预估时长: 4-5小时(分散在1周内完成) 预计完成: 2026-05-28
任务详情:
- 实现 DeepSeek API 调用封装
- 实现 Prompt 组装逻辑
- 实现查询结果解析
- 实现视频片段定位和返回
产出物:
src/llm_query/代码
🔵 P3 - 低优先级(长期规划 & 扩展功能)
13. 系统测试 & 优化
负责人: 全员 预估时长: 10-15小时(分散在2-3周内完成) 预计完成: 2026-06-15
任务详情:
- 编写单元测试
- 编写集成测试
- 性能测试和优化
- 稳定性测试(长时间运行)
- 编写测试报告
14. 用户界面设计
负责人: 待定(可能需要招募有前端经验的同学) 预估时长: 10-15小时(分散在2-3周内完成) 预计完成: 2026-06-30
任务详情:
- 设计 Web UI 原型
- 实现时间线浏览界面
- 实现自然语言查询界面
- 实现视频回放界面
- 实现系统配置界面
15. 插件生态建设
负责人: @Archeroy 预估时长: 8-10小时(长期任务) 预计完成: 2026-07-15
任务详情:
- 开发示例插件(老人看护、活动分析等)
- 编写插件开发文档
- 建立插件测试框架
- 设计插件分发机制
16. 文档完善 & 项目展示
负责人: 全员 预估时长: 6-8小时(分散在1-2周内完成) 预计完成: 2026-06-20
任务详情:
- 完善用户文档
- 编写安装指南
- 编写使用教程
- 制作项目展示材料(PPT/视频)
- 准备比赛申报材料(如适用)
📊 任务分配总览
| 成员 | 主要负责人任务 | 协助任务 | 总预估时长 |
|---|---|---|---|
| @hexianglong | 1, 5, 11 | 2, 4 | ~25-30小时 |
| @Archeroy | 2, 7, 9 | 1, 10.1 | ~20-25小时 |
| @CainiaovH | 3, 8, 10.2 | 7 | ~15-20小时 |
| @Tetoisnothuman | 4, 6, 10.3, 12 | 5, 11 | ~25-30小时 |
注意: 以上时长为预估,实际执行时可根据团队进度调整。建议每周投入 3-5 小时,保持稳定的开发节奏。
📅 建议里程碑
| 里程碑 | 目标 | 建议日期 |
|---|---|---|
| M1: 文档完成 | 所有 P0、P1 文档完成 | 2026-05-04 |
| M2: 原型可用 | 核心组件原型完成 | 2026-05-18 |
| M3: 基础功能 | 时间线生成和查询功能可用 | 2026-05-28 |
| M4: 系统测试 | 核心功能测试通过 | 2026-06-15 |
| M5: 项目展示 | 准备完成项目展示材料 | 2026-06-30 |
💡 开发建议
- 文档先行: 每次开发前先写好设计文档,团队评审通过后再编码
- 小步快跑: 每个功能点拆小,完成即提交,避免大合并
- 定期同步: 每周安排 1 次简短的同步会议(30-45分钟)
- 充分利用 AI: 使用 Vibe Coding 方式,借助 AI 工具快速原型
- 保持弹性: 考试期间可以减少或暂停开发,考后继续
- 记录决策: 重要的技术决策记录下来,便于后续回顾
🔄 更新记录
| 日期 | 更新内容 | 更新人 |
|---|---|---|
| 2026-04-09 | 初始版本,创建待办事项 | - |