跳到主要内容

基于视频监控识别的家庭AI智能中枢 - 项目待办事项

AIGC by Qwen-3- hexianglong

🔴 P0 - 最高优先级(基础设施 & 核心文档)

1. 完善技术架构文档

负责人: @hexianglong(技术负责人) 协助: @Archeroy 预估时长: 8-10小时(分散在1-2周内完成) 预计完成: 2026-04-23

任务详情:

  • 编写完整的系统架构图(包含所有组件及其关系)
  • 明确各组件的职责边界和接口定义
  • 编写数据流图(从摄像头到时间线生成的完整流程)
  • 编写部署架构图(单机/多设备方案)
  • 完成技术选型文档(为什么选择这些技术栈)

产出物:

  • 技术架构&开发文档/系统架构设计.md
  • 技术架构&开发文档/技术选型说明.md

2. Genapsed 组件详细设计文档

负责人: @Archeroy 协助: @hexianglong 预估时长: 6-8小时(分散在1-2周内完成) 预计完成: 2026-04-23

任务详情:

  • 完善 Genapsed 的类图/模块设计
  • 编写 MQTT 通讯协议的详细实现规范
  • 设计插件管理系统(安装、更新、卸载、版本控制)
  • 设计权限管理系统的实现方案
  • 设计日志系统的实现方案
  • 编写异常处理和错误恢复机制设计

产出物:

  • 技术架构&开发文档/Genapsed详细设计.md
  • 技术架构&开发文档/MQTT通讯协议规范.md

3. Frigate NVR 集成方案文档

负责人: @CainiaovH 协助: 待定 预估时长: 4-6小时(分散在1周内完成) 预计完成: 2026-04-20

任务详情:

  • 研究 Frigate NVR 的 API 和配置方式
  • 编写 Frigate 与系统集成的方案
  • 设计摄像头管理模块
  • 设计录像存储和回放方案
  • 编写 Frigate 事件捕获和转发机制

产出物:

  • 技术架构&开发文档/开发文档/Frigate集成方案.md

🟡 P1 - 高优先级(核心组件设计)

4. MiniLVM 事件生成模块详细设计

负责人: @Tetoisnothuman 协助: @hexianglong 预估时长: 6-8小时(分散在1-2周内完成) 预计完成: 2026-04-27

任务详情:

  • 研究 Qwen3-VL 模型的使用方式和 API
  • 设计画面采样策略(频率、时机)
  • 设计 Prompt 工程方案(如何引导模型生成有效描述)
  • 设计事件去重和合并逻辑
  • 设计时间线索引结构
  • 编写性能优化方案(如何在家庭设备上高效运行)

产出物:

  • 技术架构&开发文档/开发文档/MiniLVM详细设计.md
  • 技术架构&开发文档/Prompt设计方案.md

5. 时间线存储 & 查询模块设计

负责人: @hexianglong 协助: @Tetoisnothuman 预估时长: 5-7小时(分散在1周内完成) 预计完成: 2026-04-30

任务详情:

  • 设计时间线数据结构(JSON Schema)
  • 选择并设计数据库方案(SQLite/其他轻量级方案)
  • 设计时间线索引策略(时间、事件类型、位置等)
  • 设计自然语言查询接口方案(如何对接 LLM)
  • 设计数据备份和迁移方案

产出物:

  • 技术架构&开发文档/时间线存储设计.md
  • 技术架构&开发文档/查询接口设计.md

6. LLM 查询引擎设计

负责人: @Tetoisnothuman 协助: 待定 预估时长: 5-6小时(分散在1周内完成) 预计完成: 2026-05-04

任务详情:

  • 设计 LLM 对接方案(DeepSeek API 使用方式)
  • 编写 Prompt 模板设计(如何提问时间线数据)
  • 设计上下文管理策略(对话历史、时间范围)
  • 设计视频片段精准定位和返回机制
  • 编写查询优化方案(减少不必要的 API 调用)

产出物:

  • 技术架构&开发文档/LLM查询引擎设计.md

7. 插件系统架构设计

负责人: @Archeroy 协助: @CainiaovH 预估时长: 6-8小时(分散在1-2周内完成) 预计完成: 2026-05-04

任务详情:

  • 设计插件接口规范(Plugin API)
  • 设计插件生命周期管理
  • 设计插件配置管理
  • 编写插件开发指南和示例
  • 设计插件安全沙箱方案
  • 设计插件市场/分发机制(长期规划)

产出物:

  • 技术架构&开发文档/插件系统架构.md
  • 技术架构&开发文档/插件开发指南.md

🟢 P2 - 中优先级(系统完善 & 开发准备)

8. 开发环境 & 工具链准备

负责人: @CainiaovH 协助: 全员 预估时长: 3-4小时(分散在3-5天内完成) 预计完成: 2026-04-16

任务详情:

  • 搭建 Git 工作流规范(分支策略、Commit 规范)
  • 配置 CI/CD 基础流程(自动化测试、代码检查)
  • 准备开发环境配置文档(Python 版本、依赖管理)
  • 配置代码格式化工具(Black/Ruff)
  • 准备调试和日志查看工具

产出物:

  • 开发环境配置指南.md
  • Git工作流规范.md

9. 项目管理系统搭建

负责人: @Archeroy 协助: 全员 预估时长: 2-3小时(1-2天内完成) 预计完成: 2026-04-11

任务详情:

  • 搭建 Issue 追踪系统(GitLab Issues 或飞书)
  • 创建项目看板(待办/进行中/审核/完成)
  • 制定每周同步会议模板
  • 设置文档评审流程

产出物:

  • 项目管理/项目管理规范.md

10. 核心组件原型开发(Vibe Coding)

负责人: 全员分工协作 预估时长: 15-20小时(分散在2-3周内完成) 预计完成: 2026-05-18

任务详情:

10.1 Genapsed 核心框架

负责人: @Archeroy @hexianglong时长: 6-8小时

  • 实现基础 Daemon 框架
  • 实现 MQTT Broker 连接和管理
  • 实现消息路由和转发逻辑
  • 实现基础的日志系统
  • 实现配置加载

10.2 Frigate 集成适配层

负责人: @CainiaovH时长: 4-5小时

  • 实现 Frigate API 客户端
  • 实现事件捕获和转发
  • 实现摄像头状态监控

10.3 MiniLVM 原型

负责人: @Tetoisnothuman时长: 5-7小时

  • 实现 Qwen3-VL 模型调用
  • 实现画面采样和预处理
  • 实现基础的事件描述生成
  • 测试不同 Prompt 的效果

产出物:

  • src/genapsed/ 核心代码
  • src/frigate_adapter/ 适配代码
  • src/minilvm/ 原型代码

11. 时间线存储实现

负责人: @hexianglong 协助: @Tetoisnothuman 预估时长: 4-5小时(分散在1周内完成) 预计完成: 2026-05-25

任务详情:

  • 实现数据库初始化和迁移
  • 实现时间线数据写入
  • 实现基础查询接口
  • 实现数据索引优化

产出物:

  • src/timeline/ 代码

12. LLM 查询接口实现

负责人: @Tetoisnothuman 预估时长: 4-5小时(分散在1周内完成) 预计完成: 2026-05-28

任务详情:

  • 实现 DeepSeek API 调用封装
  • 实现 Prompt 组装逻辑
  • 实现查询结果解析
  • 实现视频片段定位和返回

产出物:

  • src/llm_query/ 代码

🔵 P3 - 低优先级(长期规划 & 扩展功能)

13. 系统测试 & 优化

负责人: 全员 预估时长: 10-15小时(分散在2-3周内完成) 预计完成: 2026-06-15

任务详情:

  • 编写单元测试
  • 编写集成测试
  • 性能测试和优化
  • 稳定性测试(长时间运行)
  • 编写测试报告

14. 用户界面设计

负责人: 待定(可能需要招募有前端经验的同学) 预估时长: 10-15小时(分散在2-3周内完成) 预计完成: 2026-06-30

任务详情:

  • 设计 Web UI 原型
  • 实现时间线浏览界面
  • 实现自然语言查询界面
  • 实现视频回放界面
  • 实现系统配置界面

15. 插件生态建设

负责人: @Archeroy 预估时长: 8-10小时(长期任务) 预计完成: 2026-07-15

任务详情:

  • 开发示例插件(老人看护、活动分析等)
  • 编写插件开发文档
  • 建立插件测试框架
  • 设计插件分发机制

16. 文档完善 & 项目展示

负责人: 全员 预估时长: 6-8小时(分散在1-2周内完成) 预计完成: 2026-06-20

任务详情:

  • 完善用户文档
  • 编写安装指南
  • 编写使用教程
  • 制作项目展示材料(PPT/视频)
  • 准备比赛申报材料(如适用)

📊 任务分配总览

成员主要负责人任务协助任务总预估时长
@hexianglong1, 5, 112, 4~25-30小时
@Archeroy2, 7, 91, 10.1~20-25小时
@CainiaovH3, 8, 10.27~15-20小时
@Tetoisnothuman4, 6, 10.3, 125, 11~25-30小时

注意: 以上时长为预估,实际执行时可根据团队进度调整。建议每周投入 3-5 小时,保持稳定的开发节奏。

📅 建议里程碑

里程碑目标建议日期
M1: 文档完成所有 P0、P1 文档完成2026-05-04
M2: 原型可用核心组件原型完成2026-05-18
M3: 基础功能时间线生成和查询功能可用2026-05-28
M4: 系统测试核心功能测试通过2026-06-15
M5: 项目展示准备完成项目展示材料2026-06-30

💡 开发建议

  1. 文档先行: 每次开发前先写好设计文档,团队评审通过后再编码
  2. 小步快跑: 每个功能点拆小,完成即提交,避免大合并
  3. 定期同步: 每周安排 1 次简短的同步会议(30-45分钟)
  4. 充分利用 AI: 使用 Vibe Coding 方式,借助 AI 工具快速原型
  5. 保持弹性: 考试期间可以减少或暂停开发,考后继续
  6. 记录决策: 重要的技术决策记录下来,便于后续回顾

🔄 更新记录

日期更新内容更新人
2026-04-09初始版本,创建待办事项-