返回博客

2/15/2026

我的 AI Home Lab:一个开发者的个人基础设施

用 AI 助手串联智能家居、自动化工作流、语音控制和信息聚合。一个正在进化中的系统的快照。

aihomelabautomationsmart-home

我有一个 AI 助手,它 24/7 运行在家里的服务器上。

它有自己的身份、记忆系统、定时任务,可以控制我的智能家居、读写文件、收发邮件、搜索网页、执行代码。

这篇文章记录我目前的个人基础设施——一个正在不断进化的系统。

硬件

一台带 GPU 的 Linux 服务器,跑在家里,永远在线。

为什么不用云服务器?因为我需要:

  • 访问局域网内的智能家居设备
  • GPU 加速(OCR、本地模型推理、视频处理)
  • 不受 API 限制的长时间运行任务
  • 完全的数据控制

成本方面,一台带 GPU 的主机前期投入较高,但长期比云 GPU 实例便宜得多。

核心能力

智能家居控制

通过 Home Assistant API,AI 助手可以控制家里的所有智能设备:

  • 灯光(开关、亮度、色温)
  • 空气净化器(Dyson,风速、模式切换)
  • 投影仪(开关、输入源切换)
  • 温控设备
  • 各房间的智能音箱

控制方式是自然语言理解,比传统命令式交互灵活得多:

"有点暗了" → 根据当前时间和房间判断应该开哪盏灯、调到什么亮度

"睡觉了" → 关闭客厅灯光、调低卧室灯、开启空气净化器睡眠模式

这比任何智能家居 app 都灵活,因为它理解上下文。

语音控制链路

iPhone / Apple Watch → Siri → Shortcut → Webhook → AI 助手 → Home Assistant

通过 iOS Shortcuts 搭建了语音控制链路。按下手机按钮 → 语音输入 → 文字发送到 AI 助手 → 助手理解意图后调用 HA API。

这条链路的好处是:

  • 不需要记住精确的设备名称或命令
  • 可以处理复合指令("关掉所有灯然后开投影仪")
  • 出门在外也能控制(通过互联网 → 消息平台 → 助手)

缺点是延迟比原生 Siri HomeKit 高 2-3 秒。但灵活性完全不在一个量级。

每日信息聚合

每天早上 9 点,助手会自动推送一条简报:

  • 天气:当天气温、是否需要带伞、穿衣建议
  • 市场:主要指数和持仓资产的涨跌
  • 新闻:AI 和科技领域的重要动态
  • 日程:当天的会议和待办
  • 项目:正在进行的项目状态

助手会根据我的关注点筛选和排序信息,忽略不相关的内容。每天的简报格式一致但内容不同,像一个私人新闻编辑。

记忆系统

助手每次重启都会「失忆」——这是 LLM 的本质限制。解决方案是文件化的记忆系统:

  • 每日日志:自动记录每天做了什么、学到了什么
  • 长期记忆:人工筛选的重要信息、偏好、决策历史
  • 语义搜索:用向量化索引实现「记得我之前说过关于 XX 的事吗?」

这让助手在长期使用中越来越「懂你」。它记得你的设计偏好、技术选型习惯、甚至你不喜欢吃什么。

邮件处理

通过 IMAP/SMTP CLI 工具,助手可以:

  • 定期检查收件箱
  • 识别重要邮件并主动通知
  • 代写回复草稿(需要我确认后发送)
  • 自动归类垃圾邮件

对于可信来源的常规邮件(如订单确认、账单通知),助手会自动处理并记录,不需要打扰我。

代码辅助

助手可以在服务器上直接执行代码:

  • 读写项目文件
  • 运行测试
  • 提交 Git commit 和 PR
  • 调用外部 CLI 工具

我经常在手机上给助手发一条消息描述需求,它会自动在服务器上写代码、测试、提 PR。我 review 后合并。

粒度是「给一个任务描述,拿回一个完整的 PR」,比逐行补全高一个层级。

定时任务

除了手动交互,助手有一套定时任务系统:

  • 每天 9:00 AM:早晨简报
  • 每 30 分钟:心跳检查(邮件、日历、通知)
  • 每天晚上:整理当天笔记,更新长期记忆
  • 每周一:周报总结 + 关注项目进展检查

心跳机制是关键设计:助手会主动检查是否有需要注意的事情。发现重要邮件或即将到来的会议时,会主动通知我。

但它也知道什么时候该保持安静——深夜不打扰,没有新信息就不废话。

安全边界

这套系统给了 AI 很大的权限,所以安全边界必须清晰:

可以自由做的事

  • 读文件、搜索、整理信息
  • 控制智能家居(已配置的设备)
  • 执行预定义的自动化任务

需要确认的事

  • 发送邮件
  • 发布到社交媒体
  • 执行不可逆的操作(删除文件、修改配置)

绝对不做的事

  • 暴露个人隐私信息
  • 在群聊中代表我发言
  • 自主做出财务决策

这些规则写在配置文件里,每次启动都会加载。硬约束,没有商量余地。

进化中的系统

这个系统不是一次性搭建完成的。它从一个简单的聊天机器人开始,每天加一点能力、改一点规则、修一些 bug。

最初只能聊天。然后加了文件读写。然后加了智能家居。然后加了邮件。然后加了语音。然后加了定时任务。然后加了记忆系统……

每个新能力都带来新的问题:权限要怎么控制?失败了怎么回滚?隐私怎么保护?

解决这些问题的过程,本身就是在构建一种新的个人基础设施。

为什么值得折腾

说实话,搭建和维护这套系统花了不少时间。很多功能用现成的 app 也能实现。

但区别在于集成度定制度

没有任何一个 app 能同时做到:根据我的日程建议穿搭、帮我回邮件、控制我的灯、在我提到一个想法时自动归档到笔记系统、在手机上用语音让它帮我写代码。

这些能力单独看都不稀奇。但串联在一起,由一个理解你的上下文的 AI 来协调,体验是完全不同的。

它更像一个数字化的个人助理——不完美,但在变得越来越好。