我越来越觉得,AI 眼镜短期内最实际的用途,不是把手机屏幕搬到眼前,而是帮人记住刚刚发生了什么。
过去大家聊 AI 眼镜,很容易直接跳到 AR:眼前浮出导航、字幕、菜单、游戏界面,像科幻电影一样。
但如果把期待放低一点,问题反而清楚了。普通人每天最常见的麻烦,不是缺一块悬浮屏,而是刚刚看过、听过、问过的东西,很快就忘了。
比如开完会以后想不起谁提了哪个需求;看完房回来分不清每套房的缺点;修电脑时忘了刚才拔的是哪根线;逛展时拍了一堆图,回家之后完全懒得整理。
如果 AI 眼镜能把这些“现场信息”自然地记录下来,再在事后帮我整理,它就已经很有用了。
我不太相信第一批 AI 眼镜能替代手机
很多新设备都喜欢讲“替代手机”。但我对这个说法一直有点怀疑。
手机不是单纯的显示器,它还是钱包、钥匙、相册、通讯录、身份验证器、遥控器和工作台。想让一个戴在脸上的设备一下子接管这些东西,难度太高了。
更现实的路径可能是:AI 眼镜先不抢手机的活,而是补手机最别扭的地方。
手机记录现场信息有几个天然问题:你要掏出来、打开 App、对准、拍照或录音,还要在别人面前做这些动作。很多时候,这个动作本身就打断了现场。
眼镜的优势恰好相反。它本来就在你脸上,看的方向就是你正在看的方向,听到的是你正在参与的环境。如果它能在合适的时候轻轻记录,而不是让你每次都掏手机,那就足够成立。
我想象中的最小可用方案
如果让我设计一个真正贴近日常的 AI 眼镜,我不会先做大屏 AR,也不会一开始就追求全息交互。
我会先做一个很小的闭环:
- 眼镜负责看和听。
- 手机负责权限、存储和确认。
- 云端或本地模型负责识别、转写和总结。
- 最后输出一份可以搜索、可以回看的“现场笔记”。
这个方案听起来不酷,但很实用。
场景一:会议不是录下来,而是整理出来
很多人不是没录过会议,而是录完之后根本不会再听。
一段 40 分钟的录音,理论上很完整,实际上很难用。真正有价值的不是原始音频,而是这些东西:
- 今天讨论了哪几个问题。
- 谁承诺了什么。
- 哪些点还没定下来。
- 我接下来要做什么。
AI 眼镜如果只是录音,那它和录音笔区别不大。它真正应该做的,是把现场内容整理成一份会议笔记。
14:30-15:10,项目沟通。主要讨论了首页改版、接口延迟和上线时间。待办:周三前补一版移动端截图;确认对象存储配置;把测试环境地址发给对方。
这时候眼镜才有意义。它不是替你“记住所有声音”,而是替你把声音变成能用的信息。
场景二:看房、逛展、维修,这些才是眼镜的主场
AI 眼镜最适合的地方,可能不是办公室,而是那些“手不方便拿手机,但眼睛一直在看”的场景。
看房就是一个很典型的例子。一天看三四套房,回来以后很容易混在一起。哪个采光好,哪个楼下吵,哪个卫生间有味道,哪个中介说可以谈价,记忆会变得很模糊。
如果眼镜能在看房过程中自动形成一份记录,事情就简单很多:
- 客厅朝向和采光。
- 明显瑕疵,比如墙面、噪音、潮湿。
- 中介口头承诺。
- 每套房的优缺点对比。
逛展也是一样。你看到一个产品,问了几个问题,拍了宣传页,最后真正需要的是“这个东西叫什么、适合什么场景、价格大概多少、我为什么当时觉得它有意思”。
维修更明显。修电脑、装设备、接线、排查网络时,你经常需要一边动手一边查资料。如果眼镜能识别当前画面,再把步骤念给你听,它比手机更顺手。
它需要很克制的交互方式
我不希望 AI 眼镜变成另一块通知屏。
如果它一直在眼前弹消息、解释世界、提醒我该做什么,那会很烦。眼镜比手机更贴近身体,所以它的打扰成本也更高。
我能接受的交互方式应该很克制:
- 默认不显示东西。
- 需要时用语音、轻触镜腿或手机确认。
- 复杂内容回到手机上看。
- 只在高价值时刻主动提醒,比如“刚才提到的待办要不要保存”。
换句话说,AI 眼镜最好不要试图成为第二块屏幕。它更像一个安静的感知入口。
隐私会决定它能不能被戴出门
AI 眼镜最大的问题不是技术,而是别人愿不愿意和一个戴着摄像头的人待在一起。
这个问题绕不过去。哪怕厂商说没有录像,旁边的人也很难知道它到底有没有在记录。
所以我觉得一个靠谱方案至少需要这些设计:
- 明显的录制指示灯,不能被软件关闭。
- 本地优先处理,敏感场景不上云。
- 手机端有清晰的记录列表,用户能随时删除。
- 会议、课堂、医疗等场景默认弹出授权提醒。
- 支持“只转写不保存音频”或“只保存摘要不保存原始记录”。
这些设计会让产品少一点酷劲,但会让它更可能真的进入日常生活。
我觉得手机仍然是中枢
短期内,AI 眼镜不应该独立承担所有计算。
眼镜要轻,要有续航,要不发热,还要戴着舒服。它不适合把所有重活都揽在自己身上。
更合理的架构是:
- 眼镜:摄像头、麦克风、扬声器、简单提醒。
- 手机:权限、账号、存储、网络、设备管理。
- 模型:转写、识别、总结、搜索。
这样一来,手机不但不会被替代,反而会变成个人 AI 设备的权限中心。你戴什么眼镜、用什么耳机、哪些记录可以上传、哪些记录只能本地保存,都应该由手机来管。
我真正想买的 AI 眼镜长什么样
如果有一天我真的考虑买 AI 眼镜,我大概会看这些指标:
- 外观看起来像普通眼镜,不要太像开发板挂脸上。
- 续航至少能覆盖半天外出,而不是一小时尝鲜。
- 拍照、录音、转写都有明确的隐私提示。
- 能把会议、看房、维修、逛展这类场景整理成笔记。
- 能和手机相册、备忘录、日历、待办打通。
- 不强迫我一直看一块屏幕。
这其实不是一个很科幻的产品。
它更像一副普通眼镜,加上一个能理解现场的助手。它不需要每分钟都让我惊叹,只需要在我回头找信息的时候,真的帮我省一次事。
最后
AI 眼镜最先成熟的方向,可能不是“增强现实”,而是“增强记忆”。
显示屏当然有价值,但显示不是第一性问题。第一性问题是:现实世界的信息太散了,人脑记不住,手机记录又太麻烦。
如果一副眼镜能自然地看、听、整理、搜索,并且把隐私边界处理好,它就不需要喊着替代手机。
它只要帮我记住刚刚发生了什么,就已经足够实际了。
参考资料:Ray-Ban Meta AI glasses 官方功能页、Meta Newsroom 关于 Ray-Ban Meta Gen 2 和 Meta Ray-Ban Display 的介绍、Snap Spectacles 官方页面。文中的流程图、会议摘要图、隐私边界图和手机中枢图为本文自制示意图。