← Back to blog

AI圈有点乱,别急着追

说实话,现在AI行业有点群魔乱舞的感觉。

从提示词工程到上下文建设,从MCP skills到Open Claude,再到最近的Hermes Agent——三天两头冒出一个"版本答案"。上一个是终极方案,下一个又是,搞得从业者很焦虑:不学怕落后,学了又怕白费。

坦白说,很多所谓的"新东西",不过是在前人基础上做点包装优化。就像"养龙虾"——所谓的Hermes Agent,不就是让模型记住你的背景、习惯、上下文?我自己用Open Claude就在做类似的事。

但问题来了:上下文不可能无限加。

模型窗口200K又怎样?真堆到160K,准确率和稳定性早就大打折扣了。无脑加信息,最后可能是个废的系统。

做减法,才是正道。

就像人的注意力机制,无论脑容量多大,总量始终有限。AI的演进思路一直在模仿人类感知世界的方式——裁剪和压缩,什么时候开始都不晚。

我觉得没必要追每一个新热点。出来一个东西就扑上去喊"版本答案",真的没必要。

真正能落地、产生价值的,至少要等半年验证。理论到实践的距离,从来都不短。

特别是管理者,别因为怕掉队就带着团队盲目冲锋。创新的成本是要付的,但什么时候做什么事,得看当下的环境和机遇。

说到底,AI很强,但别太急躁。沉下心来打磨产品和服务,比追热点实在多了。


以下是口述原文:

我觉得现在 AI 行业有点群魔乱舞的感觉,三天两头就出一个新东西。上一个新技术还没捂热,可能下一个替换的就出来了。

比如说,现在不管是所谓的提示词工程 Prompt,还是到后面的上下文建设、上下文压缩,还有到 MCP skills,以及前段时间最火的 Open Claude,现在又出来一个 Hermes Agent。循环不断,一个接着一个。有些可能是新瓶装旧酒,有些可能是在前沿基础上做一些包装、升级优化,带来一些新东西。

但不管怎么说,我感觉现在这个行业变革或者说这个赛道、这个新技术本身还在摸索阶段,没有一个定论的东西。所以就会造成这种三天两头出来一个新东西。对于熟悉它的人,也就是从业者来说,就非常焦虑。你出来一个新东西,我不学可能就怕落后。谁知道它会不会就是那个终极答案呢?不敢赌。

所以我觉得现在这种状态是有点问题的,不断地浪费时间在一个接着一个工具或者技术的学习迭代上,可能中间很多都是无用功。包括现在这两个星期刚出的 Hermes Agent,我自己用 Open Claude 就在做类似的事情。我用 Open Claude 的时候,就是让它记住我的上下文,每天基于我的 Session 自己去提炼、蒸馏,形成一些固定的知识,然后加强自身。每天从我的对话里面概括出我的一些习惯、爱好、准则,形成自己的一些内容。然后在每次加载的时候自动加载,确保它下次记忆,重新打开一个新绘画,它还能有这方面的记忆。

我自己也在做,只不过这个 Hermes Agent 可能把这个包装成了一个比较规范的产品。我相信所有使用 Open Claude 的人都在做类似的事情,就是所谓的"养龙虾",不就是喂它更多的语料信息、上下文背景等等知识,让它记住嘛。

但是这里面有个问题,就是它不断增长的一些信息内容,其实并不是像真正你本质上并没有这个所谓的 Agent。它并没有真正理解你的世界的知识,它只是把这个文件录入系统了,下次加载上下文它可以加载进去。但是上下文虽然你现在已经涨到 200K 了,它始终还是有限的呀。当然这里面有个和谐统一的点,就是矛盾统一的点,就是可能围绕我们个人的背景知识、上下文知识,可能不需要 200K 这么多。所以当前的窗口最大值是有可能可以满足我们的需求的,这也是一个方面,所以也不能说它没用。

但是随着这个越增加越多,虽然模型上下文是 200K 最大值,但是你不可能达到 200K 最大值还能工作。你有可能达到 160K,了不起你还能保持原来的 80% 的效率和准确度。实际上你达到后面 100 多 K 的时候,你的准确率、稳定性可能就大打折扣了,那有什么用呢?你无脑加的这些上下文就是你不能保证它可用性了,那它本身的机制其实就是到了这个阶段的时候就是废的。这也是其中我觉得是一个问题。

还有我觉得每出来一个新新的技术或者新的所谓的热点、爆点工具或者解决方案,我们其实没有必要急着就扑上去说这个就是 AI 的最终答案,我觉得为时尚早。你看 Open Claude 这种形式出来的时候,大家都觉得这种就是真正落地的。你现在回过头来发现,你真正其实包括你这么多人养龙虾,它真正能帮你的其实是很有限的。包括你自己实际使用过程中,当成一个玩具龙虾没问题。但实际上你一个龙虾玩具玩着玩着你就会有厌倦感,它真正能不能融入你日常工作生活里面呢?

我们现在做精分服务的时候也很苦恼。我们做的东西,比如说项目组的同事不用,那我们就想着你不用,那我能不能把服务做到你的关键路径里面,你每天必须做的事情里面必须用到我。有些场景它就是可以这样做。我们现在有些场景就做到了,比如说你每天要收集数据写日报,那我现在就有一个自动化的东西帮你收集好数据,或者帮你很方便地做好这个数据收集的工作,那这个就是关键路径。那你龙虾现在有没有什么关键路径,是一定这个人一定要使用的呢?原来是说没有关键路径,那我创造关键路径。

关键是很多时候需求是要解决人的实际问题,创造需求可以,但是是使用者创造需求,而不是你工具创造需求让使用者去使用,是吧?这个逻辑可能搞反了,我觉得这是要区别开的。包括你现在基于龙虾做了很多所谓的日报、监控等等。如果你本身每天原来没有龙虾的时候你就在做的,那现在有了,那确实它是可以帮你解决问题了。但是实际上我们很多所谓的这种需求本来就是可有可无的,或者没有更好,有也行,没有更好。但是它有没有,其实根本不影响你做事情的判断,多录入这点信息根本就无关紧要的。那其实是不是说就没必要呢?因为你多录入的这点信息又没有产生必要的价值,那不就是垃圾吗?是吧?有的时候我们说有或者没有无关紧要,那还是有吧,那就是没有做减法嘛,是吧?我们经常说人生要做减法,工作要做减法,就是因为你噪音太多了,上下文噪音太多了,你要不断地做减法,对上下文进行裁剪。我们人也是要通过做减法来进化的。

你可以说现在的模型还没发展到必须做减法的阶段,但实际上,目前模型的演进思路一直是在模仿人类接触和学习世界的方式,也是在教模型如何感知世界、进而影响世界。我觉得裁剪和压缩上下文,什么时候开始都不算晚。

  1. 资源限制与压缩:即便人类增长寿命或增加脑容量,也不影响我们对上下文信息进行压缩和精简。因为无论你怎么扩容,总量始终是有限的。

  2. 注意力机制的本质:所谓的"注意力机制",人本身就是这一机制下的产物。这就是为什么《Attention Is All You Need》这篇论文能解决这么多问题,因为它抓住了人类特性的本质。

你可以回想一下,现在的日常工作、生活和学习,是不是都是基于注意力机制下的动作行为?

正如我昨天的文章提到的:AI 虽然很强,但如果你根本没有注意到、没有意识到它可以这样用,或者在某个方面需要用到 AI,你就不会产生好的结果。AI 的存在和出现,也就根本不会对你产生作用。这本质上也是一种注意力机制带来的影响。说了这么多,我最后再补充一下:我觉得我们没必要一直去追这种新技术、新热潮,还是要沉下心来慢慢打磨产品或服务。

你可以关注,但没必要在它刚出来时就觉得这就是"版本的最终答案"。版本答案哪有那么容易出现?是不是真经得起验证,至少要等半年,真正能在业务落地并产生应用价值,才能下结论。

现在很多东西刚出来,什么都没有,只是一个思维方向。思维方向上"应该这样做"能产生效果的路径多了去了,但理论落地到实践并产生价值,是有很长距离的。如果只靠理论就能解决问题,那人类早就冲出太阳系了。科学理论上早就有冲出太阳系的方法,但实际落地能实现吗?实现不了。

我觉得这是一个道理。在 AI 时代,AI 固然很强,但真的不能太急躁。出来一个新东西就觉得能通杀一切、是版本答案,这没必要。

特别是我们的管理者,最怕的就是盲目让大家一起冲新东西。管理者可能也害怕自己掉队,害怕做不出新东西。这种场景下,对于进取型管理者来说有利有弊:

  1. 利:可能真的可以基于此做出新东西。
  2. 弊:可能会做非常多的无用功,导致团队反复折腾,浪费各种资源。

这可能也就是一些创新的成本吧。但在某个阶段该做什么事情,是跟当前的历史机遇、背景以及团队所处的环境有关的。我觉得不能太激进,反正现在给我的感觉就是有点太激进了。