赛博留痕
’’如果一年回家两次,那么十年也不过是二十次的机会。’’

联想到自己回家依旧无望,何时是归途。

#life
VSX-Agent 构建实践记录 — 基于 Claude Code 的 VSX-Agent

1. 系统由六个 subagent 组成:
doc-scanner 根据输入的参考文件夹和已有知识,对资料进行结构化拆分,形成用于学习的基础块;
knowledge-curator 负责整合各块输出,并基于新增信息对知识库进行持续修正与更新;
researcher 聚焦于学习过程中的具体问题分析与模糊认知的澄清;
architect 基于知识库设计代码整体架构;
code-writer 根据架构实现具体代码;
reviewer 结合知识库、编码规范及 gotchas(陷阱)对代码进行系统性回顾与审查。

2. 系统提供四个核心调用命令:
/learn 文件夹路径
/generate 描述生成代码的任务
/review 回顾生成的代码
/correct 人为干预,通过输入金标准或已验证代码,对当前知识库进行修正与更新。

我的使用经验是:在能够完成任务的前提下,应尽量保持知识库的最小化,且 /learn 的输入范围应“小而精”。agent 是一个可持续进化的系统,一次性将整个项目文件夹输入不仅会导致上下文与 token 的爆炸,还可能引入噪声,使学习效果下降。更有效的方式是分阶段构建知识:例如,先使用 L7-11 的代码库建立基础认知,再引入已验证的定制探头代码,学习特定参数模式,最后生成基于该探头的 CEUS 代码;若出现问题,再针对性补充 help text 中的标准文档。

换言之,不应一次性将所有信息输入 agent,否则容易导致知识杂糅、后期难以矫正。更合理的策略是让知识库的边界随任务逐步扩展,而非一开始就构建一个冗余且含有杂质的知识体系。需要特别强调的是,/learn 的输入必须是正确且经过验证的内容,这直接决定了学习效果和知识可靠性。错误的知识带来的偏差会在后续生成中持续传播且难以察觉。

一个典型案例是:在官方示例代码和 help 文档中,并不存在切换 mode 的实现方式。在这一前提下,即使经过多轮调试也无法获得正确结果。最终,寇博士提供了一份经过验证的可运行代码。将其作为新的学习样本输入 agent 后,系统能够识别此前失败的根本原因,并在新一轮调试中得到正确结果。

这一过程表明,人为干预依然不可替代。agent 的能力上限受限于其知识库,即便学习了标准文档,如果缺乏人为校正,也难以纠正理解偏差。因此,尽管 agent 可以作为高效的信息处理与生成工具,但作为自然语言输入方,人所提供的“金标准”依然至关重要。我个人的理解是,当前 LLM 的能力本质上是对人类既有知识的高度提纯,其边界对应于人类历史知识的积累边界。而真正的创新、发明以及有意义的软硬件系统组合,仍然依赖专业人士对模型进行持续校正。LLM 可以替代通用能力,但在专业领域中,专家仍然不可替代,至少在其知识完全被固化为私有 agent 之前。

所谓“知识库最小化”不仅是为了控制 token,更关键在于知识密度:当知识密度降低时,agent 在检索与推理过程中的信噪比会下降,而精炼的知识库可以为每一步决策提供更清晰的依据。这一现象本质上符合 RAG 系统设计中的通用原则,质量优先于数量

“金标准输入”的重要性同样常被低估。agent 的学习本质上是一种无监督的模式提取过程,它无法区分“常见写法”与“正确写法”,只有通过人为标注边界,才能建立可靠认知。这与 RLHF 的核心机制在原理上是一致的,只是在更小规模的专业场景中被复现。

LLM提纯过程本身会引入偏差,它更倾向于强化被大量记录的显性知识,而工程实践中大量的 tacit knowledge(隐性知识)往往未被记录。寇博士的代码之所以有效,正是因为其承载了这类隐性经验。这也解释了为什么“经验丰富但不撰写文档”的专家,在当前阶段对 agent 的价值反而更高。

#life
好几个月前做的红烧牛肉还有萝卜饭 思念

#life
标题:AI agent 搭建实操指南
最近两个月一直在AI agent尝试,由于自己掉队太多,上手点的顺序不妥,最初接触是openclaw,在里面瞎倒腾了很长时间,补各种概念,用自然语言设置各种小workflow,后来才学习到n8n能够优雅方便的实现几乎我所有openclaw当前的功能,甚至更可靠和更可维护。

这个视频里所描述的心路历程也和我配置agent的过程中所经历的相似,值得一看。

https://www.youtube.com/watch?v=b_9D7T0n4RA&t=750s

#life
标题:带领团队的经验

简单经验就是:
小团队,你总是需要亲力亲为。你需要统领全局,时刻清醒,做别人做不了的事。
自己选人,选择有用的人,把他们擅长做的事交给他们做。
你不需要朋友,你需要的是有价值的批评者。允许所有人自由讨论,但一旦你拍板,所有人就不再废话。
永远每隔几小时了解一下大家在做什么,进展如何,让他们展示成果而不是空口说。
讲道理,有原则,对事不对人。自己业务水平要过关,别人做不了的要帮忙并教给他。
鼓励有事就说,有困难就讲,讲真话,不鼓励做闷葫芦,糊弄,粉饰。
在分钱的时候,永远把大头给你的下属,最差也要均分。人们只有受益才会愿意跟你。

#article
标题:3个月,从微舆BettaFish开源项目爆火到获三千万投资,我亲历了Vibe Coding带来的超级个体时代

超级个体是一片蓝海,虽然技术门槛无限低,但是对于产品开发,市场需求,以及AI理解和转变为生产力的能力要求愈发高,反过来说,虽然技术不会成为实现的壁垒,但是技术能力对于个体本身所带来的理解力和洞察力的影响甚至更加重要。AI时代极大扩大了多维能力的上下边界, 而有宏观洞察力,领导能力的人会更得心应手,创造出有价值的应用,普通人的差距会和他们越来越大。 我害怕我甚至做不到在中间地带徘徊,只会在日益更新的AI技术之下逐渐落伍,归为普通人。

https://mp.weixin.qq.com/s/UyYVjlBCvQRJI6B_MmZbsA?scene=1&click_id=3

#article
标题:沧城

‘’她们让我看见:要让一个女人向上走,不必给她梯子,也不必加以皮鞭,只需要让她们卸下颈上的锁链。‘’

#book

https://book.douban.com/subject/37212430/
时隔一将近整年,今天终于理了头发,感觉还行?不过我很震惊的是理发店是不提供洗头发服务的,纯剪头发。 #life
本来要接送Maria去学校,但是似乎手机上的闹钟在apple watch没有重复响。醒来的时候已经超过约定的时间,非常抱歉。 #life
todolist的面板管理非常有效,同时还可以结合google scholar的日历。 当前使用todolist软件来综合管理日程。

另外,todolist也有api,可以直接通过openclaw的自然语言进行管理任务列表,但是有点鸡肋,直接添加会更加方便。

#life
openhouse 保龄球娱乐活动结束后一起去吃冰淇淋,蛮开心的。 克利夫兰有许多家冰淇淋工厂。 #life
和北辰去看了 art museum,ana 的展览的确看不懂,像是进入了阴曹地府 #life
和北辰一起吃了西班牙菜! #life
出国留学读博像是走进了黑洞,与国内的时间流逝是不一样的。

近日除夕,和家里人打电话,得知哥哥今年结婚,我非常想参加,但是因为三个月的check而打消念头。每逢家里人说你中途没必要回来,毕业回来就行的时候,我都讪讪地打哈哈,笑着点头着,却不知道他们相信了几分。

#life
Back to Top