基于pi-mono思维最小实现openclaw


最近老是被openclaw刷屏,但是关于它的诸多类似代码冗余混乱,bug频出的传闻,让我不太想在自己的电脑上安装这样的产品。

所以我调查了一下openclaw做了哪些事情,简单概括一下就是:agent全面接管电脑,你用通讯软件指挥agent。

有个非常精简的agent项目叫pi-mono,它只是简单给llm赋予了系统文件的操作能力+bash, 但组合起来能做的事情非常多!

我的电脑目前是一个很重的游戏本,换电脑的计划暂时要等到四月左右。所以我出门游玩和做一些别的事情,离开电脑一会就会有“分离焦虑”。

对于这样的agent我存在实际的需求,于是我开发了pi-mono-mini。(这个项目只是我学习用,很多地方实现和修改都比较随意)

实现非常简单,基本的会话管理以后就是增删改+bash的tools.

相比起pi-mono我在内核增加了proactive系统,可以向agent发起一些主动任务:例如两小时后提醒我开会。

内部会启动一个计时器,可以同时发起多个任务。

我还加入了免费的SearXNG来给agent提供联网搜索能力。

在agent具体的业务实现上,我选择了接入whatsapp。

这也是做这个项目的一部分目的,我目前任职的这个team的ceo给我布置的一个小任务就是熟悉agent在whatsapp中的应用

通常我在开始一段工作之前都会去做一些和team目标类似的产品

在手机上和指定的联系人发送信息,我们就可以给agent发号施令了! 相比起一般的这类agent,这个版本可以在一定时间周期自行根据对话历史和用户画像联网收集信息,主动和用户沟通分享。

体验非常棒,玩了一下午,创建了一些垃圾项目。

对我而言最有用的地方在于,出门吃饭或者散步时,不想携带电脑但又想做点什么,我就会和agent聊聊我的项目。

由于它有权限可以读取我的项目,所以我们的沟通会很顺利,既能巩固基础也能给我一些新的启发。

openclaw的思路非常大胆新颖,我也感觉这是非常实在的提升了我的生产力,建议大家都去写个属于自己的小龙虾!