type
status
date
Jan 4, 2026 02:42 PM
slug
summary
tags
category
icon
password
核心逻辑:用户交互方式的变革
- 交互跃迁:从 Chatbox(纯文本对话) ➡️ OS/Browser/虚拟机
- 工程跃迁:从 Prompt Engineering(把话说明白) ➡️ Context Engineering(把环境搭好,构建好agent,连接外部世界的“接口”和固化的“工作流”)。
技术架构:多层系统论
为了让模型安全、有效率地操作外部世界,系统被划分为四个层级:
协议层:MCP (Model Context Protocol)
- 定位:系统的“USB 接口”。解决模型与外部世界(文件、Git、数据库、api)的连接问题。
- Anthropic 于 2024 年末推出
- 架构三要素:
- MCP Host (宿主):如 VS Code,负责最终决策和用户交互。
- MCP Client (客户端):Host 内部的连接器。
- MCP Server (服务端):
- Resources:静态数据(日志、数据库记录、api返回结果)。
- Tools:可执行动作(发邮件、计算)。
- Prompts:自带说明书(告诉模型如何使用此工具)。
技能层:Skills (Capability Packages)
- 定位:系统的“安装包”。将专家流程固化,而非每次重新 Prompting。类比到结构化的python包
- 核心逻辑:
- 非线性加载:启动时只注入
Description(触发器),具体步骤等需要时再加载(节省 Context)。 - 组成:产品级 SOP说明书 + 风险护栏,边界设置 + 确定性脚本。
- 表现形式:一个技能 = 一个文件夹。
- Resource: OpenAI Skills
claude-skills-collection
abubakarsiddik31 • Updated Jan 4, 2026
awesome-claude-skills
ComposioHQ • Updated Jan 4, 2026
skills
anthropics • Updated Jan 4, 2026
治理层:Project Rules (可选)
- 定位:项目的
README(AGENTS.md)。
- 逻辑:在特定项目中,限制 Agent 的“自作聪明”。定义边界、代码风格和禁止事项。
入口层:Interface
- 定位:用户每天打开的壳(IDE/CLI)。
- 逻辑:谁控制入口,谁就定义默认工作流。
实践落地:本地 Agent (Claude Code)
Claude Code 是上述架构的典型落地产品(通用 Agent)。
- 部署逻辑:
- 通过
npm安装,模块化思维(像搭积木一样):npm install -g @anthropic-ai/claude-code - 推荐配置:使用
kimicc插件 (GitHub) 连接国内模型(Qwen/Kimi/GLM)以降低成本或优化网络。npx kimicc --qwen
- 操作哲学:
- 文件夹隔离:一个文件夹 = 一个任务单元,互不干扰。
- 权限管理:
-dangerously-skip-permissions(全自动) vs 默认询问 (安全)。 - 全局微调:
Claude.md用于设定全局偏好。
- 加载skills和mcp
- 主流:ReAct, OpenAI Agents SDK, LangChain。
商业哲学:Manus 案例 (The Why & How)
- Manus 联合创始人兼首席科学家季逸超(Peak)经历
- 2011: 为解决 “预测用户下一次点击” 的问题,季逸超进入NLP领域
- 2014 年,他启动项目 “Magi”—— 一个用 AI 自动构建知识图谱的搜索引擎:从零开始训练模型,从爬虫到索引引擎全由团队自主开发。
- 经历了 Word2Vec、LSTM、Transformer 每一次技术迭代,每次迭代都意味着此前积累作废
- 2020 年,GPT-3.5 出现,成为 Magi 的 “致命打击”
- 大一统模型的能力:在 GPT-3.5 之前,NLP 领域从业者 “泾渭分明”—— 做信息抽取、机器翻译、客服系统的人各自专注领域,互相交流学习;而 GPT-3.5 作为 “通解”。
- 之后创业就不再试图证明自己,而是解决真实需求
- 2024 年,在真格基金撮合下,季逸超加入蝴蝶效应(Manus 前身),与肖弘、张涛组成核心团队。
- 浏览器 AI 插件 “Monica”,进军海外市场—— 中国 AI 行业少有的盈利产品。不要内卷,要出海赚取外面的钱。
- 不习惯于“追一个永远在跑的目标” 的状态: 不做模型,做应用
- 最开始花了几个月探索可能的ai应用方向,做ai浏览器还是会局限上下文切入的能力
- Manus 定位为 “通用 AI Agent 平台”,通过云原生方式,让用户完成各类任务,并通过观察用户行为持续迭代优化。
- Manus
- 不认为做 AI 应用是 “逆向工程”“没有护城河”,套壳没什么不好,只要底层在进步就能坐收
- Benchmark 是所有 AI 公司的唯一护城河!!模型能力会外溢,应用是价值核心
- 基础模型:巨头的护城河也极其脆弱,即便是OpenAI这样的公司,如果不能迭代出好模型,也可以在几周内崩塌
- 放弃晚期大众用户,聚焦先锋用户,今天AI发展太快,大部分人跟不上节奏
- 放弃优化利润率,现在需要疯狂圈地,还没到赚钱的时候
- 月活跃收入(MRR):超过 1 亿美元。TOKEN 消耗量:全球范围内排名前 5。Manus这样的Agent环境下,每个用户的平均token消耗量是聊天机器人的1500倍
- 三大应用场景:深度研究、日常工作报告与幻灯片制作、构建网站或AI应用。
- Meta 对 Manus 的收购是其历史上第三大收购(仅次于 WhatsApp 和 Scale.ai)
市场现实:高价值场景与成本
算力与流量困局
- 推理成本:OpenAI/豆包 每日烧掉数千万推理成本。
- OpenAI在10月初公布了ChatGPT 周活 8亿,推测日活约为 4亿(DAU/WAU在40%到60%区间)。ChatGPT 每个日活用户一天的推理成本 ≈ 0.11 美元。
- 豆包 DAU 1亿。国内有工程优化和电价优势,但是chatgpt是订阅的。这意味着,豆包现在每天一睁眼,光是推理算力就要烧掉几千万。
- 流量变局:SEO 已死,社交媒体(Social)是唯一的有机增长点。
高价值落地:Citadel (对冲基金)
因为 Agent 推理昂贵,必须用于高回报场景(如金融):
- 自动化研报摘要:对繁杂的券商研究报告进行即时提炼。
- 非结构化数据扫描:快速处理公司财报电话会议记录和监管备案文件。
- 风险雷达:自动识别并标记潜在的投资风险点+ 压力测试和反向测试
Reference
- 作者:Simon Yang
- 链接:https://myblog.simonyang.top//article/aigent
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。







