type
status
date
Jan 4, 2026 02:42 PM
slug
summary
tags
category
icon
password

核心逻辑:用户交互方式的变革

  • 交互跃迁:从 Chatbox(纯文本对话) ➡️ OS/Browser/虚拟机
  • 工程跃迁:从 Prompt Engineering(把话说明白) ➡️ Context Engineering(把环境搭好,构建好agent,连接外部世界的“接口”和固化的“工作流”)。

技术架构:多层系统论

为了让模型安全、有效率地操作外部世界,系统被划分为四个层级:

协议层:MCP (Model Context Protocol)

  • 定位:系统的“USB 接口”。解决模型与外部世界(文件、Git、数据库、api)的连接问题。
  • Anthropic 于 2024 年末推出
  • 架构三要素:
      1. MCP Host (宿主):如 VS Code,负责最终决策和用户交互。
      1. MCP Client (客户端):Host 内部的连接器。
      1. MCP Server (服务端):
          • Resources:静态数据(日志、数据库记录、api返回结果)。
          • Tools:可执行动作(发邮件、计算)。
          • Prompts:自带说明书(告诉模型如何使用此工具)。

技能层:Skills (Capability Packages)

  • 定位:系统的“安装包”。将专家流程固化,而非每次重新 Prompting。类比到结构化的python包
  • 核心逻辑:
    • 非线性加载:启动时只注入 Description(触发器),具体步骤等需要时再加载(节省 Context)。
    • 组成:产品级 SOP说明书 + 风险护栏,边界设置 + 确定性脚本。
  • 表现形式:一个技能 = 一个文件夹。
claude-skills-collection
abubakarsiddik31Updated Jan 4, 2026
awesome-claude-skills
ComposioHQUpdated Jan 4, 2026
skills
anthropicsUpdated Jan 4, 2026

治理层:Project Rules (可选)

  • 定位:项目的 README (AGENTS.md)。
  • 逻辑:在特定项目中,限制 Agent 的“自作聪明”。定义边界、代码风格和禁止事项。

入口层:Interface

  • 定位:用户每天打开的壳(IDE/CLI)。
  • 逻辑:谁控制入口,谁就定义默认工作流。
 

实践落地:本地 Agent (Claude Code)

Claude Code 是上述架构的典型落地产品(通用 Agent)。
  • 部署逻辑:
    • 通过 npm 安装,模块化思维(像搭积木一样):npm install -g @anthropic-ai/claude-code
    • 推荐配置:使用 kimicc 插件 (GitHub) 连接国内模型(Qwen/Kimi/GLM)以降低成本或优化网络。 npx kimicc --qwen
  • 操作哲学:
    • 文件夹隔离:一个文件夹 = 一个任务单元,互不干扰。
    • 权限管理:-dangerously-skip-permissions (全自动) vs 默认询问 (安全)。
    • 全局微调:Claude.md 用于设定全局偏好。
  • 加载skills和mcp
  • 主流:ReAct, OpenAI Agents SDK, LangChain。
 

商业哲学:Manus 案例 (The Why & How)

  • Manus 联合创始人兼首席科学家季逸超(Peak)经历
    • 2011: 为解决 “预测用户下一次点击” 的问题,季逸超进入NLP领域
    • 2014 年,他启动项目 “Magi”—— 一个用 AI 自动构建知识图谱的搜索引擎:从零开始训练模型,从爬虫到索引引擎全由团队自主开发。
      • 经历了 Word2Vec、LSTM、Transformer 每一次技术迭代,每次迭代都意味着此前积累作废
    • 2020 年,GPT-3.5 出现,成为 Magi 的 “致命打击”
      • 大一统模型的能力:在 GPT-3.5 之前,NLP 领域从业者 “泾渭分明”—— 做信息抽取、机器翻译、客服系统的人各自专注领域,互相交流学习;而 GPT-3.5 作为 “通解”。
      • 之后创业就不再试图证明自己,而是解决真实需求
    • 2024 年,在真格基金撮合下,季逸超加入蝴蝶效应(Manus 前身),与肖弘、张涛组成核心团队。
      • 浏览器 AI 插件 “Monica”,进军海外市场—— 中国 AI 行业少有的盈利产品。不要内卷,要出海赚取外面的钱。
      • 不习惯于“追一个永远在跑的目标” 的状态: 不做模型,做应用
      • 最开始花了几个月探索可能的ai应用方向,做ai浏览器还是会局限上下文切入的能力
      • Manus 定位为 “通用 AI Agent 平台”,通过云原生方式,让用户完成各类任务,并通过观察用户行为持续迭代优化。
  • Manus
    • 不认为做 AI 应用是 “逆向工程”“没有护城河”,套壳没什么不好,只要底层在进步就能坐收
    • Benchmark 是所有 AI 公司的唯一护城河!!模型能力会外溢,应用是价值核心
      • 基础模型:巨头的护城河也极其脆弱,即便是OpenAI这样的公司,如果不能迭代出好模型,也可以在几周内崩塌
      • 放弃晚期大众用户,聚焦先锋用户,今天AI发展太快,大部分人跟不上节奏
      • 放弃优化利润率,现在需要疯狂圈地,还没到赚钱的时候
    • 月活跃收入(MRR):超过 1 亿美元。TOKEN 消耗量:全球范围内排名前 5。Manus这样的Agent环境下,每个用户的平均token消耗量是聊天机器人的1500倍
    • 三大应用场景:深度研究、日常工作报告与幻灯片制作、构建网站或AI应用。
    • Meta 对 Manus 的收购是其历史上第三大收购(仅次于 WhatsApp 和 Scale.ai)
 

市场现实:高价值场景与成本

算力与流量困局

  • 推理成本:OpenAI/豆包 每日烧掉数千万推理成本。
    • OpenAI在10月初公布了ChatGPT 周活 8亿,推测日活约为 4亿(DAU/WAU在40%到60%区间)。ChatGPT 每个日活用户一天的推理成本 ≈ 0.11 美元。
    • 豆包 DAU 1亿。国内有工程优化和电价优势,但是chatgpt是订阅的。这意味着,豆包现在每天一睁眼,光是推理算力就要烧掉几千万。
  • 流量变局:SEO 已死,社交媒体(Social)是唯一的有机增长点。

高价值落地:Citadel (对冲基金)

因为 Agent 推理昂贵,必须用于高回报场景(如金融):
  • 自动化研报摘要:对繁杂的券商研究报告进行即时提炼。
  • 非结构化数据扫描:快速处理公司财报电话会议记录和监管备案文件。
  • 风险雷达:自动识别并标记潜在的投资风险点+ 压力测试和反向测试
 

Reference

 
 
谷歌调参手册windows转mac快速指南