01 · TRENDS
热点追踪
我平时盯的 AI 信源,和最近自己在关注的方向。
最近在追的方向
各种 Agent / 工具调用框架的演进,自己也想拿来串项目。
检索增强在个人知识库里怎么落地,效果怎么调。
长思维链 / 推理模型的进展,以及在日常任务上的实用性。
02 · PAPERS
学术关注
关注的论文渠道和方向,给自己留个学习清单。
arXiv cs.CL / cs.AI
每天扫一眼新论文标题,挑感兴趣的精读。
Papers with Code
看 SOTA 榜单和对应的开源实现。
HF 每日热门论文
社区投票出来的热门论文,效率高。
03 · CASES
AI 商业案例
我平时看到的一些 AI 产品 / 公司,记录它们怎么用 AI 提升效率、改善盈利,再写点自己的心得。
上线基于 OpenAI 的 AI 客服助手,承接约三分之二的客服会话。
相当于 700 名全职客服的工作量,平均解决时长从 11 分钟降到 2 分钟,预计带来约 4000 万美元利润改善。
心得:AI 最先吃掉的是"高频、标准化"的人力环节,规模化客服的 ROI 最直接。
来源:Klarna 官方及多家媒体报道(2024)
把补全和 Agent 编程做到极致的 AI 原生代码编辑器。
据报道以极快速度突破 1 亿美元 ARR,是增长最快的 SaaS 之一。
心得:产品本身就是 AI、又是高频刚需,好用就会自然付费,变现速度极快。
来源:公开报道
订阅制的文生图工具,主打极致的出图质量。
仅几十人小团队、未拿 VC,做到数亿美元年营收,人效惊人。
心得:极致单点 + 订阅制,小团队也能高利润,AI 重新定义了"人效"。
来源:公开报道
推出 GPT-4 驱动的 Duolingo Max 高阶订阅,并用 AI 生成课程内容。
带动更高客单价的订阅档,同时降低内容生产成本。
心得:AI 既能"开源"(高价新订阅)又能"节流"(降本造内容),两头都吃。
来源:Duolingo 公开信息
用 Sidekick / Magic 帮商家自动写商品描述、做客服与营销文案。
降低中小商家运营门槛、提升平台粘性,内部主张"先用 AI 再考虑招人"。
心得:平台型公司把 AI 做成"赋能商家的能力",留存和护城河一起涨。
来源:Shopify 公开信息
在笔记 / 文档里嵌入 AI 写作、总结、问答的付费功能(Notion AI)。
作为增值订阅,提升付费转化与 ARPU。
心得:在已有高频产品里"加一层 AI 增值",是成熟 SaaS 最稳的变现方式。
来源:Notion 公开信息
* 以上均为本人在公开渠道看到后整理的观察与心得,数据以各公司官方及媒体公开报道为准,仅作个人学习记录,不构成任何建议。
04 · PROJECTS
项目实战
几个我自己动手做过的练手项目(大多在训练营里完成)——从手写 RAG、MCP 工具,到模型训练和 LLM 应用,都踏踏实实跑通过一遍。
从零手写一个 RAG 框架
不依赖 LangChain,从头实现一套轻量 RAG:文档分块 → 向量化存储 → 相似度检索 → 知识库问答,还配了个前端界面。
- 特点
- 模块化、可定制,零框架依赖,Windows / Ubuntu 都能跑。
- 验证
- 亲手跑通 RAG 全链路,搞清了分块策略和向量检索对回答质量的影响。
- 扩展
- 接入自己的笔记资料,做 AICUBE 助手的检索底座。
Weather MCP Server
基于美国国家气象局(NWS)API 写的一个 MCP 天气服务器,提供实时天气、详细预报和州级天气预警查询。
- 特点
- 标准 MCP 协议,可被 Cursor、Cline 等 AI 客户端直接调用,支持多种日期格式。
- 验证
- 打通了"让 AI 通过 MCP 调用外部真实 API"的完整链路。
- 扩展
- 把更多自己常用的 API 包成 MCP 工具,喂给助手用。
DeepSpeed 训练与微调练习
用 DeepSpeed 跑大模型的分布式训练与微调,练习训练侧的工程链路。
- 特点
- 关注 ZeRO 显存优化、多卡并行等训练工程问题。
- 验证
- 理解了在有限算力下训练 / 微调大模型的取舍与配置。
- 扩展
- 结合 LoRA 等轻量微调,对小模型做领域适配。
OpenAI-Translator · PDF 整书翻译
用 GPT-3.5 / ChatGLM 把英文 PDF 书整本翻译成中文,采用模块化、面向对象的设计。
- 特点
- 支持多模型切换、灵活配置,尽量保留原文排版结构。
- 验证
- 体会了把 LLM 封装成一个"真能用的工具"所需的工程化。
- 扩展
- 加术语表、双语对照和批量处理。
05 · AICUBE 助手
AICUBE 助手 · 我的私人 AI 魔方
AICUBE 助手是我已经落地在用的一套个人助手,基于开源框架 OpenClaw(小龙虾)搭建, 跑在一个叫「AICUBE」的飞书群里、装进我自己的手机。我把它拆成几个"专职"小助手,各管一摊、还会互相搭档, 每天自动帮我盯着 AI 圈的动态。下面是它们在飞书里的真实截图。
AI 新闻员 · 自我介绍
定位「AI 行业雷达 + 新闻过滤器」:每天嗅探大模型发布、产品更新、公司动态,先过滤、再提炼、划重点。
AI 新闻员 · 每日速递
把当天 AI 圈最值得看的动态整理成一条条简报,自动推送到飞书,省去自己刷信息流。
AI 学术员 · 自我介绍
追踪 AI 学术前沿、解读重要论文,把复杂成果讲成自己能看懂的分析。
AI 学术员 · 每周速递
每日论文速递 + 每周精选深读 1-2 篇重磅,按需还能做专题文献综述。
两个助手还会"互相搭档"
遇到学术问题优先交给 AI 学术员、行业新闻交给 AI 新闻员,它们会自己认领、避免抢答。底层基于 OpenClaw 框架,模型用的是 DeepSeek 系列,全部跑在个人飞书 / 手机上,纯自用、不对外开放。
06 · TOOLS
工具收藏
按用途整理的一份个人 AI 工具清单,附简短介绍,方便自己回顾选型。
编程开发
Cursor
AI 原生代码编辑器,基于 VS Code,Agent 模式能跨文件改代码、跑命令,生态成熟。
Claude Code
Anthropic 的命令行编程工具,在终端里让 Claude 读懂并改动整个代码库。
Trae
字节跳动的 AI 原生 IDE(基于 VS Code),含 Chat / Builder / SOLO 模式,中文体验好,国内版内置模型免费。
桌面端 Agent
Codex
OpenAI 的编程 / 软件工程 Agent,自然语言驱动写改代码、跑测试,有 CLI 与桌面形态。
Claude(桌面端 / Cowork)
Anthropic 的桌面客户端,把 Claude 的对话能力和本地工作流、任务结合起来。
Coze 扣子
字节跳动的一站式 AI 智能体开发平台,拖拽工作流、挂插件与知识库,可发布到飞书 / 微信等。
ZCode
智谱的智能体开发环境(ADE),围绕 GLM 做长程开发任务,支持手机 / 飞书远程推进。
Kimi Work
月之暗面的桌面端通用 Agent,可操作本地文件 / 浏览器,多 Agent 并行、定时任务,偏办公与研报。
AI 搜索 / 知识库
秘塔 Metaso
无广告的生成式 AI 搜索,直接给结构化答案并标注来源,适合查资料、做调研。
个人知识库工具
Obsidian / Notion 等加上 AI 的笔记与知识库工具,用来沉淀和检索自己的资料。
现象级开源项目关注
OpenClaw 🦞
个人助手开源的个人 AI 助手框架,跨平台、可接 IM,我的 AICUBE 助手就基于它搭建。
LangChain
应用框架构建 LLM 应用的经典框架,把模型、工具、记忆和检索串成可编排的链路。
更多 Agent / Coding 项目
持续关注各类现象级的 Agent、Coding 开源项目,看它们怎么设计、能不能拿来自己改用。
* 以上简介整理自 AI-bot 等 AI 工具导航站及各产品官方资料,仅作个人收藏与学习记录,不代表使用推荐。
07 · NOTES
知识沉淀
把学习和踩坑的过程写成笔记——下面是几条我自己反复用到的干货。
个人知识库做 RAG 的经验和坑
- 分块别太大也别太小:512–1024 token、留 10–15% 重叠,通常比整页塞进去好。
- 先把"召回"调准再谈"生成":检索不对,模型再强也白搭。
- 加重排:向量召回 top 20 → reranker 选 top 3–5,准确率明显提升。
- 中文优先选中文友好的 embedding(如 bge / m3e),英文模型套中文会掉点。
- 让回答带来源引用,既能验证又能压住"一本正经地编"。
我常用的提示词套路
- 四件套:角色 + 任务 + 约束 + 输出格式,基本够用。
- 让它"先想再答"(先列要点/步骤再给结论),复杂任务更稳。
- 给一两个正反例(few-shot),比堆一堆形容词管用。
- 要结构化结果就直接要 JSON / 表格,并写清字段含义。
- 长任务把"验收标准"写进去,让它自己对照检查。
从资料到笔记:我的信息提取工作流
- 一次只处理一个主题,先按主题分好文件夹。
- 第一遍让 AI 出:摘要 + 关键结论 + 关键数据(带出处)+ 待确认问题。
- 关键数据人工核对后再入库——AI 会编数字。
- 统一笔记模板:来源 / 日期 / 三句话总结 / 我的判断。
- 定期回顾,把零散笔记合并成主题页。
在自己机器上跑开源模型
- 起步最快:Ollama / LM Studio,一条命令拉起来。
- 显存不够就用量化(Q4_K_M 这类),7B 量化版消费级显卡能跑。
- 7B 适合日常问答/总结;写代码、复杂推理还是上更大的或用云端。
- 本地模型的价值是隐私和离线,别指望它打过云端旗舰。
- 上下文别拉满,太长会明显变慢、变"笨"。
* 以上为本人学习实践中的个人经验总结,仅供自己参考记录。