AICUBE · AI 魔方 - 学习与应用 AI 的个人知识库

01 · TRENDS

热点追踪

我平时盯的 AI 信源，和最近自己在关注的方向。

常看的信源

学术关注

关注的论文渠道和方向，给自己留个学习清单。

arXiv cs.CL / cs.AI

每天扫一眼新论文标题，挑感兴趣的精读。

Papers with Code

看 SOTA 榜单和对应的开源实现。

HF 每日热门论文

社区投票出来的热门论文，效率高。

关注方向：大模型推理检索增强 RAG 多模态 Agent 与工具调用模型蒸馏 / 量化

03 · CASES

AI 商业案例

我平时看到的一些 AI 产品 / 公司，记录它们怎么用 AI 提升效率、改善盈利，再写点自己的心得。

Klarna 金融 · 客服

上线基于 OpenAI 的 AI 客服助手，承接约三分之二的客服会话。

相当于 700 名全职客服的工作量，平均解决时长从 11 分钟降到 2 分钟，预计带来约 4000 万美元利润改善。

心得：AI 最先吃掉的是"高频、标准化"的人力环节，规模化客服的 ROI 最直接。

来源：Klarna 官方及多家媒体报道（2024）

Cursor（Anysphere）开发工具

把补全和 Agent 编程做到极致的 AI 原生代码编辑器。

据报道以极快速度突破 1 亿美元 ARR，是增长最快的 SaaS 之一。

心得：产品本身就是 AI、又是高频刚需，好用就会自然付费，变现速度极快。

来源：公开报道

Midjourney 内容生成

订阅制的文生图工具，主打极致的出图质量。

仅几十人小团队、未拿 VC，做到数亿美元年营收，人效惊人。

心得：极致单点 + 订阅制，小团队也能高利润，AI 重新定义了"人效"。

来源：公开报道

Duolingo 教育

推出 GPT-4 驱动的 Duolingo Max 高阶订阅，并用 AI 生成课程内容。

带动更高客单价的订阅档，同时降低内容生产成本。

心得：AI 既能"开源"（高价新订阅）又能"节流"（降本造内容），两头都吃。

来源：Duolingo 公开信息

Shopify 电商 SaaS

用 Sidekick / Magic 帮商家自动写商品描述、做客服与营销文案。

降低中小商家运营门槛、提升平台粘性，内部主张"先用 AI 再考虑招人"。

心得：平台型公司把 AI 做成"赋能商家的能力"，留存和护城河一起涨。

来源：Shopify 公开信息

Notion 效率工具

在笔记 / 文档里嵌入 AI 写作、总结、问答的付费功能（Notion AI）。

作为增值订阅，提升付费转化与 ARPU。

心得：在已有高频产品里"加一层 AI 增值"，是成熟 SaaS 最稳的变现方式。

来源：Notion 公开信息

* 以上均为本人在公开渠道看到后整理的观察与心得，数据以各公司官方及媒体公开报道为准，仅作个人学习记录，不构成任何建议。

04 · PROJECTS

项目实战

几个我自己动手做过的练手项目（大多在训练营里完成）——从手写 RAG、MCP 工具，到模型训练和 LLM 应用，都踏踏实实跑通过一遍。

RAG 落地

从零手写一个 RAG 框架

不依赖 LangChain，从头实现一套轻量 RAG：文档分块 → 向量化存储 → 相似度检索 → 知识库问答，还配了个前端界面。

特点: 模块化、可定制，零框架依赖，Windows / Ubuntu 都能跑。
验证: 亲手跑通 RAG 全链路，搞清了分块策略和向量检索对回答质量的影响。
扩展: 接入自己的笔记资料，做 AICUBE 助手的检索底座。

Python向量检索自研框架

Agent / 工具调用

Weather MCP Server

基于美国国家气象局（NWS）API 写的一个 MCP 天气服务器，提供实时天气、详细预报和州级天气预警查询。

特点: 标准 MCP 协议，可被 Cursor、Cline 等 AI 客户端直接调用，支持多种日期格式。
验证: 打通了"让 AI 通过 MCP 调用外部真实 API"的完整链路。
扩展: 把更多自己常用的 API 包成 MCP 工具，喂给助手用。

PythonMCPhttpx

模型微调 / 训练

DeepSpeed 训练与微调练习

用 DeepSpeed 跑大模型的分布式训练与微调，练习训练侧的工程链路。

特点: 关注 ZeRO 显存优化、多卡并行等训练工程问题。
验证: 理解了在有限算力下训练 / 微调大模型的取舍与配置。
扩展: 结合 LoRA 等轻量微调，对小模型做领域适配。

PythonDeepSpeed分布式训练

LLM 应用

OpenAI-Translator · PDF 整书翻译

用 GPT-3.5 / ChatGLM 把英文 PDF 书整本翻译成中文，采用模块化、面向对象的设计。

特点: 支持多模型切换、灵活配置，尽量保留原文排版结构。
验证: 体会了把 LLM 封装成一个"真能用的工具"所需的工程化。
扩展: 加术语表、双语对照和批量处理。

PythonGPT / ChatGLM

更多项目在我的 GitHub

05 · AICUBE 助手

AICUBE 助手 · 我的私人 AI 魔方

AICUBE 助手是我已经落地在用的一套个人助手，基于开源框架 OpenClaw（小龙虾）搭建，跑在一个叫「AICUBE」的飞书群里、装进我自己的手机。我把它拆成几个"专职"小助手，各管一摊、还会互相搭档，每天自动帮我盯着 AI 圈的动态。下面是它们在飞书里的真实截图。

AI 新闻员 · 自我介绍

定位「AI 行业雷达 + 新闻过滤器」：每天嗅探大模型发布、产品更新、公司动态，先过滤、再提炼、划重点。

AI 新闻员 · 每日速递

把当天 AI 圈最值得看的动态整理成一条条简报，自动推送到飞书，省去自己刷信息流。

AI 学术员 · 自我介绍

追踪 AI 学术前沿、解读重要论文，把复杂成果讲成自己能看懂的分析。

AI 学术员 · 每周速递

每日论文速递 + 每周精选深读 1-2 篇重磅，按需还能做专题文献综述。

两个助手还会"互相搭档"

遇到学术问题优先交给 AI 学术员、行业新闻交给 AI 新闻员，它们会自己认领、避免抢答。底层基于 OpenClaw 框架，模型用的是 DeepSeek 系列，全部跑在个人飞书 / 手机上，纯自用、不对外开放。

06 · TOOLS

工具收藏

按用途整理的一份个人 AI 工具清单，附简短介绍，方便自己回顾选型。

编程开发

Cursor

AI 原生代码编辑器，基于 VS Code，Agent 模式能跨文件改代码、跑命令，生态成熟。

Claude Code

Anthropic 的命令行编程工具，在终端里让 Claude 读懂并改动整个代码库。

Trae

字节跳动的 AI 原生 IDE（基于 VS Code），含 Chat / Builder / SOLO 模式，中文体验好，国内版内置模型免费。

桌面端 Agent

Codex

OpenAI 的编程 / 软件工程 Agent，自然语言驱动写改代码、跑测试，有 CLI 与桌面形态。

Claude（桌面端 / Cowork）

Anthropic 的桌面客户端，把 Claude 的对话能力和本地工作流、任务结合起来。

Coze 扣子

字节跳动的一站式 AI 智能体开发平台，拖拽工作流、挂插件与知识库，可发布到飞书 / 微信等。

ZCode

智谱的智能体开发环境（ADE），围绕 GLM 做长程开发任务，支持手机 / 飞书远程推进。

Kimi Work

月之暗面的桌面端通用 Agent，可操作本地文件 / 浏览器，多 Agent 并行、定时任务，偏办公与研报。

AI 搜索 / 知识库

秘塔 Metaso

无广告的生成式 AI 搜索，直接给结构化答案并标注来源，适合查资料、做调研。

个人知识库工具

Obsidian / Notion 等加上 AI 的笔记与知识库工具，用来沉淀和检索自己的资料。

现象级开源项目关注

OpenClaw 🦞

个人助手

开源的个人 AI 助手框架，跨平台、可接 IM，我的 AICUBE 助手就基于它搭建。

LangChain

应用框架

构建 LLM 应用的经典框架，把模型、工具、记忆和检索串成可编排的链路。

知识沉淀

把学习和踩坑的过程写成笔记——下面是几条我自己反复用到的干货。

RAG

个人知识库做 RAG 的经验和坑

分块别太大也别太小：512–1024 token、留 10–15% 重叠，通常比整页塞进去好。
先把"召回"调准再谈"生成"：检索不对，模型再强也白搭。
加重排：向量召回 top 20 → reranker 选 top 3–5，准确率明显提升。
中文优先选中文友好的 embedding（如 bge / m3e），英文模型套中文会掉点。
让回答带来源引用，既能验证又能压住"一本正经地编"。

Prompt

我常用的提示词套路

四件套：角色 + 任务 + 约束 + 输出格式，基本够用。
让它"先想再答"（先列要点/步骤再给结论），复杂任务更稳。
给一两个正反例（few-shot），比堆一堆形容词管用。
要结构化结果就直接要 JSON / 表格，并写清字段含义。
长任务把"验收标准"写进去，让它自己对照检查。

工具流

从资料到笔记：我的信息提取工作流

一次只处理一个主题，先按主题分好文件夹。
第一遍让 AI 出：摘要 + 关键结论 + 关键数据（带出处）+ 待确认问题。
关键数据人工核对后再入库——AI 会编数字。
统一笔记模板：来源 / 日期 / 三句话总结 / 我的判断。
定期回顾，把零散笔记合并成主题页。

本地模型

在自己机器上跑开源模型

起步最快：Ollama / LM Studio，一条命令拉起来。
显存不够就用量化（Q4_K_M 这类），7B 量化版消费级显卡能跑。
7B 适合日常问答/总结；写代码、复杂推理还是上更大的或用云端。
本地模型的价值是隐私和离线，别指望它打过云端旗舰。
上下文别拉满，太长会明显变慢、变"笨"。

* 以上为本人学习实践中的个人经验总结，仅供自己参考记录。