AICUBE · AI 魔方

拥抱 AI,修炼自我

AICUBE · AI 魔方 立体发光魔方图标

AICUBE(AI 魔方)是我学习、应用 AI 的个人小阵地。在这里,我收藏顺手的工具、追踪行业热点、关注前沿论文, 也拆解有意思的商业案例,把亲手做的项目和踩过的坑沉淀成笔记。零散的知识, 像魔方一样一面一面拼起来——纯个人学习记录,每天进步一点点,卷起来!

本站为个人自建的学习笔记与资料整理,仅记录我个人学习、应用 AI 的过程,不提供任何对外服务,亦不涉及经营活动。
关注方向: 大模型推理 检索增强 RAG 多模态 Agent 与工具调用 模型蒸馏 / 量化
Klarna 金融 · 客服

上线基于 OpenAI 的 AI 客服助手,承接约三分之二的客服会话。

相当于 700 名全职客服的工作量,平均解决时长从 11 分钟降到 2 分钟,预计带来约 4000 万美元利润改善。

心得:AI 最先吃掉的是"高频、标准化"的人力环节,规模化客服的 ROI 最直接。

来源:Klarna 官方及多家媒体报道(2024)

把补全和 Agent 编程做到极致的 AI 原生代码编辑器。

据报道以极快速度突破 1 亿美元 ARR,是增长最快的 SaaS 之一。

心得:产品本身就是 AI、又是高频刚需,好用就会自然付费,变现速度极快。

来源:公开报道

Midjourney 内容生成

订阅制的文生图工具,主打极致的出图质量。

仅几十人小团队、未拿 VC,做到数亿美元年营收,人效惊人。

心得:极致单点 + 订阅制,小团队也能高利润,AI 重新定义了"人效"。

来源:公开报道

Duolingo 教育

推出 GPT-4 驱动的 Duolingo Max 高阶订阅,并用 AI 生成课程内容。

带动更高客单价的订阅档,同时降低内容生产成本。

心得:AI 既能"开源"(高价新订阅)又能"节流"(降本造内容),两头都吃。

来源:Duolingo 公开信息

Shopify 电商 SaaS

用 Sidekick / Magic 帮商家自动写商品描述、做客服与营销文案。

降低中小商家运营门槛、提升平台粘性,内部主张"先用 AI 再考虑招人"。

心得:平台型公司把 AI 做成"赋能商家的能力",留存和护城河一起涨。

来源:Shopify 公开信息

Notion 效率工具

在笔记 / 文档里嵌入 AI 写作、总结、问答的付费功能(Notion AI)。

作为增值订阅,提升付费转化与 ARPU。

心得:在已有高频产品里"加一层 AI 增值",是成熟 SaaS 最稳的变现方式。

来源:Notion 公开信息

* 以上均为本人在公开渠道看到后整理的观察与心得,数据以各公司官方及媒体公开报道为准,仅作个人学习记录,不构成任何建议。

RAG 落地

从零手写一个 RAG 框架

不依赖 LangChain,从头实现一套轻量 RAG:文档分块 → 向量化存储 → 相似度检索 → 知识库问答,还配了个前端界面。

特点
模块化、可定制,零框架依赖,Windows / Ubuntu 都能跑。
验证
亲手跑通 RAG 全链路,搞清了分块策略和向量检索对回答质量的影响。
扩展
接入自己的笔记资料,做 AICUBE 助手的检索底座。
Python向量检索自研框架
Agent / 工具调用

Weather MCP Server

基于美国国家气象局(NWS)API 写的一个 MCP 天气服务器,提供实时天气、详细预报和州级天气预警查询。

特点
标准 MCP 协议,可被 Cursor、Cline 等 AI 客户端直接调用,支持多种日期格式。
验证
打通了"让 AI 通过 MCP 调用外部真实 API"的完整链路。
扩展
把更多自己常用的 API 包成 MCP 工具,喂给助手用。
PythonMCPhttpx
模型微调 / 训练

DeepSpeed 训练与微调练习

用 DeepSpeed 跑大模型的分布式训练与微调,练习训练侧的工程链路。

特点
关注 ZeRO 显存优化、多卡并行等训练工程问题。
验证
理解了在有限算力下训练 / 微调大模型的取舍与配置。
扩展
结合 LoRA 等轻量微调,对小模型做领域适配。
PythonDeepSpeed分布式训练
LLM 应用

OpenAI-Translator · PDF 整书翻译

用 GPT-3.5 / ChatGLM 把英文 PDF 书整本翻译成中文,采用模块化、面向对象的设计。

特点
支持多模型切换、灵活配置,尽量保留原文排版结构。
验证
体会了把 LLM 封装成一个"真能用的工具"所需的工程化。
扩展
加术语表、双语对照和批量处理。
PythonGPT / ChatGLM

05 · AICUBE 助手

AICUBE 助手 · 我的私人 AI 魔方

AICUBE 助手是我已经落地在用的一套个人助手,基于开源框架 OpenClaw(小龙虾)搭建, 跑在一个叫「AICUBE」的飞书群里、装进我自己的手机。我把它拆成几个"专职"小助手,各管一摊、还会互相搭档, 每天自动帮我盯着 AI 圈的动态。下面是它们在飞书里的真实截图。

AI 新闻员在飞书里的自我介绍

AI 新闻员 · 自我介绍

定位「AI 行业雷达 + 新闻过滤器」:每天嗅探大模型发布、产品更新、公司动态,先过滤、再提炼、划重点。

AI 新闻员每日 AI 新闻速递

AI 新闻员 · 每日速递

把当天 AI 圈最值得看的动态整理成一条条简报,自动推送到飞书,省去自己刷信息流。

AI 学术员在飞书里的自我介绍

AI 学术员 · 自我介绍

追踪 AI 学术前沿、解读重要论文,把复杂成果讲成自己能看懂的分析。

AI 学术员每周 AI 学术速递

AI 学术员 · 每周速递

每日论文速递 + 每周精选深读 1-2 篇重磅,按需还能做专题文献综述。

AI 新闻员与 AI 学术员在飞书里互相搭档

两个助手还会"互相搭档"

遇到学术问题优先交给 AI 学术员、行业新闻交给 AI 新闻员,它们会自己认领、避免抢答。底层基于 OpenClaw 框架,模型用的是 DeepSeek 系列,全部跑在个人飞书 / 手机上,纯自用、不对外开放。

编程开发

Cursor

AI 原生代码编辑器,基于 VS Code,Agent 模式能跨文件改代码、跑命令,生态成熟。

Claude Code

Anthropic 的命令行编程工具,在终端里让 Claude 读懂并改动整个代码库。

Trae

字节跳动的 AI 原生 IDE(基于 VS Code),含 Chat / Builder / SOLO 模式,中文体验好,国内版内置模型免费。

桌面端 Agent

Codex

OpenAI 的编程 / 软件工程 Agent,自然语言驱动写改代码、跑测试,有 CLI 与桌面形态。

Claude(桌面端 / Cowork)

Anthropic 的桌面客户端,把 Claude 的对话能力和本地工作流、任务结合起来。

Coze 扣子

字节跳动的一站式 AI 智能体开发平台,拖拽工作流、挂插件与知识库,可发布到飞书 / 微信等。

ZCode

智谱的智能体开发环境(ADE),围绕 GLM 做长程开发任务,支持手机 / 飞书远程推进。

Kimi Work

月之暗面的桌面端通用 Agent,可操作本地文件 / 浏览器,多 Agent 并行、定时任务,偏办公与研报。

AI 搜索 / 知识库

秘塔 Metaso

无广告的生成式 AI 搜索,直接给结构化答案并标注来源,适合查资料、做调研。

个人知识库工具

Obsidian / Notion 等加上 AI 的笔记与知识库工具,用来沉淀和检索自己的资料。

现象级开源项目关注

OpenClaw 🦞

个人助手

开源的个人 AI 助手框架,跨平台、可接 IM,我的 AICUBE 助手就基于它搭建。

LangChain

应用框架

构建 LLM 应用的经典框架,把模型、工具、记忆和检索串成可编排的链路。

更多 Agent / Coding 项目

持续关注

各类现象级的 Agent、Coding 开源项目,看它们怎么设计、能不能拿来自己改用。

* 以上简介整理自 AI-bot 等 AI 工具导航站及各产品官方资料,仅作个人收藏与学习记录,不代表使用推荐。

RAG

个人知识库做 RAG 的经验和坑

  • 分块别太大也别太小:512–1024 token、留 10–15% 重叠,通常比整页塞进去好。
  • 先把"召回"调准再谈"生成":检索不对,模型再强也白搭。
  • 加重排:向量召回 top 20 → reranker 选 top 3–5,准确率明显提升。
  • 中文优先选中文友好的 embedding(如 bge / m3e),英文模型套中文会掉点。
  • 让回答带来源引用,既能验证又能压住"一本正经地编"。
Prompt

我常用的提示词套路

  • 四件套:角色 + 任务 + 约束 + 输出格式,基本够用。
  • 让它"先想再答"(先列要点/步骤再给结论),复杂任务更稳。
  • 给一两个正反例(few-shot),比堆一堆形容词管用。
  • 要结构化结果就直接要 JSON / 表格,并写清字段含义。
  • 长任务把"验收标准"写进去,让它自己对照检查。
工具流

从资料到笔记:我的信息提取工作流

  • 一次只处理一个主题,先按主题分好文件夹。
  • 第一遍让 AI 出:摘要 + 关键结论 + 关键数据(带出处)+ 待确认问题。
  • 关键数据人工核对后再入库——AI 会编数字。
  • 统一笔记模板:来源 / 日期 / 三句话总结 / 我的判断。
  • 定期回顾,把零散笔记合并成主题页。
本地模型

在自己机器上跑开源模型

  • 起步最快:Ollama / LM Studio,一条命令拉起来。
  • 显存不够就用量化(Q4_K_M 这类),7B 量化版消费级显卡能跑。
  • 7B 适合日常问答/总结;写代码、复杂推理还是上更大的或用云端。
  • 本地模型的价值是隐私和离线,别指望它打过云端旗舰。
  • 上下文别拉满,太长会明显变慢、变"笨"。

* 以上为本人学习实践中的个人经验总结,仅供自己参考记录。