我用 Cloudflare 免费搭了一套 AI 内容流水线,真的能跑起来
真正卡住个人创作者的,从来不是没有内容,而是没有一套能持续运转的自动化工作流。用 Cloudflare 的免费服务,把抓取、摘要、分类、存储和发布串起来,一个人也能搭出自己的 AI 周刊工厂。
每天看那么多信息,真正的问题往往不是“没东西可看”,而是:
- 收藏了一堆,回头根本找不到
- 想做周刊,靠手工复制粘贴根本坚持不下去
- 明明有很多素材,却始终没有一套能稳定运转的内容工作流
这几年大家聊 AI,聊得最多的是“生成能力”。
但对个人创作者、研究者,甚至做行业观察的人来说,真正能拉开差距的,很多时候不是模型本身,而是你有没有把 信息抓取、清洗、摘要、归档、发布 这条链路自动化。
如果这条链路还是手工的,再强的模型也只是一个高级翻译器。
如果这条链路跑顺了,你就等于给自己搭了一个不会下班的编辑部。
这篇文章讲的,就是这样一套系统:
不用自己买服务器,不额外掏月租,直接用 Cloudflare 免费套餐,把“AI 科技周刊自动生成器”拼起来。
它每天自动抓信息、自动做中文整理、自动入库、自动变成网页。你要做的,不再是每天重复劳动,而是定义你想看什么、想产出什么。
这套东西当然不只适合做周刊。
你也可以把它改造成:
- 个人第二大脑的信息流入口
- 某个垂直行业的资讯聚合站
- 给自己准备的研究材料池
- 甚至是团队内部的轻量知识分发系统

先看全局:这套“AI 内容流水线”到底在干嘛
如果你把它拆开看,其实就 5 个动作:
- 去外面抓内容
- 让 AI 先读一遍
- 把原始资料和整理结果分开存
- 把结构化内容塞进数据库
- 再把数据库里的内容渲染成网页
Cloudflare 的好处在于,这 5 件事它家刚好都有现成积木。
对应关系非常清楚:
-
Workers + Cron负责定时抓内容。你可以把它理解成“打工人 + 闹钟”。 -
Workers AI负责先做一轮中文整理。比如摘要、分类、推荐理由、标签。 -
R2负责存大块头资料。像原始 JSON、封面图、网页快照,都适合放这里。 -
D1负责存结构化结果。文章标题、链接、摘要、标签,放进数据库以后,后面就很好调。 -
Pages负责对外展示。把内容变成一个公开可访问的网站。
换句话说,这套系统不是“Cloudflare 很能打”的展示,而是:
你用一套免费基础设施,把“抓取 -> AI 提炼 -> 存储 -> 发布”接成了一个完整闭环。
这才是重点。

Step 1:先让 Worker 每天按时去打工
整条链路里,第一件必须稳定的事不是 AI,而是抓取。
因为如果入口不稳定,后面所有自动化都会变成空转。
这里最合适的组合就是:
Workers负责执行Cron负责定时
你可以把它理解成:每天固定时间,Cloudflare 边缘节点上有个小工人,会自动出去帮你收集今天的素材。
这个阶段不要一上来就追求复杂。
最小可用版本只要做到两件事:
- 能定时触发
- 能稳定抓回一批你指定的信息源
比如:
- Hacker News
- 一组 RSS
- 你长期关注的行业站点
这一步一旦跑顺,你就已经跨过了“手动去找内容”的门槛。
很多人做到这里会第一次意识到:
原来最值钱的不是“有 AI”,而是 AI 开始接到持续稳定的上游输入。
Step 2:让 AI 先替你读一遍
信息抓回来之后,如果还是一堆英文标题和链接,那离“可消费内容”还差得很远。
这时候,Workers AI 才真正开始发挥作用。
它的意义不是炫技,而是先替你做掉最消耗注意力的那一层:
- 中文摘要
- 基础翻译
- 标签分类
- 推荐理由
- 主题归档
这一步你完全可以先从“轻处理”开始。
也就是说,不一定一上来就抓全文、做超长总结。你先让模型基于:
- 标题
- 链接
- 一小段描述
做第一轮中文整理,就已经能显著降低后续人工筛选的成本了。
如果后面你想升级,再往下加:
- 正文抽取
- 深度总结
- 多维分类
- 垂直主题重写
这套结构也是成立的。
真正关键的是,你得先接受一个思路:
AI 在这条流水线里,不是“最后出稿的人”,而是“第一轮编辑”。
这个定位非常重要。
因为它决定了你后面怎么设计 prompt、怎么控成本、怎么拆任务。
你不是让 AI 一次性写完全部内容,而是先让它把一堆嘈杂原料,变成可管理、可筛选、可归档的中间层。

Step 3:原始资料别乱塞,R2 专门用来装“大东西”
一旦开始自动抓内容,你很快就会遇到一个问题:
不是所有东西都适合丢进数据库。
比如:
- 原始抓取下来的长 JSON
- 文章配图
- 网页快照
- 以后要做回溯分析的原始数据
这些内容如果直接塞进 D1,会显得很笨重。
这时候 R2 就特别顺手。
它更像是你的原始素材仓库。
数据库里只放“整理过、结构化、方便检索”的东西;R2 里放“以后可能还要回头用,但现在不适合进数据库”的大对象。
这一层很多人会忽略,但它其实很重要。
因为一旦你后面想做:
- 历史回溯
- 数据复算
- 不同 prompt 重新处理旧资料
- 给前端补图
有没有一层原始资料存档,差别非常大。
可以把它理解成:
D1是账本R2是仓库
账本记条目,仓库放货物。
Step 4:真正有用的内容,最后都应该落进 D1
到了这一步,整条流水线才真正开始“有产出”。
因为前面不管是抓取、翻译、摘要,还是分类,最终都要落成结构化数据,不然你后面没法做展示,也没法做检索。
这就是 D1 的价值。
它很轻,够用,而且足够适合这类个人内容系统。
放进去的字段也很直白:
- 标题
- 原始链接
- 中文摘要
- 推荐理由
- 标签
- 时间戳
- 来源
如果你想做得更完整一点,还可以继续加:
- 分类
- 封面图地址
- 原文快照地址
- 是否推荐
- 人工二次编辑状态
一旦这些数据结构化了,你就不再只是“攒了一堆文章”,而是拥有了一套随时可以被前端调用、被筛选、被重组、被二次加工的内容底座。
这时候你做周刊,和以前最大的不同是:以前你每周都在重新干一遍重复劳动。现在你是在 消费一条已经在后台持续运转的数据流。
这就是工作流和工具的本质区别。
Step 5:最后用 Pages 把它变成一个真的网站
很多自动化项目最后都死在这里:
后台流程是跑通了,但结果没人看,也没法用。
所以最后一步一定得补上:把 D1 里的内容公开展示出来。
Cloudflare Pages 刚好适合干这个事。
它让这套系统有了一个“门面”。
你可以做得很简单:
- 一个列表页
- 一些标签筛选
- 一点基础的前端样式
也可以做得更完整:
- 分类页
- 时间轴
- 搜索
- 推荐位
- 周刊归档页
重点不在于前端多花哨,而在于:
你的自动化流程终于有了一个稳定出口。
内容不再只是数据库里的一堆记录,而是一个别人真的能访问、能阅读、能传播的页面。
一旦到了这一步,这套系统就从“个人小玩具”开始往“真正的内容产品”靠了。

这套东西为什么值钱:它不是帮你省 10 分钟,而是帮你摆脱重复劳动
很多人会低估这种流水线的价值,因为表面看起来,它只是在帮你:
- 自动抓文
- 自动翻译
- 自动做摘要
- 自动发网页
但真正的收益不是“节省几个动作”,而是:
你终于不用每周重新做一次一样的事。
这点非常关键。
因为创作者最容易被消耗掉的,不是灵感,而是重复劳动。
你每周都手动复制粘贴、翻译、整理、分类、排版,很快就会烦。一烦,这个系统就停。一停,内容积累也停。
而自动化流水线真正解决的是:它把那些不值得你反复亲自做的动作,从你的工作记忆里拿走了。
你可以把精力放回更值得做的地方:
- 选题判断
- 观点输出
- 深度评论
- 最终呈现
说白了,这套系统不是替代创作,而是把“创作前那堆低价值准备动作”自动化。
免费额度到底够不够:对个人项目,通常够起步
大多数人最担心的不是能不能搭,而是搭完会不会开始持续烧钱。
这个担心完全合理。
但如果你做的是个人项目,或者一个规模不大的内容流自动化,Cloudflare 免费套餐通常是够你起步的。
核心原因有两个:
- 这类内容流水线的频率,本来就不需要高到夸张
- 真正消耗资源的环节,主要集中在抓取量和 AI 调用量,而这两项都可以控
比如你一天只处理几十篇内容:
- 定时抓取压力不大
- 数据库存储压力不大
- 前端访问量也不至于高得离谱
真正需要你提前想清楚的,是两个地方:
- 你一天准备抓多少内容
- 你给 AI 喂多长的文本
如果你一上来就:
- 全文抓取
- 长摘要
- 高频跑批
- 还想做 embedding 和语义搜索
那成本当然会上去。
所以最好的策略不是一开始就全开,而是:
先做最小可用版本,再逐步加功能。
真的想把它跑稳,最值得提前防的 4 个坑
1. 不要一批抓太多,Cron 很容易超时
免费版最大的现实限制,不是“不能用”,而是不能太贪。
如果你一次性抓很多篇文章,再每篇都让 AI 深度处理,很容易把一次任务跑得太重。
更稳的做法通常是:
- 少量多次
- 分批抓取
- 把抓取和 AI 处理拆开
也就是把“一个大任务”,拆成多个更短、更轻、更容易成功的小任务。
2. 模型别一上来就选最重的
在这类流水线里,模型不是拿来写史诗长文的。
它更像流水线上的整理工。
所以优先考虑:
- 小一点
- 快一点
- 成本更低
够用,往往比最强更重要。
3. 如果后面要做搜索,最好早点考虑向量层
当你的内容开始积累,后面很自然会想要一个功能:
不是按关键词搜,而是按意思搜。
这时候你就会开始需要 embedding 和向量检索。
所以如果你一开始就知道自己以后会做“语义搜索”或者 RAG,最好在数据结构上提前留位置,不然后面会补得比较痛苦。
4. 邮件分发不是“顺手加一下”那么简单
很多人做到网页之后,下一步就想做成邮件版周刊。
这当然是合理的,但邮件不是一个顺手勾选的功能。
它会牵扯到:
- 发信能力
- 模板
- 发送稳定性
- 退订逻辑
- 账号可用权限
所以建议把它当成第二阶段,不要和第一版一起上。
这套系统最迷人的地方,是你真的能一个人拼出一个小编辑部
回头看这条链路,其实非常有代表性。
从抓取,到 AI 清洗,到存储,到展示,你并没有做什么惊天动地的工程。
但你做成了一件很重要的事:
把原本需要人手反复执行的信息处理流程,变成了一条能自己转起来的流水线。
这件事的意义,远远大于“又搭了一个 AI demo”。
因为它开始真的接管工作。
它开始在你睡觉的时候抓内容,在你不看屏幕的时候做第一轮整理,在你还没打开后台的时候把数据已经准备好。
你再上场的时候,不再是从零开始,而是在一个已经被整理过的现场里工作。
这就是 AI 和 Serverless 真正结合起来之后,最让人上瘾的地方:
不是更炫,而是更省命。
最后一句话总结
这套 Cloudflare 内容流水线真正厉害的地方,不是“免费”,也不是“用了几个 AI 服务”,而是它把个人创作者最容易放弃的那部分重复劳动,真正自动化了。 一旦抓取、整理、存储、发布这条链路自己跑起来,你手里的内容系统就不再是临时项目,而会慢慢长成一个能持续产出的基础设施。