我用 Cloudflare 免费搭了一套 AI 内容流水线，真的能跑起来

每天看那么多信息，真正的问题往往不是“没东西可看”，而是：

收藏了一堆，回头根本找不到
想做周刊，靠手工复制粘贴根本坚持不下去
明明有很多素材，却始终没有一套能稳定运转的内容工作流

这几年大家聊 AI，聊得最多的是“生成能力”。

但对个人创作者、研究者，甚至做行业观察的人来说，真正能拉开差距的，很多时候不是模型本身，而是你有没有把 信息抓取、清洗、摘要、归档、发布 这条链路自动化。

如果这条链路还是手工的，再强的模型也只是一个高级翻译器。

如果这条链路跑顺了，你就等于给自己搭了一个不会下班的编辑部。

这篇文章讲的，就是这样一套系统：

不用自己买服务器，不额外掏月租，直接用 Cloudflare 免费套餐，把“AI 科技周刊自动生成器”拼起来。

它每天自动抓信息、自动做中文整理、自动入库、自动变成网页。你要做的，不再是每天重复劳动，而是定义你想看什么、想产出什么。

这套东西当然不只适合做周刊。

你也可以把它改造成：

个人第二大脑的信息流入口
某个垂直行业的资讯聚合站
给自己准备的研究材料池
甚至是团队内部的轻量知识分发系统

Cloudflare AI 内容流水线封面图

先看全局：这套“AI 内容流水线”到底在干嘛

如果你把它拆开看，其实就 5 个动作：

去外面抓内容
让 AI 先读一遍
把原始资料和整理结果分开存
把结构化内容塞进数据库
再把数据库里的内容渲染成网页

Cloudflare 的好处在于，这 5 件事它家刚好都有现成积木。

对应关系非常清楚：

Workers + Cron 负责定时抓内容。你可以把它理解成“打工人 + 闹钟”。
Workers AI 负责先做一轮中文整理。比如摘要、分类、推荐理由、标签。
R2 负责存大块头资料。像原始 JSON、封面图、网页快照，都适合放这里。
D1 负责存结构化结果。文章标题、链接、摘要、标签，放进数据库以后，后面就很好调。
Pages 负责对外展示。把内容变成一个公开可访问的网站。

换句话说，这套系统不是“Cloudflare 很能打”的展示，而是：

你用一套免费基础设施，把“抓取 -> AI 提炼 -> 存储 -> 发布”接成了一个完整闭环。

这才是重点。

Cloudflare 五件套在内容流水线里的分工

Step 1：先让 Worker 每天按时去打工

整条链路里，第一件必须稳定的事不是 AI，而是抓取。

因为如果入口不稳定，后面所有自动化都会变成空转。

这里最合适的组合就是：

Workers 负责执行
Cron 负责定时

你可以把它理解成：每天固定时间，Cloudflare 边缘节点上有个小工人，会自动出去帮你收集今天的素材。

这个阶段不要一上来就追求复杂。

最小可用版本只要做到两件事：

能定时触发
能稳定抓回一批你指定的信息源

比如：

Hacker News
一组 RSS
你长期关注的行业站点

这一步一旦跑顺，你就已经跨过了“手动去找内容”的门槛。

很多人做到这里会第一次意识到：

原来最值钱的不是“有 AI”，而是 AI 开始接到持续稳定的上游输入。

Step 2：让 AI 先替你读一遍

信息抓回来之后，如果还是一堆英文标题和链接，那离“可消费内容”还差得很远。

这时候，Workers AI 才真正开始发挥作用。

它的意义不是炫技，而是先替你做掉最消耗注意力的那一层：

中文摘要
基础翻译
标签分类
推荐理由
主题归档

这一步你完全可以先从“轻处理”开始。

也就是说，不一定一上来就抓全文、做超长总结。你先让模型基于：

标题
链接
一小段描述

做第一轮中文整理，就已经能显著降低后续人工筛选的成本了。

如果后面你想升级，再往下加：

正文抽取
深度总结
多维分类
垂直主题重写

这套结构也是成立的。

真正关键的是，你得先接受一个思路：

AI 在这条流水线里，不是“最后出稿的人”，而是“第一轮编辑”。

这个定位非常重要。

因为它决定了你后面怎么设计 prompt、怎么控成本、怎么拆任务。

你不是让 AI 一次性写完全部内容，而是先让它把一堆嘈杂原料，变成可管理、可筛选、可归档的中间层。

Workers AI 作为内容提炼层

Step 3：原始资料别乱塞，R2 专门用来装“大东西”

一旦开始自动抓内容，你很快就会遇到一个问题：

不是所有东西都适合丢进数据库。

比如：

原始抓取下来的长 JSON
文章配图
网页快照
以后要做回溯分析的原始数据

这些内容如果直接塞进 D1，会显得很笨重。

这时候 R2 就特别顺手。

它更像是你的原始素材仓库。

数据库里只放“整理过、结构化、方便检索”的东西；R2 里放“以后可能还要回头用，但现在不适合进数据库”的大对象。

这一层很多人会忽略，但它其实很重要。

因为一旦你后面想做：

历史回溯
数据复算
不同 prompt 重新处理旧资料
给前端补图

有没有一层原始资料存档，差别非常大。

可以把它理解成：

D1 是账本
R2 是仓库

账本记条目，仓库放货物。

Step 4：真正有用的内容，最后都应该落进 D1

到了这一步，整条流水线才真正开始“有产出”。

因为前面不管是抓取、翻译、摘要，还是分类，最终都要落成结构化数据，不然你后面没法做展示，也没法做检索。

这就是 D1 的价值。

它很轻，够用，而且足够适合这类个人内容系统。

放进去的字段也很直白：

标题
原始链接
中文摘要
推荐理由
标签
时间戳
来源

如果你想做得更完整一点，还可以继续加：

分类
封面图地址
原文快照地址
是否推荐
人工二次编辑状态

一旦这些数据结构化了，你就不再只是“攒了一堆文章”，而是拥有了一套随时可以被前端调用、被筛选、被重组、被二次加工的内容底座。

这时候你做周刊，和以前最大的不同是：以前你每周都在重新干一遍重复劳动。现在你是在 消费一条已经在后台持续运转的数据流。

这就是工作流和工具的本质区别。

Step 5：最后用 Pages 把它变成一个真的网站

很多自动化项目最后都死在这里：

后台流程是跑通了，但结果没人看，也没法用。

所以最后一步一定得补上：把 D1 里的内容公开展示出来。

Cloudflare Pages 刚好适合干这个事。

它让这套系统有了一个“门面”。

你可以做得很简单：

一个列表页
一些标签筛选
一点基础的前端样式

也可以做得更完整：

分类页
时间轴
搜索
推荐位
周刊归档页

重点不在于前端多花哨，而在于：

你的自动化流程终于有了一个稳定出口。

内容不再只是数据库里的一堆记录，而是一个别人真的能访问、能阅读、能传播的页面。

一旦到了这一步，这套系统就从“个人小玩具”开始往“真正的内容产品”靠了。

D1 与 Pages 把数据变成可读网站

这套东西为什么值钱：它不是帮你省 10 分钟，而是帮你摆脱重复劳动

很多人会低估这种流水线的价值，因为表面看起来，它只是在帮你：

自动抓文
自动翻译
自动做摘要
自动发网页

但真正的收益不是“节省几个动作”，而是：

你终于不用每周重新做一次一样的事。

这点非常关键。

因为创作者最容易被消耗掉的，不是灵感，而是重复劳动。

你每周都手动复制粘贴、翻译、整理、分类、排版，很快就会烦。一烦，这个系统就停。一停，内容积累也停。

而自动化流水线真正解决的是：它把那些不值得你反复亲自做的动作，从你的工作记忆里拿走了。

你可以把精力放回更值得做的地方：

选题判断
观点输出
深度评论
最终呈现

说白了，这套系统不是替代创作，而是把“创作前那堆低价值准备动作”自动化。

免费额度到底够不够：对个人项目，通常够起步

大多数人最担心的不是能不能搭，而是搭完会不会开始持续烧钱。

这个担心完全合理。

但如果你做的是个人项目，或者一个规模不大的内容流自动化，Cloudflare 免费套餐通常是够你起步的。

核心原因有两个：

这类内容流水线的频率，本来就不需要高到夸张
真正消耗资源的环节，主要集中在抓取量和 AI 调用量，而这两项都可以控

比如你一天只处理几十篇内容：

定时抓取压力不大
数据库存储压力不大
前端访问量也不至于高得离谱

真正需要你提前想清楚的，是两个地方：

你一天准备抓多少内容
你给 AI 喂多长的文本

如果你一上来就：

全文抓取
长摘要
高频跑批
还想做 embedding 和语义搜索

那成本当然会上去。

所以最好的策略不是一开始就全开，而是：

先做最小可用版本，再逐步加功能。

真的想把它跑稳，最值得提前防的 4 个坑

1. 不要一批抓太多，Cron 很容易超时

免费版最大的现实限制，不是“不能用”，而是不能太贪。

如果你一次性抓很多篇文章，再每篇都让 AI 深度处理，很容易把一次任务跑得太重。

更稳的做法通常是：

少量多次
分批抓取
把抓取和 AI 处理拆开

也就是把“一个大任务”，拆成多个更短、更轻、更容易成功的小任务。

2. 模型别一上来就选最重的

在这类流水线里，模型不是拿来写史诗长文的。

它更像流水线上的整理工。

所以优先考虑：

小一点
快一点
成本更低

够用，往往比最强更重要。

3. 如果后面要做搜索，最好早点考虑向量层

当你的内容开始积累，后面很自然会想要一个功能：

不是按关键词搜，而是按意思搜。

这时候你就会开始需要 embedding 和向量检索。

所以如果你一开始就知道自己以后会做“语义搜索”或者 RAG，最好在数据结构上提前留位置，不然后面会补得比较痛苦。

4. 邮件分发不是“顺手加一下”那么简单

很多人做到网页之后，下一步就想做成邮件版周刊。

这当然是合理的，但邮件不是一个顺手勾选的功能。

它会牵扯到：

发信能力
模板
发送稳定性
退订逻辑
账号可用权限

所以建议把它当成第二阶段，不要和第一版一起上。

这套系统最迷人的地方，是你真的能一个人拼出一个小编辑部

回头看这条链路，其实非常有代表性。

从抓取，到 AI 清洗，到存储，到展示，你并没有做什么惊天动地的工程。

但你做成了一件很重要的事：

把原本需要人手反复执行的信息处理流程，变成了一条能自己转起来的流水线。

这件事的意义，远远大于“又搭了一个 AI demo”。

因为它开始真的接管工作。

它开始在你睡觉的时候抓内容，在你不看屏幕的时候做第一轮整理，在你还没打开后台的时候把数据已经准备好。

你再上场的时候，不再是从零开始，而是在一个已经被整理过的现场里工作。

这就是 AI 和 Serverless 真正结合起来之后，最让人上瘾的地方：

不是更炫，而是更省命。

最后一句话总结

这套 Cloudflare 内容流水线真正厉害的地方，不是“免费”，也不是“用了几个 AI 服务”，而是它把个人创作者最容易放弃的那部分重复劳动，真正自动化了。一旦抓取、整理、存储、发布这条链路自己跑起来，你手里的内容系统就不再是临时项目，而会慢慢长成一个能持续产出的基础设施。