用RPA订阅1000+独立博客
写了个影刀 RPA 应用,自动化订阅了 1000+的个人博客 RSS。
最近开始热衷于看大佬们的个人博客,但是总感觉不够看,所以开始在一个喜欢看的博主的友链中开始查找更多的博客,后来在 GitHub 上发现了一个宝藏项目:中文独立博客列表,里面汇集了大量高质量的独立博客,比如王垠的博客、王登科-DK博客、MacTalk-池建强的随想录等,我建了一个浏览器的文件夹,收藏了那些我喜欢看的博客地址。但是随着我收藏的博客越来越多,我已经没办法每次都手动打开去找有没有更新了,然后了解到 RSS 技术可以订阅喜欢的博主,可以聚合看到所有喜欢的博主的更新,尝试搭建了自己的 RSS 服务。
尝试 RSS技术:RSSHub 与 InoReader
订阅博客是把博客的RSS地址注册给后端服务,后端服务会定时的爬取新的博文,然后可以在客户端上看到新爬取的博文。简单说是一个 cs 架构的服务,需要一个服务端和一个客户端。我选择的方案是 RSSHub 和InoReader 的组合。刚好我有一台阿里云服务器,跟着教程终于把服务跑起来了。服务起来以后,我就开始非常毫无节制的订阅各路神仙的博客,等我手动定于了 30多个之后,发现这是个体力活。因为需要重复操作这个订阅的过程,每次变化的只有一个订阅地址,于是我打算写一个 RPA 流程去自动订阅。
自动化:用影刀 RPA 实现自动化订阅
虽然我在影刀工作,也经常看用户写的自动化流程,这还是第一次写 RPA 来解决我自己的痛点。因为需求很简单,社区版账户也完全够用。搭建的过程如下:
- 环境准备:在浏览器中安装 InoReader 插件,并将其固定(Pin)到工具栏,方便 RPA 模拟点击。
- 获取数据源:使用打开网页指令,定位到 GitHub 的博客列表页面。
- 批量提取链接:利用获取相似元素列表指令,一键将页面上所有的博客 URL 提取出来。
- 数据存储:将提取到的上千个博客地址,临时保存到本地 TXT 文件或 Excel 数据表格中,作为后续循环的输入源。
- 循环执行订阅操作:
对于列表中的每一个博客链接,执行以下流程:
- 打开博客网页。
- 模拟鼠标悬停(Hover)至 InoReader 插件图标。
- 点击图标,并等待“+”号订阅按钮出现。
- 点击“+”号,并等待“√”号出现以确认订阅成功。(💡 避坑指南:这里强烈建议加上
try-catch异常捕获机制,处理某些博客加载过慢或无法订阅导致的等待超时情况,防止整个脚本卡死。) - 关闭当前网页,清空缓存。
- 循环进入下一个博客地址。
看着屏幕上鼠标自动飞速运转,几行脚本帮我省下了几个小时的机械劳动。这大概就是程序员最大的快乐吧——把节省下来的时间,拿去多写两行代码。