当前位置 huginn scenarios 正文 下一篇:

【干货】如何高效地订阅微信公众号

作者 翔215

http://www.jianshu.com/p/582ad1400d6e

微信已然成了国内最流行的社交软件,甚至成了人们的一种生活方式,依托于这个平台的微信公众号自然是新媒体传播的最佳途径,是获取资讯的最佳场所,有很多优质的微信公众号都是值得订阅的。但是,在微信内订阅与阅读公众号文章的体验却是极差的,这个我想大家应该都是有目共睹的。

微信公众号订阅

本文会介绍大家几种订阅微信公众号的绝佳方法,相信总有一款是适合你的。为了衡量这些方法的优缺点,我会使用下面三个公众号进行测试:

  • warfalcon:刘洋老师的个人微信公共号,著名的博客写手,主要是分享一些关于学习以及生活的思考,粉丝较多;
  • 木西AlexanDENG:邓楠的个人微信公众号,著名的青年商业摄影师,主要是分享一些关于摄影的干货,在圈内粉丝较多;
  • MXPRESSO:一个好朋友公司的微信公众号,主要是分享一些关于咖啡与生活的文章,粉丝数不清楚。

1. 即刻APP

在聚合类APP里,我觉得即刻做得是最棒的。我是从2015年开始使用这个APP的,应该是最早的那批用户,从刚开始只有一些人工筛选的主题到现在用户可以自定义主题,即刻的功能越来越强大,我在之前的文章中就安利过多次。在3.0版本以后,即刻加入了自定义主题功能,用户可以通过APP提供的追踪机器人创建自定义主题(提醒),这个功能的加入让我对这个APP更加刮目相看,因为这个功能在别的APP中是找不到的。

即刻的追踪机器人

即刻提供的追踪机器人中就有公众号文章更新这个机器人,通过它就可以订阅微信公众号,创建一个关于公众号的自定义主题,微信公众号更新文章以后,就可以收到提醒,在即刻APP里阅读,而且创建的自定义主题还可以分享给其他人使用,通过审核后的主题还会被系统推荐给其他人使用。我测试了上面的三个微信公众号,都可以通过这种方式来订阅,如果你经常使用即刻的话,这种订阅方式是再适合不过的啦。

2. 轻芒阅读APP

轻芒阅读是另一款信息聚合类APP,就是以前的豌豆荚一览,现在已经从豌豆荚里分离出来了。在这个APP里可以阅读一些应用以及公众号的文章,使用体验很不错,高效且优雅。我搜索了上面的三个公众号,没有搜索到MXPRESSO,可能是因为没有收录吧。在内容更新上,Warfarcon的文章都有更新,包括前天的文章,但是木西AlexanDENG中昨天发布的文章就没有更新。

轻芒阅读

3. 一览

一览是一款国内的RSS阅读器(免费版只支持系统提供的数据源),支持订阅微信公众号和知乎,还可以将文章推送至Kindle,有网页版和APP客户端。我再次测试了一下上面的三个公众号,很遗憾,只能搜到Warfalcon,其他两个公众号都没有收录。在内容更新上,warfarcon五月份发布的文章暂时没有更新。

4. RSS+Huginn

我在【干货】信息大爆炸时代,该如何高效阅读中就介绍过将微信公众号转化成RSS的方法,推荐了大家使用微广场,但是,最近微广场正式关闭,这个方法已经彻底失效,甚至,连微口网这种提供摘要型RSS的方法都已经失效了。我在网上重新搜索了一下,貌似还有今天看啥还在提供RSS服务,但好像也是个人提供的付费服务,不知道能坚持到什么时候。因此,为了应对这种情况,我不得不祭出大招-Huginn,这也是我一直在推崇的方法,利用Huginn可以订阅一切网站的更新,当然也包括微信公众号,通过它,我们就可以将公众号变成RSS,而且更新速度快,阅读体验只取决于你的RSS阅读器(RSS阅读器的选择可依据你的喜好来)。

安装部署Huginn的方法请参见我前面的文章-Huginn 安装教程—建立你自己的 IFTTT,更多安装部署方法可参见我们的Huginn中文网。如果你想更深入地了解Huginn,请参见我之前的文章-使用 Huginn 打造自动化云端信息助手,或者来我们的论坛上进行交流。

下面我来详细说一下如何通过Huginn将微信公众号转化成RSS,因为Huginn必须依托网页源才能制作RSS,所以我们先要有获取微信公众号文章的网址,你可以使用已有的微信公众号聚合网站,比如,传送门启蒙,等等。但是,最全、更新最及时地莫过于搜狗微信,大部分聚合网站基本上也是通过爬搜狗微信获取公众号的全文,下面以将木西大神的木西AlexanDENG为例。

(1) 利用搜狗微信搜索想订阅的微信公众号

搜狗微信搜索结果

我们可以看到搜索获得的页面上就有最新文章的标题,我们只需要监控这个标题的变化就可以知道这个公众号有无更新,这里需要使用Huginn最常用的Website Agent,具体选项如下:

{
  "expected_update_period_in_days": "2",
  "url": [
    "http://weixin.sogou.com/weixin?type=1&query=%E6%9C%A8%E8%A5%BF+AlexanDENG&ie=utf8&_sug_=n&_sug_type_=&w=01019900&sut=2064&sst0=1470553392399&lkt=0%2C0%2C0"
  ],
  "type": "html",
  "mode": "on_change",
  "extract": {
    "title": {
      "css": "#sogou_vr_11002301_box_0 > dl:nth-child(3) > dd > a",
      "value": ".//text()"
    }
  }
}

url对应的是搜狗微信搜索微信公众号对应的搜索结果地址

(2) 获取最新文章对应的链接地址

在上面的Agent,我并没有直接获取对应文章的链接地址,因为微信全文对应的链接地址不是永久地址,如果也放到上面的Agent中的话,会导致无效的触发,继续使用Website Agent,具体选项如下:

{
  "expected_update_period_in_days": "2",
  "url": [
    "http://weixin.sogou.com/weixin?type=1&query=%E6%9C%A8%E8%A5%BF+AlexanDENG&ie=utf8&_sug_=n&_sug_type_=&w=01019900&sut=2064&sst0=1470553392399&lkt=0%2C0%2C0"
  ],
  "type": "html",
  "mode": "all",
  "extract": {
    "url": {
      "css": "#sogou_vr_11002301_box_0 > dl:nth-child(3) > dd > a",
      "value": "@href"
    }
  }
  `

(3) 获取公众号文章的全文

在获得最新文章对应的链接地址后,就可以获取文章的全文,下面继续使用 Website Agent 解析获得文章的全文,具体的选项如下:

{
  "expected_update_period_in_days": "2",
  "url_from_event": "{{url}}",
  "type": "html",
  "mode": "merge",
  "extract": {
    "title": {
      "css": "#activity-name",
      "value": "."
    },
    "fulltext": {
      "css": "#js_content",
      "value": "."
    }
  }
}

url对应的是上一个Agent获得的链接地址;mode模式选择merge,可以保留上一个Agent获得的url内容

(4) 输出RSS

最后,只需要使用 Data Output Agent 输出RSS即可,具体设置如下:

{
  "secrets": [
    "weixin"
  ],
  "expected_receive_period_in_days": 2,
  "template": {
    "title": "订阅微信公众号(木西AlexanDENG)",
    "description": "将微信公众号(木西AlexanDENG)输出RSS",
    "item": {
      "title": "{{title}}",
      "description": "{{fulltext|regex_replace:'data-src','src'}}",
      "link": "{{url}}"
    }
  }
}

需要注意的是,公众号全文中的Html并非标准的Html,要将其中的data-src 全部替换成src,否则输出的RSS中图片无法正常显示

将微信公众号制作成RSS

通过上面的设置,你就可以在你的Data Output Agent 界面的Summary上获得对应的RSS地址,将这个RSS地址放进你的RSS阅读器吧!!!

如果你不想一步一步地进行设置,你可以直接把这个文件导入Scenarios中,即可获得木西AlexanDENG对应的RSS地址;你只需要将前两步中的url换成你想订阅的微信公众号在搜狗微信中对应的搜索结果地址即可

因为搜狗上有反爬虫机制,所以你的Agent的触发间隔最好长一点,像木西大神的这个公众号最多一天也就更新一篇文章,因此我就设置成了一天触发一次。如果你想将触发间隔设置短一些,又不会触发到反爬虫机制,你可以使用Phantomjscloud提供的API,借助云端模拟浏览器进行爬取,这个方式是最棒的。最新版本的Huginn可以直接使用 Phantom Js Cloud Agent,老版本的Huginn可参见这篇教程-Browser Emulation Using PhantomJs Cloud

5. 总结

总结一下上面提供的四种方法:

  • 即刻APP:可更新几乎所有的微信公众号,更新速度快,即刻用户强推;
  • 轻芒阅读APP:收录的微信公众号较多,更新速度一般,阅读体验好,可考虑使用;
  • 一览:主要收录了一些热门的微信公众号,不同公众号的更新速度不一样,可以推送到Kindle上阅读,Kindle用户可以考虑一下;
  • RSS+Huginn:搜狗微信上有的公众号都可以制作成RSS,更新速度可设置,阅读体验取决于使用的RSS阅读器,爱折腾的用户强推。

不知道上面这几种方法有没有适合你的,有任何不明白的或好的想法,随时欢迎与我交流。

 

 

发表回复

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部