我发现之前的papers with code的非官方rss源用不了…
我发现papers with code的rss源在国内被墙了(因为他使用了google severless服务去创建的源,所以是host在谷歌的服务器上,墙的只是rss,papers with code并没有被墙)。好在原作者是在github上公开了他用的代码,所以我们可以直接抄然后用github action去整个自己的rss源,刚好最近还有别的事需要我去用GitHub Action,可以先当练手。
papers with code是没有官方rss源的,虽然提供了邮件订阅但那太不geeeeek了。
这边撞了两个墙:第一个是原作者用的hext包只有mac和linux的distribution,这个没什么关系,我们用beautifulsoup把那部分代码改一下就好,这个按下不表,如果后面有需要的话可以试着去复制他原来的爬虫规则;第二个是github action除了一些入门教程和文档之外有一些需要注意的地方。
- 平时在开发的时候都另开虚拟环境,一方面不太容易乱,一方面也可以保证自己之后生成requirements.txt的时候会简洁一点。
- github action会运行在工作环境中,你需要使用
actions/checkout@v2
使你的仓库中的文件是可以被访问的(我不清楚还要不要继续chmod,为了保险我还是写了) - 修改的文件需要另写git指令push到仓库,具体可以看这里。
- 生成github token,本地保存好备份,使用repo secrets去保存自己的token,并且严格限制token的权限(如果傻乎乎地明着写在了action.yml里面一定要把原来的token移除掉,使用新的token,否则commit历史里面是能看到你所有的修改的)
- 欢迎来抄我的action : P。
最后在本地的rss阅读器上效果是这样的,需要订阅可以访问 https://yitao-yu.github.io/pwc-feeds/ 选取任意一个源。
可以,很香! (゜-゜)つロ