依稀记得
很久以前
某人找我抓取微博的转评赞
无用教程之写一个Chrome插件玩
于是写了上面的文章
结果被说太技术了。。。
现在又有了新的需求
除了微博post的转评赞
还需要该博主的声量
于是现在需求变成了
输入:50条微博
输出:50条微博+对应博主的粉丝数
于是一步一步来
今日食材

第一步,洗菜

即把这50个微博的链接放到一个google sheet里
第二步,切菜

也就是把这个公式输入到第二列
=CHAR(34) & regexextract(A2,"(http://weibo.com/\d+)") & CHAR(34) & ","
下拉应用整列
这一步主要是获取那50个微博对应的博主
第三步,下锅

打开Chrome浏览器
打开Web Scraper插件
Create new sitemap
Import sitemap
把B列的作者链接黏贴到下面代码对应位置并删掉最后一个逗号
{"_id":"weibosl",
"startUrl":[把B列的作者链接黏贴到这里并删掉最后一个逗号],
"selectors":
[{"id":"follower",
"type":"SelectorText",
"parentSelectors":
["_root"],
"selector":"td:nth-of-type(2) strong",
"multiple":false,
"regex":"",
"delay":0}]}
随便起一个名字比如weiboshengliang

切换到sitemap标签,点击scrape

第四步,闷一会
默认抓取间隔是2000毫秒(可以修改)
50个微博页面爬完要100秒
完成之后就可以点一下这个refresh

点击Export data as CSV

Download now
第五步 出锅

这个null的数据是原微博被删了
第六步,摆盘

把下载的数据复制到google sheet的DF列
C列输入以下公式
=ArrayFormula(IFERROR(LOOKUP("座",IF(FIND($D$2:$D$50,A2),$E$2:$E$50)),""))
当然那个50是可以改的
如果还是没有结果的话
需要把E列改成纯文本格式
然后就。。。

新鲜出炉的晚餐
Bon Appétit