#微博 #Instagram #声量抓取 #520

依稀记得
很久以前
某人找我抓取微博的转评赞
无用教程之写一个Chrome插件玩
于是写了上面的文章
结果被说太技术了。。。


现在又有了新的需求
除了微博post的转评赞
还需要该博主的声量
于是现在需求变成了
输入:50条微博
输出:50条微博+对应博主的粉丝数


于是一步一步来
今日食材



第一步,洗菜



即把这50个微博的链接放到一个google sheet里


第二步,切菜



也就是把这个公式输入到第二列


=CHAR(34) & regexextract(A2,"(http://weibo.com/\d+)") & CHAR(34) & ","


下拉应用整列
这一步主要是获取那50个微博对应的博主


第三步,下锅



打开Chrome浏览器
打开Web Scraper插件
Create new sitemap
Import sitemap
把B列的作者链接黏贴到下面代码对应位置并删掉最后一个逗号


{"_id":"weibosl",
"startUrl":[把B列的作者链接黏贴到这里并删掉最后一个逗号],
"selectors":
[{"id":"follower",
"type":"SelectorText",
"parentSelectors":
["_root"],
"selector":"td:nth-of-type(2) strong",
"multiple":false,
"regex":"",
"delay":0}]}


随便起一个名字比如weiboshengliang



切换到sitemap标签,点击scrape



第四步,闷一会
默认抓取间隔是2000毫秒(可以修改)
50个微博页面爬完要100秒
完成之后就可以点一下这个refresh



点击Export data as CSV



Download now
第五步 出锅



这个null的数据是原微博被删了
第六步,摆盘



把下载的数据复制到google sheet的DF列
C列输入以下公式


=ArrayFormula(IFERROR(LOOKUP("座",IF(FIND($D$2:$D$50,A2),$E$2:$E$50)),""))


当然那个50是可以改的
如果还是没有结果的话
需要把E列改成纯文本格式
然后就。。。



新鲜出炉的晚餐
Bon Appétit

此条目发表在有用的分类目录。将固定链接加入收藏夹。

发表评论