原创不易,本文禁止抄袭,转载,违权必究!
一、EDG夺冠信息
11月6日,在英雄联盟总决赛中,EDG战队以3:2战胜韩国队,获得2021年英雄联盟全球总决赛冠军,这个比赛在全网各大平台也是备受瞩目:
1、微博热搜第一名,截止2021-11-10已有亿级观看量,微博粉丝数到达638.4万
2、哔哩哔哩已有几亿人气,总弹幕有22.3万,全站排行榜最高第2名,B站粉丝已有219.9万
3、腾讯、爱奇艺、优酷等视频平台800万人看过
4、虎牙等直播平台热度也是居高不下
5、央视新闻也发微博庆祝EDG夺冠
既然比赛热度这么高,那么本次我们就以bilibili为基准,通过采集EDG夺冠比赛视频在哔哩哔哩的22.3万条弹幕数据,再通过Python来分析进而感受粉丝的热情
二、实战目标
2.1 网络爬虫
利用爬虫技术抓取EDG战队在B站夺冠比赛视频的22.3万条弹幕数据
2.2 数据可视化
通过jieba、numpy等Python库对抓取来的弹幕数据进行分析并且可视化
2.3 自然语言处理(情感分析)
利用pandas+自然语言处理(NLP)等对EDG夺冠比赛视频的弹幕数据进行情感分析,根据分析结果得出一些结论
三、bilibili接口分析
首先进入EDG夺冠比赛视频URL:
https://www.bilibili.com/video/BV1EP4y1j7kV?p=1
哔哩哔哩已为大家整理好了EDG比赛视频,从开幕式到夺冠时刻,共有7个视频
哔哩哔哩弹幕数据接口:
http://api.bilibili.com/x/v1/dm/list.so?oid=XXX
这个接口就是B站弹幕数据专用接口,我们可以直接拿来用,这个接口中的oid可以理解为每个视频中的唯一标识符,它由数字组成,每一个视频都有唯一的一个oid,那么我们只要找到oid就可以请求相应比赛视频弹幕的API接口,从而抓取弹幕数据
获取oid
打开开发者工具,切换到Network选项,然后找到以pagelist为开头的请求接口
接着找到Request URL这个请求接口,打开新窗口直接用这个API接口请求,如下图:
当我们直接请求这个API接口时可以看到JSON格式的数据,而在里面的cid就是我们需要的oid,如下所示:
1 {\"code\":0,\"message\":\"0\",\"ttl\":1,\"data\":[{\"cid\":437586584,\"page\":1,\"from\":\"vupload\",\"part\":\"第一局 4K\",\"duration\":2952,\"vid\":\"\",\"weblink\":\"\",\"dimension\":{\"width\":1920,\"height\":1080,\"rotate\":0}},{\"cid\":437626309,\"page\":2,\"from\":\"vupload\",\"part\":\"第二局 4K\",\"duration\":3031,\"vid\":\"\",\"weblink\":\"\",\"dimension\":{\"width\":1920,\"height\":1080,\"rotate\":0}},{\"cid\":437659159,\"page\":3,\"from\":\"vupload\",\"part\":\"第三局 4K\",\"duration\":3406,\"vid\":\"\",\"weblink\":\"\",\"dimension\":{\"width\":1920,\"height\":1080,\"rotate\":0}},{\"cid\":437727348,\"page\":4,\"from\":\"vupload\",\"part\":\"第四局 4K\",\"duration\":3212,\"vid\":\"\",\"weblink\":\"\",\"dimension\":{\"width\":1920,\"height\":1080,\"rotate\":0}},{\"cid\":437729555,\"page\":5,\"from\":\"vupload\",\"part\":\"第五局 4K\",\"duration\":3478,\"vid\":\"\",\"weblink\":\"\",\"dimension\":{\"width\":1920,\"height\":1080,\"rotate\":0}},{\"cid\":437550300,\"page\":6,\"from\":\"vupload\",\"part\":\"开幕式\",\"duration\":984,\"vid\":\"\",\"weblink\":\"\",\"dimension\":{\"width\":1920,\"height\":1080,\"rotate\":0}},{\"cid\":437717574,\"page\":7,\"from\":\"vupload\",\"part\":\"夺冠时刻\",\"duration\":2017,\"vid\":\"\",\"weblink\":\"\",\"dimension\":{\"width\":1920,\"height\":1080,\"rotate\":0}}]
来源:https://www.cnblogs.com/makerchen/p/15539183.html
图文来源于网络,如有侵权请联系删除。