最近我迷上了《天下凰权》这部小说,没日没夜地追。结果,追着追着,就跟人吵起来了。
吵架的起因特别简单,我坚持认为里面那个亦正亦邪的二皇子“萧策”才是真正的魅力担当,结果有个铁杆书粉非说女主角“凤九”的人气才是顶流。我们俩在评论区里来来回回杠了三个回合,互相不服气,差点把键盘敲烂。
那天晚上我躺在床上翻来覆去睡不着,琢磨着这事儿。光靠嘴皮子是没用的,粉丝滤镜太厚,谁也说服不了谁。作为一个资深内容博主,我立马反应过来,得用数据说话。我要把全网的人气都扒拉一遍,搞一个最公正的投票大比拼。与其继续在网上瞎嚷嚷,不如直接用事实堵住所有人的嘴。
开始动手:第一阶段——定锚与抓取
说干就干。第二天早上我连早饭都没顾得上吃,直接杀到了电脑前。我要做的就是确定候选人名单。我从第一卷看到最新的连载,把所有出场超过十章的关键角色都圈了出来。主角团,配角组,甚至连一些高人气但早早就领盒饭的炮灰都没放过。拉出来一张长长的单子,有三十多个人物。
- 主角团:凤九、君临天(必须的,人气底盘)
- 重要配角:萧策、慕容月(争议最大的几个,必须入选)
- 反派阵营:夜溟、鬼王(有意思的反派也算进去,圈粉能力强)
名单定下来之后,我面临第二个难题:在哪投票?如果只在我的博客搞,样本量太小,不具代表性。我果断出击,兵分三路。
我先是在最大的几个书粉聚集地,包括豆瓣的讨论组和几个知名的QQ群里,悄悄地放了一个问卷链接。这个链接我设计得很简单,就是纯粹的单选,投你最喜欢的三个角色。我还在微博上搞了一个#天下凰权人气大赏#的话题,专门用来吸引路人粉和轻度读者。我甚至找到了一位熟悉爬虫技术的朋友,让他帮我抓取了最近三个月内各大论坛里提到这些角色名字的评论量,作为投票的权重参考。
实战记录:第二阶段——数据清洗与统计
这个过程真的把我折腾得够呛。短短三天时间,我收集了将近八千份有效投票。但是,有效的投票里掺杂着大量的“无效噪声”。
我发现,有些角色粉为了给自己偶像冲票,搞了大量的机器刷票。比如,某个平时讨论度很低的角色,突然之间在一个小时内票数飙升了五百票。这明显不正常。我手动检查了所有高票角色的投票IP地址和填写时间,把那些明显是批量操作的数据全部剔除掉了,大概删掉了将近一千二百票。这叫一个费劲,眼睛都快看花了。为了确保公平,我还专门针对微博和豆瓣两个平台的投票,做了独立分组,观察有没有平台倾向性。
清理完数据,我开始进行正式的统计。我没有用什么高大上的数据分析软件,就是拿了个Excel表格,老老实实地打勾、计数、排序。我把总票数、主角票数占比、配角票数占比,以及不同平台的投票倾向,都分门别类地列了出来。我把那个帮我抓取评论量的朋友都拉过来,一起对着数据校对,生怕算错了一个数。
最终成果:第三阶段——结果与分享的意义
统计结果出来的那一刻,我真是哭笑不得。排在第一名的,既不是我力挺的萧策,也不是跟我吵架的书粉说的凤九。
最圈粉的居然是那个出场不多,但人设极度完美的白月光角色“陆离”。这家伙的票数遥遥领先,简直是断层式的第一。这个结果给了我很大的启发:大家追剧或者看小说,不一定非要喜欢戏份最多的,而是喜欢那种能让人产生强烈情感共鸣的。
我把这份新鲜出炉的、带着我血汗清理过的投票结果,整理成了现在的这篇文章。我在文章里详细描述了我的筛选标准和最终的排行榜,并且针对每个高人气角色的圈粉点,做了几句通俗的点评。
之所以花这么大力气搞这个投票,不仅是为了证明我跟那位书粉谁对谁错,更是为了给自己一个交代。自从上次我因为一个技术问题跟上级吵翻,一气之下辞职,在家赋闲了半年。那段日子真是灰暗,感觉自己做什么都不对劲。搞这个投票和数据分析,让我重新找回了那种把事情从头到尾彻底搞清楚,用硬数据支撑结论的感觉。这种踏实感,比我找到下一份工作还要重要。
结果已经放在这里了。看的人如果也对这个话题感兴趣,就赶紧去投票区,给你最爱那个角色再添一把火。我费了这么大劲,数据得盘活,不能浪费!