昨晚上看见S12小组赛数据包下载链接冒出来,鼠标点得比抢红包还快。结果解压完我就傻眼了——十几张表格密密麻麻挤在一块儿,英雄头像还带着洋文缩写,跟天书似的。
先搞懂原始数据这团乱麻
我把所有表格摊开盯着看,发现每个文件命名都带日期和队伍拼音。随手拉了个空白表格,按对战日期先排顺序,红蓝方队伍名手动输两遍,转头发现选手ID那栏还有个替补的标注,气得我多插了三列。
- 日期排序:按文件日期拖进文件夹才发现文件名格式不统一,4号写成10月的都有
- 选手名单:发现同一选手在不同表格里ID大小写混乱,只能拿官网海报一个个核
- 设备数据:补刀数和插眼数居然混在同一个格子,拿分号硬拆开
手搓土办法统计核心数据
蹲电脑前折腾到下午两点,老婆喊吃饭都没听见。想看哪个英雄出场率最高,直接拿空白纸记"正"字。记到第三个英雄时突然想扇自己——打开新表格粘贴全英雄名称,ctrl+F挨个文件搜。结果发现个邪门的:某冷门英雄在韩国队表格出现了四次,定睛一看是文件名打错重传的!
血泪教训:原始表格塞进统计软件前,先拿计算器加总试试水。某个场均经济值看着比平时高两倍,发现是打G2那场填数据的人把四位数输成五位数了。赶紧把全部数值重筛,像淘米似的来回过滤三遍。
做成粉丝能看懂的玩意
晚上八点端出三张成果图:战队红蓝方胜率对比弄成红蓝柱状图,选手分均伤害拿深浅色块区分,最麻烦的是英雄禁用率——用鼠标画二十个英雄头像排成温度计样式,画到提莫头像时手抖画出双下巴。
临睡前检查突然发现:某场关键局的MVP选手经济数据填错行了!咬着牙把十二张原始表重头核对,搞到凌晨三点钟眼睛发花。在分析报告里用加粗红字标了备注:“遇到离谱数据先翻原始记录,比算命还刺激。”
早上被粉丝催更消息震醒,瘫在椅子上揉太阳穴。这帮数据表格比带孩子还累人——下次官方再甩原始包出来,我打算先给做表的人寄本《Excel从入门到放弃》。