前天整理素材库的时候,突然发现这几年攒了十几个版本的贪婪蜘蛛安装包。这玩意儿我平时扒图片用得最多,干脆来个横评算了。正好微信群里老有人问哪个版本稳,今天就拿我那个破笔记本跑一遍给大家趟雷。
测试环境就凑合用
手头这台老爷机还是五年前组装的,i5-8400加16G内存,Win10系统从没重装过,桌面堆得跟垃圾场似的。特意没做优化,这才接近普通人真实环境嘛每个版本都装在D盘新建的文件夹里,装完直接重启开搞。
四版实测过程全记录
先试0.3.2原始版:双击安装直接报错!查了老论坛才知道缺运行库。折腾半小时补完环境,打开软件倒是挺快。测试爬取某漫画网站时缩略图加载巨慢,二十页等了三分多钟。最离谱的是爬着爬着自己闪退了,重试三次都卡在78%进度。
接着上1.0稳定版:这回安装顺利多了。界面多了个云规则库的按钮,默认规则爬电商网站挺给力。但一开深度抓取模式,内存占用直接飙到1.2G,风扇狂转跟直升机起飞似的。硬撑着爬完2000张图,结果有三百多张缩略图和原图对不上号。
1.5实验版玩心跳:安装包比前两版大了三倍。新出的智能识别功能吹得天花乱坠,实测识别淘宝商品图倒是准,换成ins风格插画就全变马赛克了。最坑的是半夜挂着爬P站,早起发现程序无响应,后台日志显示内存泄漏吃了12G!
怼2.0云端版:安装过程突然要注册账号,强制绑定手机号才给用。规则库倒是丰富,但点“小红书模板”居然弹出付费弹窗。测试时全程联网验证,爬三百张图卡了八次验证码,有次输完还提示“服务器繁忙”给断了。
血泪总结建议
深度使用两周得出的
- 0.3.2版:适合怀旧党,现在用纯属自虐
- 1.0版:综合最稳,记得手动清理内存
- 1.5版:花架子功能实际鸡肋
- 2.0版:吃相难看还受制于服务器
现在我自己主力机跑1.0版配自制规则,虚拟机里扔着2.0版应付特殊站点。要是新手入门,墙裂建议下绿色免安装的1.0.3修正版,群里传的那个魔改包把内存限制解决了,爬小批量资源足够使。当然你要是不差钱,当我没说。