post_img

黑板客爬虫闯关5

摘要

1.这一关是真的皮,首先加了个验证码,所以首想到 python的pytesseract这个模块,不过这个模块的识别率有点低,连斜倒的英文字母都无法  识别,正确率低的可怜,本想到做一些图形预处理,再切割字符,由于只有英文字母,只需储存所有的验证码字母,再进行相似度对比,但是工程量好大,还是算了,识别 …

post_img

黑板客爬虫闯关4

摘要

这关的密码有点恶心,一共13页,前12页每页8个最后一页有4个,所以一共是一百位的密码,wc,一百位,取完黄花菜都凉了,还好 threading这模块,多线程并发,不过这模块有点坑,至于坑在何处,大家学习了这模块后会发现的。 1.和第三关的登陆一模一样,登陆后先随便输入密码,提交后会提示一个pwd_ …