由佬友逆向教务系统被校方警告想起和爬虫有关的一些事情
从鼠鼠因逆向教务系统,被校方误以为网络攻击 (马上要报警),差点被记过继续讨论:
佬友的这个帖子让我想起以前本科的一些类似的有趣事情。
第一件事是我参加比赛认识的一个师弟干的。
他在参加某比赛的时候在宿舍用校园网去爬了某政府网站上的统计数据,刚开始爬的当天下午学校网管和警察就直接敲开他的宿舍门了。
该政府网站的工作人员认为收到了网络攻击,于是找了网警,网警定位到了 IP 是我们学校,打电话找学校网管,因为没有做任何遮掩,所以学校网管直接定位到宿舍然后上门了。
后面是因为理由正当,没有造成严重后果,口头警告一下就过了。
这件事对当时我的我造成了很大冲击,因为我当时正在参加学院和某企业合作的一个项目,通过爬各种新闻网站、论坛的评论区来做舆情分析。虽然这个项目有一定政府背景,但当时我写爬虫测试的时候都是用的自己的电脑,唯一想到要用代理池的原因是爬太多被封 IP 不能继续测试…
我一个不太靠谱的师兄在拉我们进这个爬虫项目的时候信誓旦旦地说,学会了爬虫就不怕吃不饱饭了,因为他有一个同学,毕业之后靠写爬虫爬数据去卖,一天能赚 100 多。我一开始还傻傻觉得挺有道理。后面想起来,觉得这只是当时的法规不成熟,放现在分分钟出事。
结合佬友的故事,各位同仁学、用爬虫的时候需谨慎。
第二个事情是想吐槽一下高校纸糊一样的网络系统。
我们本科的时候有一门忘记干嘛的公选课,第一天上课老师就让我们要经常登录某个学校部门自己搭的网站,学期末的时候会根据登录次数来算平时分。
我们研究之后发现那个网站的登录系统完全是纸糊的,除了账号密码之外不做任何校验,甚至连登录都是一次性的,就是它不记录你的登录状态,你关闭网站再打开就是注销状态了。
为了刷登录次数,我有同学用脚本精灵做了个脚本去点。我则用 python 写了个代码去刷,经历了第一件事之后,我还专门把登录间隔设大一点,爬刷出问题。后来发现完全没有关系,系统完全不在乎这些事情。
想起来挺好笑的。