如何评价12306的图片型验证码的呢?

发布网友 发布时间:2022-04-23 05:05

我来回答

4个回答

懂视网 时间:2022-04-02 18:26

阿里的“拖动滑块验证”是通过后台编写程序来实现的。

  

  拖动滑块验证这是极验验证推出的基于行为式验证技术的验证码,极验验证的验证方式就是拖动滑块完成拼图来实现验证。当拖动极验验证码图片下面的圆形拖动按钮试,验证图片中就会出现相应的拼图形状,将滑块和拼图凹槽重叠在一起就可以了。

热心网友 时间:2022-04-02 15:34

验证码的目的是为了区分人类和机器,设计出「一个测试」,通过测试的判断为人类,未通过测试的判断为机器。这就一方面要考虑如何让人类容易通过测试,一方面要考虑让机器难以通过测试。这就必须要利用人类和机器的差异。12306 的这套验证码,是一套非常差的验证码:人类很难识别,机器很容易识别。

以人类的角度来说,在桌面上已经难以识别,更不用说在手机上了。但是对于机器,却是很容易。在不涉及任何技术细节的情况下,我们也可以很明显地发现:「请点击图中所有的小提琴」的「小提琴」关键词和图中的「小提琴」图像的对应关系,应该是由人标注的。(假设不是人标注的,而是由某种自动方法生成的,那么破解方也可以尝试了解这个方法,使用这个方法去破解。问题就在于能否设计出一种易于生成,但是难于破解操作的方法。字母数字类验证码是随机出的情况,就去掉了这种可能性。以 12306 验证码的情况来看,提供方应该不具有这样的技术能力。)既然由人标注的,那么这个库就是有限的,而且并不大。每一次标注都是需要消耗人力和经费的。既然是个不大的固定库,那么破解方就可以不断尝试,把所有的图片和关键词对应关系都穷举、人工标注出来。然后使用这个库去破解就可以了,识别出句子中的关键词,然后从库中找到对应的图片来比较,选择一样的图片即可。(如果为了避免这样的比较,对图像加上扭曲、干扰,那人就根本看不清了。)(如果为了避免关键词识别,对关键词加上扭曲、干扰,破解难度和以前差不多。)人工建库标记是个体力活,但是一劳永逸啊。 12306 没有办法频繁来更新验证码,这套验证码他要用好久。通过这个例子,我们可以发现,所有人工标记结果的有限库,都可以使用穷举建库方式来破解。

设计验证码时候,要避免从人类识别的方式去判断破解的难度。当然这套验证码的设计者,可能认为可能认为「这个看上去很难,忽悠 12306 足够了~」。当然,以上只是一种破解方法。如其他用户所示还有使用 Google 等的图片识别方式来做。可以发现,破解方有好多种可利用的工具。这是验证码不断升级的一个原因:世界上有非常多的科研机构、公司在做(有变形、干扰的)图像识别研究和产业化。这些研究,来源人类生活中的需求和人对未知的好奇。人类一直在研究让机器能够做人的事情,这个方向和验证码的目的天然是矛与盾,正好被用来破解验证码。那有人会说,那些黄牛有这么强的实力吗?他们不需要有,他们只要有钱,就可以雇人来破解。不同网站有不同的验证码,破解一个网站的验证码可以卖给很多家有作弊需求的人。因此,破解验证码的需求,可以让一部分人专心做验证码破解方案来赚钱。愿意花钱来买破解方案,那当然不能做亏本生意。其根源还是在于有利可图,而且利益足够大。既然验证码想要判断是不是人,那可以雇人来做救兵。有利可图的时候,如果机器破解不了,当然还可以出钱请人来输入验证码。网上大量广告,找人兼职输入验证码,他们每天花时间利用破解方提供的工具输入 12306 等网站的验证码(「打码」)。所以,到这个程度,就算验证码能够区分出人类与机器,也不能够挡住为利所惑的人类了。有钱能使鬼推磨。以上说的是你所见到的「验证码」,比如出一道题,你做出来了,就认为是人类,做不出来,就认为是机器。一种趋势:不只看结果,还要看行为。实际上,就算你做出来了,仍然可以通过分析你是怎么做的,来判断是不是人类,比如:Google 的 reCAPTCHA ,阿里巴巴的拖动滑块验证码( 阿里的“拖动滑块验证”是怎么实现的? - 计算机网络),极验验证(极验验证可以被破解吗? - 互联网)。给用户一个简单的动作任务,然后分析用户动作过程中的大量数据。机器可以模拟这些数据,但是难度有可能比传统验证码更高,也更容易更新升级。

热心网友 时间:2022-04-02 16:52

验证码的问题永远是道高一尺魔高一丈。不过,我不认为物件识别是一个好的方式。毕竟,图像识别正是是目前深度学习所擅长的。卷积神经网络模拟了人的视觉神经通路,在实践中有很好的效果。目前在某些视觉识别任务上,机器可以超过人的平均水平。而且,从其他人发出来百度识图(应该背后是深度学习)的结果来看,准确率也非常不错。所以,目前的方式很有可能会被攻破,但不得不说成本(技术难度、运算资源)上面就会大大增加了。有人提到了推理类的验证码。这的确是目前机器难以解决的问题,如果这种验证码如果可以大量产生,说不定是个不错的思路。既然都提到了神经网络,那就来凑个热闹。通过下面的小实验来看看预训练的单机神经网络能不能解决12306问题。

热心网友 时间:2022-04-02 18:26

机器识别图案慢,人识别同样不会太快,会延误订票时间,就跟乌云的那个图里说明的一样:机器识别麻烦的,人同样也麻烦。几乎不存在一种由机器生成,人识别快、机器识别慢的东西。(联想一下图灵测试)如果是4字符验证码,字母加数字一共是36个,总数量是36^4=1679616种组合。图形验证码要达到这种组合很难,如果按照比特位来算,8个图单比特是8个,双比特是C(2,8)=28个,三比特是C(3,8)=56个,要达到4位验证码那么多数量的话,要么图片分类特别多,要么图片特别多。所以,要看他们准备了多少图了,如果图少的话,很容易被搞掉,毕竟图片是静态的,要改图还是很难的,而计算机做图形匹配其实比做文字匹配更容易(比如像素相似程度达到多少即可认为相同)。用图片最大的担忧是怕对方刷图,假设有人有足够的时间,完全可以把12306的所有图都存下来,剩下的识别工作就轻松多了,甚至卖图库就可以赚钱了。(有人已经找到方法了,用以图搜图即可)同时,可以看到12306的验证码整个是一个图,那么说明它是服务器端绘制的,画这么大一个图,服务器负载可不轻啊,我试了试刷新,频率稍微快点就显示不出来了,如果遇到节假日购票高峰,可不好说服务器会不会崩溃。

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com