如何评价12306的图片型验证码的呢?

发布网友发布时间：2022-04-23 05:05

共4个回答

懂视网时间：2022-04-02 18:26

阿里的“拖动滑块验证”是通过后台编写程序来实现的。

　　拖动滑块验证这是极验验证推出的基于行为式验证技术的验证码，极验验证的验证方式就是拖动滑块完成拼图来实现验证。当拖动极验验证码图片下面的圆形拖动按钮试，验证图片中就会出现相应的拼图形状，将滑块和拼图凹槽重叠在一起就可以了。

热心网友时间：2022-04-02 15:34

验证码的目的是为了区分人类和机器，设计出「一个测试」，通过测试的判断为人类，未通过测试的判断为机器。这就一方面要考虑如何让人类容易通过测试，一方面要考虑让机器难以通过测试。这就必须要利用人类和机器的差异。12306 的这套验证码，是一套非常差的验证码：人类很难识别，机器很容易识别。

以人类的角度来说，在桌面上已经难以识别，更不用说在手机上了。但是对于机器，却是很容易。在不涉及任何技术细节的情况下，我们也可以很明显地发现：「请点击图中所有的小提琴」的「小提琴」关键词和图中的「小提琴」图像的对应关系，应该是由人标注的。（假设不是人标注的，而是由某种自动方法生成的，那么破解方也可以尝试了解这个方法，使用这个方法去破解。问题就在于能否设计出一种易于生成，但是难于破解操作的方法。字母数字类验证码是随机出的情况，就去掉了这种可能性。以 12306 验证码的情况来看，提供方应该不具有这样的技术能力。）既然由人标注的，那么这个库就是有限的，而且并不大。每一次标注都是需要消耗人力和经费的。既然是个不大的固定库，那么破解方就可以不断尝试，把所有的图片和关键词对应关系都穷举、人工标注出来。然后使用这个库去破解就可以了，识别出句子中的关键词，然后从库中找到对应的图片来比较，选择一样的图片即可。（如果为了避免这样的比较，对图像加上扭曲、干扰，那人就根本看不清了。）（如果为了避免关键词识别，对关键词加上扭曲、干扰，破解难度和以前差不多。）人工建库标记是个体力活，但是一劳永逸啊。 12306 没有办法频繁来更新验证码，这套验证码他要用好久。通过这个例子，我们可以发现，所有人工标记结果的有限库，都可以使用穷举建库方式来破解。

设计验证码时候，要避免从人类识别的方式去判断破解的难度。当然这套验证码的设计者，可能认为可能认为「这个看上去很难，忽悠 12306 足够了~」。当然，以上只是一种破解方法。如其他用户所示还有使用 Google 等的图片识别方式来做。可以发现，破解方有好多种可利用的工具。这是验证码不断升级的一个原因：世界上有非常多的科研机构、公司在做（有变形、干扰的）图像识别研究和产业化。这些研究，来源人类生活中的需求和人对未知的好奇。人类一直在研究让机器能够做人的事情，这个方向和验证码的目的天然是矛与盾，正好被用来破解验证码。那有人会说，那些黄牛有这么强的实力吗？他们不需要有，他们只要有钱，就可以雇人来破解。不同网站有不同的验证码，破解一个网站的验证码可以卖给很多家有作弊需求的人。因此，破解验证码的需求，可以让一部分人专心做验证码破解方案来赚钱。愿意花钱来买破解方案，那当然不能做亏本生意。其根源还是在于有利可图，而且利益足够大。既然验证码想要判断是不是人，那可以雇人来做救兵。有利可图的时候，如果机器破解不了，当然还可以出钱请人来输入验证码。网上大量广告，找人兼职输入验证码，他们每天花时间利用破解方提供的工具输入 12306 等网站的验证码（「打码」）。所以，到这个程度，就算验证码能够区分出人类与机器，也不能够挡住为利所惑的人类了。有钱能使鬼推磨。以上说的是你所见到的「验证码」，比如出一道题，你做出来了，就认为是人类，做不出来，就认为是机器。一种趋势：不只看结果，还要看行为。实际上，就算你做出来了，仍然可以通过分析你是怎么做的，来判断是不是人类，比如：Google 的 reCAPTCHA ，阿里巴巴的拖动滑块验证码（阿里的“拖动滑块验证”是怎么实现的？ - 计算机网络），极验验证（极验验证可以被破解吗？ - 互联网）。给用户一个简单的动作任务，然后分析用户动作过程中的大量数据。机器可以模拟这些数据，但是难度有可能比传统验证码更高，也更容易更新升级。

热心网友时间：2022-04-02 16:52

验证码的问题永远是道高一尺魔高一丈。不过，我不认为物件识别是一个好的方式。毕竟，图像识别正是是目前深度学习所擅长的。卷积神经网络模拟了人的视觉神经通路，在实践中有很好的效果。目前在某些视觉识别任务上，机器可以超过人的平均水平。而且，从其他人发出来百度识图（应该背后是深度学习）的结果来看，准确率也非常不错。所以，目前的方式很有可能会被攻破，但不得不说成本（技术难度、运算资源）上面就会大大增加了。有人提到了推理类的验证码。这的确是目前机器难以解决的问题，如果这种验证码如果可以大量产生，说不定是个不错的思路。既然都提到了神经网络，那就来凑个热闹。通过下面的小实验来看看预训练的单机神经网络能不能解决12306问题。

热心网友时间：2022-04-02 18:26

机器识别图案慢，人识别同样不会太快，会延误订票时间，就跟乌云的那个图里说明的一样：机器识别麻烦的，人同样也麻烦。几乎不存在一种由机器生成，人识别快、机器识别慢的东西。（联想一下图灵测试）如果是4字符验证码，字母加数字一共是36个，总数量是36^4=1679616种组合。图形验证码要达到这种组合很难，如果按照比特位来算，8个图单比特是8个，双比特是C(2,8)=28个，三比特是C(3,8)=56个，要达到4位验证码那么多数量的话，要么图片分类特别多，要么图片特别多。所以，要看他们准备了多少图了，如果图少的话，很容易被搞掉，毕竟图片是静态的，要改图还是很难的，而计算机做图形匹配其实比做文字匹配更容易（比如像素相似程度达到多少即可认为相同）。用图片最大的担忧是怕对方刷图，假设有人有足够的时间，完全可以把12306的所有图都存下来，剩下的识别工作就轻松多了，甚至卖图库就可以赚钱了。（有人已经找到方法了，用以图搜图即可）同时，可以看到12306的验证码整个是一个图，那么说明它是服务器端绘制的，画这么大一个图，服务器负载可不轻啊，我试了试刷新，频率稍微快点就显示不出来了，如果遇到节假日购票高峰，可不好说服务器会不会崩溃。

全部栏目

如何评价12306的图片型验证码的呢?