当前位置: 首页 > news >正文

溧水114网站开发简述建设一个网站的具体过程

溧水114网站开发,简述建设一个网站的具体过程,网站建设一般多少钱一年,做网站最主要昨天突然发现,百度旋转验证码发生了变化,导致使用老版本验证码训练出来的识别模型效果不佳。所有昨天花了一天时间完成了新版模型的训练。 老版本验证码 新版本验证码 新版的验证码感觉像是AI绘画随机生成的,还有随机阴影出现。 验证码识别…

昨天突然发现,百度旋转验证码发生了变化,导致使用老版本验证码训练出来的识别模型效果不佳。所有昨天花了一天时间完成了新版模型的训练。

老版本验证码

新版本验证码

 

新版的验证码感觉像是AI绘画随机生成的,还有随机阴影出现。 

验证码识别过程

1、利用爬虫采集图像

首先我们开发爬虫去采集新版本的图片素材。爬取过程中发现cookie有一定的时效性,没有花过多时间在图片的反爬上做研究。

2、人工标记

为了保障识别的精度,这里需要进行大量的人工标记,旋转角度可能有误差,最好控制在1-2度以内,数据质量决定了模型预测效果

  3、训练模型

4、测试验证

我们将训练好的模型用100张图片来进行测试,虽然识别出来角度有所偏差,但是这个误差范围都能够使验证通过,所以正确率接近100%。因为100张测试图片比较少,所以保守估计正确率应该在99%左右。

如果再想提升正确率,可以再增加训练的数据量,就需要再投入大量人力,这个投入与提升产出比需要自己权衡。

5、免费使用地址

我将训练好的模型放在了网上,可以供大家免费学习使用:得塔云

6、总结分析
(1)目前见到的验证码图片可能是AI生成的,所以出现新图片的概率会很大,所以对标注、识别难度会大大增加。

(2)和老版本相比,新版本图像采集加入了一些反爬措施,也增加了一些难度。

(3)目前我没有使用 selenium 进行实战测试,可能会遇到更多反爬措施。

各位大神也请指出我的不足,或者有其他建议都可以给我留言,或私信我,谢谢指点。
 

 

http://www.yayakq.cn/news/200933/

相关文章:

  • 做网站需要编程吗英德市住房城乡建设网站
  • 企业建设网站有哪些怎么在360自己做网站吗
  • 网站建设毕业报告拜年图片制作
  • 全景网站如何做wordpress最火模板
  • 网站开发准备工作seo竞价网站建设
  • 成都 建设网站wordpress自带主题下载失败
  • 装修网站cmswordpress 更改插件目录
  • 个人可否建立网站网站宣传册怎么做的
  • 广东模板网站建设报价落实20条优化措施
  • 山东省网站备案怎么做企业网站推广需要多少钱
  • 网站克隆下来了然后再怎么做微网站制作
  • 做网站的需求厦门企业制作网站
  • 嘉兴公司网站建设怎样做游戏网站
  • 怎样将视频代码上传至网站做商城网站的项目背景
  • 免费ftp 网站chinacd wordpress
  • 安徽网站开发推荐徐州建设工程材料检测预约网站
  • 极简风格 网站医院建筑设计案例
  • 网站建设方案策划书ppt模板下载网站搭建技术要求
  • 郑州网站建设排名网站开发的概要设计模板
  • 河南城乡和住房建设厅网站垂直+网站开发
  • 珠海建设工程交易中心网站怎么使用微信公众号
  • 家具网站的建设智慧校园系统平台
  • 网站建设入门到精通营销策略是什么意思
  • 网站网络广告如何建设标题正文型网站
  • 汕头个人网站推广建设网络全案推广
  • 海外英文建站可以做外链的网站有哪些
  • 重庆建设工程信息网官网首页入口seo排名优化公司价格
  • 网站文件名优化电商发展现状与趋势
  • 中山网络公司网站建设北京专业建设
  • 网站完整模板运城推广型网站开发