当前位置: 首页 > news >正文

淘宝基地网站怎么做做网站域名哪里来

淘宝基地网站怎么做,做网站域名哪里来,如何制作wordpress模板下载地址,北京企业官网网站建设报价文章目录综述效果展示去标签化,清理数据构建索引用户查询综述 该项目使用了BS架构,实现了用户对Boost库进行站内搜索的功能, 用户输入关键字使用http协议通过ajax将数据发送给后端服务器,后端进行分词, 通过倒排索引…

文章目录

  • 综述
  • 效果展示
  • 去标签化,清理数据
  • 构建索引
  • 用户查询

综述

该项目使用了BS架构,实现了用户对Boost库进行站内搜索的功能,

用户输入关键字使用http协议通过ajax将数据发送给后端服务器,后端进行分词,

通过倒排索引和正排索引获得若干个文档,

每个文档按照一定权重进行排序,拼接成一个网页反馈给用户,

每个搜索结果包括文档标题,简介,URL,并可以通过点击标题跳转到特定的网址中

请添加图片描述

效果展示

请添加图片描述

请添加图片描述

请添加图片描述

请添加图片描述
请添加图片描述

去标签化,清理数据

请添加图片描述

将爬虫和下载的boost库的文件,进行提炼,去标签化,保留里面的有效数据

  • 提取html文件
  • 将提取到的html文件进行提炼有效数据
  • 将有效数据的集合写入到一个文件中

构建索引

请添加图片描述

  • 根据将去标签化后构建的内容集合在内存中 构建正排索引,形成对应的文档结构体
  • 将形成的文档结构体在内存中 构建倒排索引,根据关键词找到对应的 倒排拉链(一系列和该关键字相光的文档集合)
    • 根据 Jieba分词对 titlecontent进行分词同时划定权重,构建倒排拉链
    • 每个倒排索引中都包含权重,之后我们就能够使用权重对文档优先级进行排序

用户查询

请添加图片描述

  • 用户输入搜索关键字后,先进行 JieBa分词
  • 通过 倒排索引获得对应的 倒排拉链
  • 倒排拉链中通过 正排索引获得对应一系列的文档内容
  • 根据索引中的权重按高到低进行排序,组合成一个网页反馈给用户
http://www.yayakq.cn/news/172755/

相关文章:

  • 万网网站根目录做俄罗斯外贸的网站设计
  • 虚拟机上做钓鱼网站网站开发的企业
  • 网站开发行业工作交接交接哪些给网站做公正需要带什么
  • 成都温江网站建设怎么给自己制作一个网站
  • 什么网站可以免费做兼职舆情app免费
  • 导航网站超链接如何做商丘三合一网站建设
  • 制作一个买股票的网站怎么做营销网站定制
  • 网站图片用什么格式深圳seo优化公司搜索引擎优化方案
  • 一站式服务就像一个什么营销型网站建设案例
  • 藁城 网站济南网站建设 首选搜点网络
  • 莆田建站培训帮人做网站收费合法吗
  • 固阳网站建设广州调查公司
  • 网站开发能赚钱吗做网站合同范本
  • 英文 edm营销 的网站 与 工具wordpress 用户上传头像
  • 专业做网站公司排名保定网站排名
  • 做网页和做网站的区别网站无法下载视频 怎么做
  • 找人建设一个网站大概需要多少费用电商系统开发公司
  • 沈阳网站建设优秀公司企业运营公司
  • html5网站报价明细网站怎么搜
  • ps加dw做网站免费建站系统下载
  • 网站模板 修改桂林市区好玩的地方
  • 电商网站开发的主流技术温州网站建设首选龙诚互联
  • 网站建设新闻中心有哪些网站可以免费做推广
  • 钓鱼网站制作的报告wordpress积分充值
  • html框架做网站帝国网站源码手机
  • 建设小企业网站步骤有没有代做课程设计的网站
  • 南昌网站建设 南昌做网站公司设计网站公司名称
  • 网站积分规则设计优化网站 主题
  • 自己做网站2008R2好还是win7云南高端网站建设公司
  • 做的比较好的冷柜网站有哪些苏州有哪些it大厂