【boost_search搜索引擎】1.获取数据源

这篇具有很好参考价值的文章主要介绍了【boost_search搜索引擎】1.获取数据源。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1、项目介绍

boost_search项目和百度那种不一样,百度是全站搜索,而boost_search是一个站内搜索。而项目的宏观上实现思路就如同图上的思路。
【boost_search搜索引擎】1.获取数据源,boost_search项目,搜索引擎

2、获取数据源

我们要实现一个站内搜索,我们就要有这个网站的数据源,我们可以从boost.org官网获取它的数据源
【boost_search搜索引擎】1.获取数据源,boost_search项目,搜索引擎
我们点击下载,进入到这个界面,直接下载它的压缩包
【boost_search搜索引擎】1.获取数据源,boost_search项目,搜索引擎
下载后之后,我们将它存到我们的Linux服务器上,这里我们可以通过
rz -E命令将我们Windows上的文件传输到Xshell上,这里我选择创建一个data目录,将我们的boost压缩包解压的内容放进去。
【boost_search搜索引擎】1.获取数据源,boost_search项目,搜索引擎
这里如果出现乱码,我们就只用rz命令,
【boost_search搜索引擎】1.获取数据源,boost_search项目,搜索引擎文章来源地址https://www.toymoban.com/news/detail-844057.html

  • 然后我们使用: tar -xzf boost_1_84_0.tar.gz 命令进行解压
  • 然后我们进入boost目录/doc/html,
    这里面的就是我们要的数据源,(因为我们最终搜索出来的是个网站,所以我们只需要它的html即可)我们将这个目录下的文件拷贝进我们的data目录下即可
  • 我们用cp -rf boost_1_84_0/doc/html/* html/拷贝进我的html目录下
    (html是我在data目录下提前创建好的目录)
    这样我们就拿到了我们制作搜索引擎需要的数据源

到了这里,关于【boost_search搜索引擎】1.获取数据源的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • boost 搜索引擎

    done 公司:百度、搜狗、360搜索、头条新闻客户端 - 我们自己实现是不可能的! 站内搜索:搜索的数据更垂直,数据量其实更小 boost的官网是没有站内搜索的,需要我们自己做一个 首先在用户进行搜索之前,在公司的服务器server上,内存上有一个searcher服务,而我们想进行搜

    2024年02月11日
    浏览(31)
  • boost库搜索引擎

    Gitee仓库:boost库搜索引擎 市面上有很多搜索引擎例如Google、百度、360等,这些都是特别大的项目。 对于个人学习我们可以写一个 站内搜索 ,这个搜索的内容更加垂直,数据量更小,例如C++的文档The C++ Resources Network Google搜索显示内容: 客户端使用浏览器搜索向服务器发起

    2024年04月09日
    浏览(24)
  • 【Boost搜索引擎项目】

    1.编写数据去标签模块–parser.cc 将去标签之后干净文档以title3content3urlntitle3content3urln格式放入同一文件中。 2.建立索引模块–index.hpp 读取处理好的行文本文件进行分词、权重计算等操作,在内存中构造出正排索引和倒排索引。 3.编写搜索引擎模块–searcher.hpp 对查询词进

    2024年02月15日
    浏览(31)
  • 基于Boost的搜索引擎

    搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上采集信息,在对信息进行组织和处理后,为用户提供检索服务,将检索的相关信息展示给用户的系统。 国内有许多做搜索的公司:百度、搜狗、360搜索等等。 这些大型公司做的搜索引擎是全网搜索,背后也是

    2023年04月10日
    浏览(21)
  • 【C++项目】boost搜索引擎

    boost官网 Boost库是为C++语言标准库提供扩展的一些C++程序库的总称。 Boost库由Boost社区组织开发、维护。其目的是为C++程序员提供免费、同行审查的、可移植的程序库。Boost库可以与C++标准库完美共同工作,并且为其提供扩展功能。Boost库使用Boost License来授权使用,根据该协议

    2023年04月16日
    浏览(65)
  • 基于boost库的搜索引擎项目

    boost库是指一些为C++标准库提供扩展的程序库总称,但是boost网站中并没有为我们提供站内搜索功能,因此我们要想找到某一个类的用法还要一个个去找,因此我们这次的目的就是实现一个搜索引擎功能,提高我们获取知识的效率 比如百度,谷歌,360等,这些都是大型的搜索

    2024年03月14日
    浏览(34)
  • 【搜索引擎】elastic search核心概念

    前言 本文不涉及ES的具体安装下载、操作、集群的内容,这部分内容会放在后面一篇文章中。本文只包含ES的核心理论,看完本文再去学ES的细节会事半功倍。 目录 1.由日志存储引出的问题 2.什么是ES? 3.ES的数据结构 4.ES的核心原理 5.联系作者 本文或者说本系列的来源: 前面

    2024年02月03日
    浏览(25)
  • 基于boost准标准库的搜索引擎项目

    这是一个基于Web的搜索服务架构 客户端-服务器模型 :采用了经典的客户端-服务器模型,用户通过客户端与服务器交互,有助于集中管理和分散计算。 简单的用户界面 :客户端似乎很简洁,用户通过简单的HTTP请求与服务端交互,易于用户操作。 搜索引擎功能 :服务器端的

    2024年04月27日
    浏览(19)
  • 微服务 分布式搜索引擎 Elastic Search RestAPI

    本文参考黑马 分布式Elastic search Elasticsearch是一款非常强大的开源搜索引擎,具备非常多强大功能,可以帮助我们从海量数据中快速找到需要的内容 ES官方提供了各种不同语言的客户端,用来操作ES。这些客户端的本质就是组装DSL语句,通过http请求发送给ES。官方文档地址:

    2024年01月24日
    浏览(28)
  • 搭建自己的搜索引擎——oh-my-search使用

    使用elasticsearch和search-ui搭建自己的搜索引擎,快速查找资源和文件。如果对代码感兴趣,相关代码已在github上开源,欢迎fork代码。 先搭建eleasticsearch再搭建kibana 搭建elasticsearch 编辑docker-compose.yml文件,内容如下: 其中./es/config/elasticsearch.yml的内容如下,可按需修改: 启动

    2024年02月08日
    浏览(22)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包