搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏ES搜索
【ES三周年】ES查询—海量数据搜索深度分页优化
图片背景最近在实际项目中查询条件上越来越复杂，mysql的筛选已无法支撑，准备将所有搜索筛选改为es查询。例如ES 共有 4 个shard，并且每个shard没有副本。假如分页的大小为 10，想取第11 页的内容。则对应的 from = 100，size = 10。缺点查询分页受限于max_result_window设置，不能无限制翻页。查询分页性能不稳定，越往后翻页越慢，存在深度翻页问题。图片图片图片具体使用方法：第一次查询时，会生成一个 scrollId ，并将所有符合搜索条件的搜索结果缓存起来。图片在 7.10以后版本中，ES官方不再推荐使用Scroll方法来进行深分页，而是推荐使用带PIT的 search_after 来进行查询。图片 PIT可以被看为存储索引数据状态的轻量级视图。
5.1K229编辑于 2023-04-29
来自专栏SmartSi
ElasticSearch 分页搜索
分页之前的文章ElasticSearch 空搜索与多索引多类型搜索我们知道，我们的空搜索匹配到集群中的13个文档。但是，命中数组中只有10个文档（文章只显示了2条数据，故意省略掉）。 from); searchRequestBuilder.setSize(size); SearchResponse response = searchRequestBuilder.get(); 要避免分页太深或者一次请求太多的结果请记住，搜索请求通常跨越多个分片。每个分片都会生成自己的排序结果，然后在协调节点集中排序，以确保整体顺序正确。 2. 深度分页为了理解深度分页为什么是有问题的，我们假设在一个有5个主分片的索引中搜索。好消息是，网页搜索引擎一般不会为任何查询返回超过1,000个结果。
1.6K30发布于 2019-08-07
来自专栏微信公众号：Java团长
SSM框架——实现分页和搜索分页
分页是Java Web项目常用的功能，昨天在Spring MVC中实现了简单的分页操作和搜索分页，在此记录一下。使用的框架为（MyBatis+SpringMVC+Spring）。首先我们需要一个分页的工具类： 1.分页 import java.io.Serializable; /** * 分页 */ public class Page implements -- 分页功能 End --> 2.查询分页关于查询分页，大致过程完全一样，只是第三个参数（上面是loginUserId)需要接受用户输入的参数，这样的话我们需要在控制器中接受用户输入的这个参数（页面中的 <input>使用GET方式传参），然后将其加入到SESSION中，即可完成查询分页（此处由于“下一页”这中超链接的原因，使用了不同的JSP页面处理分页和搜索分页，暂时没找到在一个JSP页面中完成的方法 return "private/space/ProductSearchResult"; } } //如果SESSION不为空，且传入的搜索条件
2.2K40发布于 2018-08-03
来自专栏听雨堂
【9】分页浏览的管理
阅读目录分页关注的内容状态的传递数据的获取查询结果的分页跳页的实现分页器的样式页面的完整处理流程分页关注的内容前面博文中，通过自行构造HTML表格代码，可以生成易于管理、把所有数据进行分页后逐页显示，是当前比较流行的数据展示方式。因此，我们需要研究和表格方式展示数据相适应的分页管理机制。，通过它们可以了解当前分页信息，进行各种分页的跳转。所以分页管理必须要把查询综合考虑进来。如果是查询结果分页浏览，和前面的分页浏览有何不同呢？其实很容易看到，就是需要把上面的sql语句，增加一个查询条件即可。分页器的样式分页功能几乎是每个数据管理页面都需要的，但其样式总的来说，不会有太多的变化，因此，写好一个通用性较强的样式，就可以到处使用了。这是一个常用的分页器样式。
1.6K70发布于 2018-01-23
来自专栏prepared
es_分组-分页-TransportClient实现
总结： 1、group 之后不能自动分页，需要手动设置； 2、size 需要指定，否则会出错。 ---- group 之后分页、排序实现需要手动截取分页对应范围内的数据。 carids.getBuckets(); List<carBean> listCarTgs = new ArrayList<>(); carBean carBean ; // buckets 全部数据，分页就是取固定位置的
1.4K51发布于 2019-10-08
来自专栏YG小书屋
ES 深度分页scroll使用方式
我们知道ES对于from+size的个数是有限制的，二者之和不能超过1w。当所请求的数据总量大于1w时，可用scroll来代替from+size。 application/json' -d' { "scroll" : "1m", "scroll_id" : "DXF1ZXJ5QW5kRmV0Y2gBAAAAAAAAAD4WYm9laVYtZndUQlNsdDcwakFMNjU1QQ ==" } ' 如果你对scroll取出的数据顺序没有要求的话，则可以对“_doc”进行排序，es对这种排序做了优化。 scroll查询时，scan类型scroll_id会变，普通查询scroll_id不会变 http://zcty5v5.xyz/2016/10/17/ES-scroll-issues/ 同样的命令，curl
4.6K20发布于 2018-05-23
来自专栏犀牛饲养员的技术笔记
ES分页看这篇就够了
）同样也有很多分页查询的场景，比如在数据量比较大的情况下，并且查询条件比较复杂，在mysql中无法命中索引，我们往往会选择使用ES的分页查询。分页的几种方案 1. from/size方案这是ES分页最常用的一种方案，跟mysql类似，from指定查询的起始位置，size表示从起始位置开始的文档数量。看个例子。 ES内部是通过index.max_result_window这个参数控制分页深度的，我们可以针对特定的索引来修改这个值。所以分页越深，ES处理的开销就大，占用内存就越大。 ? 2. search after方案有时候我们会遇到一些业务场景，需要进行很深度的分页，但是可以不指定页数翻页，只要可以实时请求下一页就行。 search after基于ES内部排序好的游标，可以实时高效的进行分页查询，但是它只能做下一页这样的查询场景，不能随机的指定页数查询。
26.3K71发布于 2020-08-10
来自专栏让技术和时代并行
如何跳过es分页这个坑？
1、分页查询 1.1、正常分页查询代码如下假设现在你要查询第100页的10条数据，但是对于es来说，from=1000000，size=100，这时 es需要从各个分片上查询出来10000100条数据这个size大小的意思不是总分页的大小，实际数量应该是：所以实际返回的数量是：分片的数量*size 滚动时间设置是指在这个查询搜索结果的缓存时间，时间不能太久，毕竟内存空间是有限的。 ##7、总结： es的分页查询不支持深度分页，如果偏要使用要结合具体业务场景进行使用。不能当成关系型数据库中的分页进行使用。要想提高产品体验和查询效率不能过于依赖技术，要结合需求进行分析以提高体验，因为很多搜索类产品都不支持深度分页。本文的很多代码都是基于es 2.4.6
5.7K50发布于 2019-07-02
来自专栏洁癖是一只狗
ES搜索相似度
今天再来一道面试真题，es的搜索的相似度算法如何计算首先,我们要从这几方面回答 TF(term frequency）检索词频率 IDF(inversed document frequency)反向文档频率中出现的次数，比如上面出现了3次,一个term在所有doc 中出现的次数越多，分数就越低，比如我们的and 或the常用词,就会频繁出现,对分数的贡献就很少，所以分数就比较小字段长度准则 hello搜索的 ---->[2,5] 每一个doc都会计算出term计算出一个分数,hello 一个分数，world一个分数,都会计算出一个分数组，所有的分数组形成一个文档向量查询向量比如hello world,es
1.5K10编辑于 2022-06-24
来自专栏第二蒙古上单
ES搜索内容置顶
有些时候，我们可能需要人工干预ES的搜索结果，让指定的内容置顶，ES提供了pinned语法来实现该功能。 "minimum_should_match" : 1 } } } }, "size" : 10, "from" : 0 } 看文档说似乎是从ES
2.5K30发布于 2021-05-18
来自专栏亦枫的大佬之路
JavaScript中的ES7ES8ES9ES10
2.搜索的开始索引。当第二个参数被传入时，该方法会从索引处开始往后搜索（默认索引值为0）。若搜索值在数组中存在则返回true，否则返回false。 ES9 ES9的新特性索引如下：主要新功能： 1.异步迭代（Domenic Denicola，Kevin Smith） 2.Rest/Spread 属性（SebastianMarkbåge）新的正则表达式功能命名的捕获组 ES9中可以通过名称来识别捕获组：(?[0-9]{4}) 在这里，我们用名称标记了前一个捕获组year。该名称必须是合法的JavaScript标识符（认为变量名称或属性名称）。 <year>[0-9]{4})-(?<month>[0-9]{2})-(?
4.7K40发布于 2020-03-19
来自专栏第三方工具
es分页，pageNum从0开始和es排序代码demo
es分页，pageNum从0开始和es排序代码demo 如果从1开始，每页150条记录，可能查询不到结果。排查下来是初始的第一页的参数错误。参数从0开始计算，es搜素，需要注意起始页。 //es分页，pageNum从0开始。 searchSourceBuilder.from((reqVO.getPageNum()) * reqVO.getPageSize()).size(reqVO.getPageSize()); } //es
22410编辑于 2024-11-21
来自专栏服务端技术杂谈
ES的深度分页解决方案
es search_after也不适合做深度分页，分页多了，内存不够，将查询失败。我们在分页的时候如果用from+size的话，from + size 默认不能超过1万条数据。对于深度分页，到底有没有比较理想的解决方案，既能拉取比较多的数据，拉取的数据也都是有序的？那么你可以了解下search_after。 "_index": "log.xxx.20181120_2", "_type": "logs", "_id": "AWcvRPOwqf9vJFGaVemX " }, "sort": [ 1542686303000, "logs#AWcvRPOwqf9vJFGaVemX 返回了每条数据的es_timestamp和_uid。
2.6K30发布于 2020-06-19
来自专栏写代码和思考
MyBatis 学习笔记(9) 分页查询
背景在 mybatis 中经常用到分页查询，本文介绍下使用 PageHelper 进行分页查询。 2.知识 MyBatis 分页插件 - PageHelper。如果你也在用 MyBatis，建议尝试该分页插件，这一定是最方便使用的分页插件。分页插件支持任何复杂的单表、多表分页。使用分为这几步：配置 mybatis 分页插件代码中使用配置 mybatis 分页插件修改 mybatis-config.xml 配置文件。 <plugins> <! ") List<City> selectByPage1(); List<City> selectByPage2(); } 调用时，像平时一样写查询语句，具体在调用前先 “启动开发分页 page = %s", page); } } 我的代码示例见： https://github.com/vir56k/java_demo/tree/master/mybatisdemo9_
51530发布于 2021-07-08
来自专栏全栈程序员必看
02.全文搜索ES
全文搜索 1.介绍 elasticsearch 6 (和elasticsearch 5 的区别在于，root用户权限、一个库只能建立一个表) elasticsearch 6一个索引只能建立一张表 1.1 文本搜索引擎: 优点:搜索快; 缺点：占用空间。 solr需要依赖zk1. 1.2 elasticSearch(搜索引擎)的算法倒排索引(在内容上建立索引，用内容匹配索引)； btree mysql数据库的索引方式。 nohup.out,使用tail -f nohup.out命令实时监控日志记录 ps -ef |grep node 查看kibana 的pid 使用kill -9 30300 杀死进程 3.ElasticSearch 的文档（分词处理并建立了索引）之间的相关度的高低 4.ES集群 4.1 节点、分片、索引 ==节点:==一个节点就是一个es的服务器，es集群中，主节点负责集群的管理和任务的分发，一般不负责文档的增删改查
1.1K20编辑于 2022-06-30
来自专栏JAVA同学会
ES学习笔记（九）搜索
搜索是ES最最核心的内容，没有之一。前面章节的内容，索引、动态映射、分词器等都是铺垫，最重要的就是最后点击搜索这一下。下面我们就看看点击搜索这一下的背后，都做了哪些事情。分数（score） ES的搜索结果是按照相关分数的高低进行排序的，咦？！怎么没说搜索先说搜索结果的排序了？咱们这里先把这个概念提出来，因为在搜索的过程中，会计算这个分数。在ES的搜索当中，分为两种，一种计算分数，而另外一种是不计算分数的。频繁使用的过滤还会被ES加入到缓存，以提升ES的性能。下面我们看一个查询和过滤的例子，这个也是ES官网中的例子。最后在ES中，检索的花样是比较多的，这里也不能一一给大家介绍了，只介绍一些最基本、最常用的查询功能。下一篇我们看一下ES的聚合查询功能。
66930发布于 2020-05-21
来自专栏JAVA同学会
ES学习笔记（九）搜索
搜索是ES最最核心的内容，没有之一。前面章节的内容，索引、动态映射、分词器等都是铺垫，最重要的就是最后点击搜索这一下。下面我们就看看点击搜索这一下的背后，都做了哪些事情。分数（score） ES的搜索结果是按照相关分数的高低进行排序的，咦？！怎么没说搜索先说搜索结果的排序了？咱们这里先把这个概念提出来，因为在搜索的过程中，会计算这个分数。在ES的搜索当中，分为两种，一种计算分数，而另外一种是不计算分数的。频繁使用的过滤还会被ES加入到缓存，以提升ES的性能。下面我们看一个查询和过滤的例子，这个也是ES官网中的例子。最后在ES中，检索的花样是比较多的，这里也不能一一给大家介绍了，只介绍一些最基本、最常用的查询功能。下一篇我们看一下ES的聚合查询功能。
85130发布于 2020-05-25
来自专栏程序员泥瓦匠
搜索 ES 数据写入原理
写个小文巩固下，本文主要讲 ES -> Lucene 的底层结构，然后详细描述新数据写入 ES 和 Lucene 的流程和原理。无论在开源还是专有领域，Lucene 可以被认为是迄今为止最先进、性能最好的、功能最全的搜索引擎库，并通过简单的 RESTful API 来隐藏 Lucene 的复杂性，从而让全文搜索变得简单。 Elasticsearch 不仅仅是 Lucene 和全文搜索，我们还能这样去描述它：分布式的实时文件存储，每个字段都被索引并可被搜索分布式的实时分析搜索引擎可以扩展到上百台服务器，处理 PB 级结构化或非结构化数据 ES 基于底层这些包，然后进行了扩展，提供了更多的更丰富的查询语句，并且通过 RESTful API 可以更方便地与底层交互。类似 ES 还有 Solr 也是基于 Lucene 实现的。三、新文档写入流程 3.1 数据模型如图一个 ES Index （索引，比如商品搜索索引、订单搜索索引）集群下，有多个 Node （节点）组成。每个节点就是 ES 的实例。
82230编辑于 2021-12-17
来自专栏人生代码
ES6ES7ES8ES9ES10常用特性和新特性
ES6 ES6在ES5的基础上新增了一系列特性，这里仅列出常用特性变量的改变，添加了块级作用域的概念 let声明变量（块级作用域），let是更完美的var，它声明的全局变量不是全局属性widow的变量的重要特性之一，被ES6列为正式规范。 Set Set作为ES6新的数据解构（类数组），它的成员都是唯一的，因为最直接的使用场景便是去重、并、差、交集的使用。 bSet.has(v)); // [ 1 ] ES7 ES7在ES6的基础上添加三项内容：求幂运算符（**）、Array.prototype.includes()方法、函数作用域中严格模式的变更。求幂运算符（**），这是一个中缀例子，效仿自Ruby等语法，使用更简洁 Math.pow(3, 2) === 3 ** 2 // 9 Array.prototype.includes() 数组原型的方法
1.8K30发布于 2020-06-28
来自专栏不仅仅是python
Flask-9 博客帖子分页功能
今天把之前关于Flask_Blog项目中关于帖子的主页展示进行分页，并实现点击用户名称，显示该用户所发的帖子信息和数量。接下来开始： ? 修改Flask_Blog\flaskblog\routes.py，修改home方法使用分页查询方式，每页显示两条数据： ? 添加根据用户姓名查出所发帖子列表方法： ? 修改Flask_Blog\flaskblog\templates\home.html，添加点击用户名跳转到用户所发帖子连接，添加分页html代码： ? 今天关于帖子的分页功能实现就到这里！关注公号下面的是我的公众号二维码图片，欢迎关注。 yale记公众号
1.1K40发布于 2019-07-23

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

【ES三周年】ES查询—海量数据搜索深度分页优化

ElasticSearch 分页搜索

SSM框架——实现分页和搜索分页

【9】分页浏览的管理

es_分组-分页-TransportClient实现

ES 深度分页scroll使用方式

ES分页看这篇就够了

如何跳过es分页这个坑？

ES搜索相似度

ES搜索内容置顶

JavaScript中的ES7ES8ES9ES10

es分页，pageNum从0开始和es排序代码demo

ES的深度分页解决方案

MyBatis 学习笔记(9) 分页查询

02.全文搜索ES

ES学习笔记（九）搜索

ES学习笔记（九）搜索

搜索 ES 数据写入原理

ES6ES7ES8ES9ES10常用特性和新特性

Flask-9 博客帖子分页功能

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐