首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏机器之心

    谷歌搜索用上BERT,10%搜索结果将改善

    最近,谷歌宣布,他们的搜索引擎用上了强大的 BERT 预训练模型,可以让搜索引擎结合语境理解用户的搜索意图,甚至能理解一些不起眼的介词在搜索语句中的重要含义。 为什么谷歌搜索要用 BERT? 「如果要让我说出一条这些年学到的东西,那我会说『人类的好奇心是永无止境的』,」在谷歌搜索部门工作了 15 年的搜索副总裁在谷歌博客中写道。 因为有时他们打开搜索引擎就是为了学习的,所以查到结果之前未必具备相应的知识。 搜索的核心是理解语言。搜索引擎的使命是弄清楚用户的搜索意图并从网上找到有用信息,无论查询语句中的单词如何拼写或组合。 BERT 在谷歌搜索中的应用体现在排名和精选摘要(featured snippet)两个方面。将 BERT 应用于搜索排名之后,谷歌宣称它可以帮助搜索引擎更好地理解美国(英文)10% 的搜索搜索问题,永无止境 无论你想要搜索什么东西,无论你使用哪种语言,谷歌希望人们都可以使用最自然的方式进行搜索。但即使是 BERT 加持,谷歌搜索或许仍然无法让人能够获得 100% 完美的结果。

    1.9K20发布于 2019-10-30
  • 来自专栏捞月亮的小北

    win10搜索框的热门搜索怎么关闭?

    搜索cmd,以管理员模式运行,输入下列命令,重启生效 reg add HKCU\Software\Policies\Microsoft\Windows\explorer /v DisableSearchBoxSuggestions

    56210编辑于 2023-12-01
  • 来自专栏FreeRonin

    替代 Windows 10 任务栏搜索框,让搜索更方便!

    hello,我是FreeRonin,看到一个类似Everything的搜索工具EverythingToolBar,给大家分享一下。 Everything 是一款优秀的文件名搜索工具,它可以非常非常快速的帮你找到想要的文件,只需要搜索文件名即可。 EverythingToolbar 则是一款适用于 Windows 10搜索框工具,它能够直接在任务栏使用 Everything 搜索,非常方便。 注意事项: 初次让Everything Toolbar显示在任务栏它默认会显示在靠近通知区域的左侧(右侧),并只有一个搜索图标(放大镜),取消锁定任务栏(右键点击任务栏,取消勾选锁定任务栏),拖动图标前面将它拉长即可显示搜索框 显示搜索框在搜索框上点击右键,可以选择匹配方式,默认不匹配路径、大小写等,在这里还可以开启正则表达式搜索,更改搜索结果的排序方式。 右键菜单在搜索结果上方,我们可以让它仅显示文件、文件夹。

    2.7K20发布于 2020-12-14
  • 来自专栏罗超频道

    搜索大事件:谷歌在10个国家移动搜索量已超越PC

    Google公布,在美国、日本等10个重要国家,用户通过移动端的谷歌搜索次数已超过了通过PC端的搜索。这也促使谷歌针对移动设备开发更多功能。 谷歌搜索广告副总裁杰瑞.蒂奇勒(Jerry Dischler)表示,谷歌已在10个国家看到了这样的变化。蒂奇勒将在周二关于谷歌AdWords的活动上讨论这一重要的里程碑。 值得注意的是,百度和Google公布的并不是一个数据:Google是移动搜索次数,而百度是移动搜索的流量。 理论上来说,移动搜索每次产生的流量可能更小,毕竟用户在狭窄的手机屏幕上,不会像PC一样点击大量搜索结果进行比对。 Google尽管有Android这一个巨大的移动入口,不过似乎并没有太多受益于此,搜索与Android的整合成效并不显著。这与人们在移动搜索的行为习惯改变有关。

    1K70发布于 2018-04-28
  • 来自专栏在码圈

    win10检索神器-Everything,让你电脑搜索速度提升进10倍!

    检索神器 Everything "Everything" 是 Windows 上免费文件名搜索引擎 下载地址 https://www.voidtools.com/zh-cn/ 作用 在我们日常办公中, 想要准确查找或者定位的一个文件,如果利用win10本身的检索系统,查起来那真是简直了,耗时耗力。 Everything,可以很好的帮我们提高这个办公效率。 它体积小巧,界面简洁易用,快速建立索引,快速搜索,同时占用极低的系统资源,实时跟踪文件变化,并且还可以通过http或ftp形式分享搜索。 对比 一、win10自身检索查询 12秒 二、Everything检索查询 0.5秒

    1.5K20发布于 2020-07-21
  • 来自专栏爱笑的架构师

    2020-10-22在线识图搜索引擎

    前言 最近在逛淘宝时发现了淘宝的图片搜索功能,可能是我太Low了这个技术点已经实现很长时间了。 如果汉明距离小于5,则表示有些不同,但比较相近,如果汉明距离大于10则表明完全不同的图片。 以上就是均值哈希的基本实现思路,总体来说是比较简单的。 灰度值换算:baike.baidu.com/item/灰度值/10… 效果演示: 1、原图查找 ? 2、完全马赛克查找 ?

    1.2K30发布于 2020-10-28
  • 来自专栏java一日一条

    程序员应该掌握的10搜索技巧

    下面介绍 10 个在进行 Google 搜索时可以使用的便捷技巧,其他搜索引擎也支持这 10 种技巧。 1、准确搜索 ? 最简单、有效的准确搜索方式是在关键词上加上双引号,在这种情况下,搜索引擎只会反馈和关键词完全吻合的搜索结果。 巧妙使用「OR」搜索可以让你在未能确定哪个关键词对于搜索结果起决定作用时依然可以确保搜索结果的准确性。 4、同义词搜索 ? 有时候对不太确切的关键词进行搜索反而会显得更加合适。 5、在站内进行搜索 ? 绝大部分网站的搜索功能都有所欠缺,因此,更好的方法是通过 Google 等搜索引擎对站内的信息进行搜索。 例如,你仅需在搜索引擎中输入「related:theguardian.com」即可得到所有和「theguardian.com」相关的网站反馈结果。 10搜索技能的组合使用 ?

    91920发布于 2018-09-18
  • 来自专栏AI研习社

    TinyBERT 搜索:比BERT快10倍,小20倍

    最近,谷歌推出了一种新的方法来进行搜索并决定你看到的结果。这种方法基于流行的开源 transformer BERT,使用语言理解来获取搜索背后的含义,而传统的关键字方法无法做到这一点。 搜索分数对(问题,答案)或(搜索搜索结果),然后根据这些分数对结果进行排序 下面是我们使用的 tinyBERT 架构的 bert_config.json 示例,与标准的 bert_config 有显著的区别 ,是评估搜索和问答模型的理想选择。 虽然没有 BERT-Base 对重新评分有效,但我们的实验表明,它保留了 BERT-Base 的 MRR 评分的 90%,同时使模型快了约 10 倍,小了约 20 倍。 via:https://towardsdatascience.com/tinybert-for-search-10x-faster-and-20x-smaller-than-bert-74cd1b6b5aec

    68321发布于 2020-02-21
  • 来自专栏Python联盟

    10 分钟 纯 Python 搭建全文搜索引擎

    有一个群友在群里问个如何快速搭建一个搜索引擎,在搜索之后我看到了这个 代码所在 Git:https://github.com/asciimoo/searx 官方很贴心,很方便的是已经提供了docker

    1.1K40编辑于 2022-01-27
  • 来自专栏JavaEdge

    获取Top 10热门搜索关键词算法设计

    搜索引擎每天接收大量用户搜索请求,把这些用户输入的搜索关键词记录,再离线统计分析,得到热门TopN搜索关键词。 现有一包含10亿个搜索关键词的日志文件,如何快速获取热门榜Top 10搜索关键词? 6 10亿个搜索关键词日志文件,获取Top 10 很多人说MapReduce,但若将场景限定为单机,可使用内存为1GB,咋办? 用户搜索的关键词很多是重复的,所以先统计每个搜索关键词出现频率。 顺序扫描这10亿个搜索关键词。当扫描到某关键词,去散列表中查询: 存在,对应次数加一 不存在,插入散列表,并记录次数1 等遍历完这10亿个搜索关键词后,散列表就存储了不重复的搜索关键词及出现次数。 以此类推,当遍历完整个散列表中的搜索关键词之后,堆中的搜索关键词就是出现次数最多的Top 10搜索关键词了。 但其实有问题。10亿的关键词还是很多的。 因为相同数据经哈希算法后的哈希值相同,可将10亿条搜索关键词先通过哈希算法分片到10个文件: 创建10个空文件:00~09 遍历这10亿个关键词,并通过某哈希算法求哈希值 哈希值同10取模,结果就是该搜索关键词应被分到的文件编号

    3.3K30编辑于 2023-02-03
  • 来自专栏全栈程序员必看

    解决win10状态栏的搜索框无法搜索本地应用或无反应

    今天突然出现的问题,在状态栏左下角的搜索搜索OneNote没有任何反应, 对,就是这个地方。

    99920编辑于 2022-09-05
  • 来自专栏小孟开发笔记

    win10搜索框点击没反应怎么办 win10搜索框没反应的解决办法分享(还原系统后底部搜索框无法点击)

    win10搜索框点击没反应怎么办?许多用户都有在Win10的底部搜索栏中搜索文件的习惯,但,有的用户会遇到点击Win10搜索框却没有任何响应的问题,不知道应该如何解决。 其实解决该问题的操作还是比较简单的,不知道具体方法的用户,不妨来看看小编整理的关于win10搜索框没反应的解决办法分享吧 win10搜索框点击没反应怎么办 1. 找到右侧的WindowsSearch,进入该选项并将启动类型更改为自动(非延迟启动),然后重启电脑,搜索框就会出现。 #修改之后,重启电脑就可以正常使用底部的搜索了。 未经允许不得转载:肥猫博客 » win10搜索框点击没反应怎么办 win10搜索框没反应的解决办法分享(还原系统后底部搜索框无法点击)

    2K40编辑于 2023-11-03
  • 来自专栏刷题笔记

    7-10 功夫传人 (25分) 图 深度优先搜索

    7-10 功夫传人 (25分) 一门武功能否传承久远并被发扬光大,是要看缘分的。 输入格式: 输入在第一行给出3个正整数,分别是:N(≤10​5 ​​ )——整个师门的总人数(于是每个人从0到N−1编号,祖师爷的编号为0);Z——祖师爷的功力值(不一定是整数,但起码是正数);r — 输入样例: 10 18.0 1.00 3 2 3 5 1 9 1 4 1 7 0 7 2 6 1 1 8 0 9 0 4 0 3 输出样例: 404 分析 下面的内容直接摘得的 这篇博客里没有完成的代码 ,做了修改通过了这道题 【pta7-10 功夫传人 (25分)siackmc】 我明天看看到底是哪里问题 不是AC代码,会运行超时 // 功夫传人:这题考察的是如何计算得道者的武力值,也就是说判断得道者与祖师爷之间的关系 second; iter++; } cout << int(sum); } N/2单链表, 下端有N/2个叶子, 卡N^2算法 这个测试点会超时 分析上面超时的代码 可以发现 搜索

    57220发布于 2021-02-02
  • 来自专栏函数式编程语言及工具

    search(10)- elastic4s-multi_match:多字段全文搜索

    在全文搜索中我们常常会在多个字段中匹配同一个查询条件或者在不同的字段中匹配不同的条件。 全文搜索会产生匹配度评分。boolQuery采取的评分策略是:符合条件的语句越多,评分就越高。如果查询结果按评分倒排序的话,那么排在最前面的就是最有可能的结果了。 那么第一个版本的搜索请求如下: GET /books/_search { "query": { "multi_match": { "query": "和平与战争 托斯泰 人民出版社

    70610发布于 2020-05-18
  • 来自专栏Elasticsearch实验室

    10分钟快速入门海量数据搜索分析引擎 Elasticsearch

    日志从产生到可访问一般在 10s 级,相比于传统大数据解决方案的几十分钟、小时级时效性非常高。ES底层支持倒排索引、列存储等数据结构,使得在日志场景可以利用ES非常灵活的搜索分析能力。 如单个服务最大需达到 10w+ QPS,请求平均响应时间在 20ms以内,查询毛刺低于 100ms,高可用如搜索场景通常要求 4 个 9 的可用性,支持单机房故障容灾等。 集群可扩展性不足,比如集群分片数超10w会出现明显的元数据管理瓶颈。以及集群扩容、节点异常后加回集群,存在节点、多硬盘之间数据不均问题。 通过 CBO 策略,避免缓存较大开销的 Cache 操作导致产生 10+倍的查询毛刺,具体可参考Lucene-9002。 实现 32GB 堆内内存可管理 50 TB 左右磁盘空间,较原生版本有 10 倍提升,并且性能持平,而GC 优势提升明显。

    2.2K7552发布于 2020-08-23
  • 来自专栏程序IT圈

    10分钟彻底理解自适应大邻域搜索算法

    算法介绍 自适应大邻域搜索算法(Adaptive Large Neighborhood Search),简称(ALNS),是由Ropke与Pisinger在2006年提出的一种启发式方法,其在邻域搜索的基础上增加了对算子的作用效果的衡量 应用场景 1.外卖场景:搜索订单分配骑手的最优方案 2.派单场景:搜索订单分配司机的最优方案 3.车辆路径问题 同类算法 在邻域搜索算法中,有的算法可以只使用一种邻域,如「模拟退火算法」,因此它仅仅搜索了解空间的一小部分 ,找到全局最优的概率较小,它的优势之一是可以避免陷入局部最优; 而有的算法可以使用多种算子,如「变邻域搜索算法」(VNS),它通过在当前解的多个邻域中寻找更满意的解,能够大大提高算法在解空间的搜索范围, 但是它在使用算子时盲目地将每种算子形成的邻域结构都搜索一遍,缺少了一些启发式信息的指导; 而「自适应大邻域搜索算法」就弥补了这种不足,这种算法根据算子的历史表现与使用次数选择下一次迭代使用的算子,通过算子间的相互竞争来生成当前解的邻域结构 在搜索的过程中,「ALNS」会对各个destroy和repair方法的权重进行「动态调整」,以便获得更好的邻域和解。

    4.4K10发布于 2021-03-07
  • 来自专栏铭毅天下

    Elasticsearch 搜索工程师笔试面试,请先看这 10 条建议!

    线下求助别人、线上网络搜索或者求助(google、stackoverflow、disscuss.elastic.co)、日志分析、源码分析等。 可以考虑扩展:超哥源码原理书、极客时间搜索原理20讲、lucene 书、算法书补习! 9、扎实的数据结构和算法基本功,游刃有余的分析问题解决问题的能力都是考察点。 10、自信一点 你不自信,老天也救不了你! 不要对心仪的大厂有畏惧心理,更不要对面试官有畏惧心理。 只有极少数面试官会刁难应聘者,问一些连自己都不知道的边边角角细枝末节的问题,以彰显自己多牛逼。 附:一线互联网大厂 Elasticsearch 搜索工程师面试题 1、Elasticsearch 的索引机制 2、为什么用倒排索引 3、为什么倒排索引会快 4、Elasticsearch 做过什么优化吗 10、其他:如何提高ctr(用户点击率)? 11、讲讲个人工作经历。 ---- 首发于:https://t.zsxq.com/JeiQbuN 本文做了部分扩充和修改。

    91930发布于 2020-07-28
  • 来自专栏腾讯云Elasticsearch Service

    10分钟快速入门海量数据搜索分析引擎 Elasticsearch

    日志从产生到可访问一般在 10s 级,相比于传统大数据解决方案的几十分钟、小时级时效性非常高。ES底层支持倒排索引、列存储等数据结构,使得在日志场景可以利用ES非常灵活的搜索分析能力。 如单个服务最大需达到 10w+ QPS,请求平均响应时间在 20ms以内,查询毛刺低于 100ms,高可用如搜索场景通常要求 4 个 9 的可用性,支持单机房故障容灾等。 集群可扩展性不足,比如集群分片数超10w会出现明显的元数据管理瓶颈。以及集群扩容、节点异常后加回集群,存在节点、多硬盘之间数据不均问题。 通过 CBO 策略,避免缓存较大开销的 Cache 操作导致产生 10+倍的查询毛刺,具体可参考Lucene-9002。 实现 32GB 堆内内存可管理 50 TB 左右磁盘空间,较原生版本有 10 倍提升,并且性能持平,而GC 优势提升明显。

    1.9K61发布于 2020-08-24
  • 来自专栏小工匠聊架构

    白话Elasticsearch10-深度探秘搜索技术之基于dis_max实现best fields策略进行多字段搜索

    Ky5","userID":3,"hidden":false,"postDate":"2019-06-01","tag":["elasticsearch"],"tag_cnt":1,"view_cnt":10 "tag": [ "elasticsearch" ], "tag_cnt": 1, "view_cnt": 10 "tag": [ "elasticsearch" ], "tag_cnt": 1, "view_cnt": 10 "tag": [ "elasticsearch" ], "tag_cnt": 1, "view_cnt": 10 best elasticsearch article" } } ] } } ---- best fields策略-dis_max best fields策略 : 搜索到的结果

    89430发布于 2021-08-17
  • 来自专栏chenjx85的技术专栏

    超参数搜索——网格搜索和随机搜索

    我们在搜索超参数的时候,如果超参数个数较少(三四个或者更少),那么我们可以采用网格搜素,一种穷尽式的搜索方法。 但是当超参数个数比较多的时候,我们仍然采用网格搜索,那么搜索所需时间将会指数级上升。 比如我们有四个超参数,每个范围都是[10,100],那么我们所需的搜索次数是10*10*10*10=10^4。 如果再增加一个超参数,那么所需的搜索次数是10^5,搜索时间指数级上升。 所以出现了这样的做法,网格搜索,但是网格取稀疏一点,比如上面例子中的[10,100],我们就去10,30,50,70,90这几个数,降低一下搜索次数。 所以又有人提出了随机搜索的方法,随机在超参数空间中搜索几十几百个点,其中就有可能会有比较小的值。 这种做法比上面稀疏化网格的做法快,而且实验证明,随机搜索法结果比稀疏化网格法稍好。 这样可以保证我们找到一个局部最小值点,结果可能会比随机搜索稍好一点。 当然,如果随机搜索直接得到更好的局部最小值,甚至全局最小值,那么……只能说你的运气爆表了。

    3.3K30发布于 2018-08-16
领券