首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏站长的编程笔记

    搜索:自建搜索引擎的技术解析与实践

    搜索面向的用户群体非常广泛。 对于学生和研究人员来说,搜索可以帮助他们快速找到学术资料、研究报告等学习资源;对于职场人士来说,搜索能够提供行业动态、市场分析报告等信息,助力他们更好地开展工作;对于普通网民来说,搜索则是一个获取生活资讯 搜索的索引库采用了先进的数据结构和算法,能够快速、准确地检索出用户需要的信息。缓存系统也是搜索架构中的重要组成部分。 border:0;}.zs-input-group{display:flex;flex:1;min-width:180px;gap:8px;flex-wrap:wrap;}.zs-input{flex:3; 1pxsolid#ccc;border-radius:8px;outline:none;transition:all0.2sease;background-color:#fff;color:#1f2d3d

    7210编辑于 2026-03-31
  • 来自专栏Cell的前端专栏

    广

    1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

    89320编辑于 2022-02-25
  • 来自专栏python3

    3分钟了解Mysql空间GeoHash

    简单介绍: Mysql 内置函数方案,适合于已有业务,新增加LBS功能,增加经纬度字段方可,避免数据迁移,在5.7.5后实现更多功能实现INNODB的空间方法,之前版本主要是对MYISAM的支持。 解决办法:      1、把WHERE后的表达式处理成一个变量进行引用,然后进行周边         SET @aa=(SELECT LINESTRING(POINT( 39.5591182422 + - 10 / ( 111.12 / COS(RADIANS(118.1964111328))),118.1964111328 -10 / 111.12)) AS  heji)      2、执行周边 ) AS dist, ST_AsText(oint) FROM shop_id      WHERE ST_Contains( ST_MakeEnvelope( POINT((-73.951368+(3/ 111)), (40.716743+(3/111))),       POINT((-73.951368-(3/111.12)), (40.716743-(3/111.12))) ), oint ) 

    2.3K20发布于 2020-01-07
  • 好物周刊#114:素材

    3. Ech0[3] 一款专为轻量级分享而设计的开源自托管平台,支持快速发布与分享你的想法、文字与链接。 3. MediaNex[6] 一个强大的视频播放器,支持各种协议和云盘,自动为视频生成精美的海报墙。 三、网站 1. 3. XCloud 音乐 [9] 在线听歌,跨平台音乐播放器,支持网易云、酷狗、酷我多平台! 四、插件 1. 3. 有道灵动翻译 [12] 使用有道翻译大模型,沉浸式网页翻译的首选工具!支持以下功能: ・实时对照翻译:让任何网页变成对照。 ・图片翻译:轻松提取图片文字 ・输入框即时翻译:输入中文轻松变英文。 3. VitePress 教程 [15] 给零基础的朋友,提供一些上手经验,让你爱上 VitePress。

    12410编辑于 2026-03-26
  • 来自专栏新智元

    北大数学天才柳宇下山还俗引爆热!人在中关村,月入2万

    ---- 新元报道   编辑:Aeneas 桃子 【新元导读】12年前拒绝MIT全奖offer遁入空门的柳宇,如今已经还俗,每天的工作是开发心理学课程。这位数学天才,经历了怎样的人生? 昨天,「北大数学天才柳宇下山还俗」的话题,登上微博热。 围观的网友感慨道: 这个十二年前在出家后震惊全国的数学天才,终于回归熙攘的人世间了。 公司承诺给3万月薪,但他主动要求降至2万,觉得应该把钱留给「更需要的人」。 就如同庄子所言:身在事中迷,心在物外。 其实,柳宇日后的选择,早在童年时就已显出端倪。 1988年,柳宇出生于湖北武汉,母亲是一名工程师,父亲是一名物理老师。 share_token=C5C1774D-52F9-4948-AF4B-8FE420FFEF27&group_id=7138291470531985960 https://weibo.com/1642088277/M3KFthjDa

    69820编辑于 2022-09-06
  • 来自专栏软件测试小助手

    3分钟实现语音播报微博热

    前几天看到一篇爬取微博热并语音播报的文章,觉得很好玩,就试着自己写了一下,我写的是简单版的代码,为了便于理解,做完熬夜做了一个小视频讲解。 主要思路: 1、获取热页面的返回数据 2、筛选热页面中的热名称、排行等信息 3、百度语音播报 ? 微博热页面:https://s.weibo.com/top/summary 这个页面不需要用户登录,就能获取页面数据,所以我们不需要考虑登录时获取token的问题,这个下次会单独做个视频讲解。 = hot_search_name[1:] # 只取热排行,不取置顶热 for i in range(0, 10): s = '第'+hot_search_rank # 识别正确返回语音二进制 错误则返回dict 参照下面错误码 if not isinstance(result, dict): with open('auido.mp3'

    1.1K20发布于 2020-06-19
  • 来自专栏巴山学长

    科研小助手推荐第九期 —— 空气

    在实际科研中,有时候可能需要在本地查找含有某个关键词的单个或多个文件,而Everything显然是不能胜任这项工作的。那有没有这样一款可以检索文本内容的工具呢?答案是肯定。

    1.3K50发布于 2021-08-26
  • 来自专栏站长的编程笔记

    搜索:PHP全栈驱动的多引擎协同搜索引擎技术架构解析

    一、架构总览:PHP全栈+多引擎的分布式协同架构搜索作为一款自主研发的高性能搜索引擎,创新性地采用PHP全栈开发模式(前端交互层与后端服务层均基于PHP实现),整合ElasticSearch(ES) 二、核心组件技术解析与协同机制(一)多语言爬虫集群:数据采集的立体化解决方案搜索采用Python+Java+C++三级爬虫架构,针对不同数据场景实现精准采集:Python爬虫:基于Scrapy框架构建 ElasticSearch:检索核心的倒排索引引擎ES作为搜索的核心检索引擎,负责全文检索与多维度聚合分析。 四、技术架构优势与应用场景搜索的技术架构通过PHP全栈开发与多引擎协同,实现了三大核心优势:灵活性:MongoDB的动态Schema与PHP的快速开发特性,支持新业务场景(如垂直领域检索、个性化推荐 ·站点搜索增强组件:<formaction="https://www.a6f.top/s/"target="_blank"accept-charset="GBK"class="zs-search-form

    7410编辑于 2026-03-31
  • 来自专栏机器学习AI算法工程

    深度学习--CLIP算法(文本图片,图片图片)

    3. CLIP模型优缺点总结 优点 zero-shot做得好,经过在400million大的未清洗的数据集上训练,在不同的数据集上表现还可以,可以自定义任务,而且效率很高。 高效,虽然GPT3做zero-shot也很好,但是CLIP吃的资源少,计算量少,训练效率高。最好的一版CLIP只在256个GPU上训练两周就好了,跟目前图像领域的其他大模型都差不多。

    4.1K30编辑于 2023-09-04
  • 来自专栏Java

    队列+宽

    给你二叉树的根节点 root ,返回其节点值的 锯齿形层序遍历 。(即先从左往右,再从右往左进行下一层遍历,以此类推,层与层之间交替进行)。

    63010编辑于 2024-12-24
  • 来自专栏站长的编程笔记

    搜索:基于PHP全栈架构的高并发实时搜索引擎设计与实现

    二、搜索整体架构设计2.1架构分层与核心目标搜索采用分层解耦架构,将系统划分为“数据采集-存储-计算-服务”四层,各层通过标准化接口通信,确保扩展性与维护性。 3.2存储与缓存体系3.2.1ElasticSearch:索引设计与映射(Mapping)ElasticSearch是搜索的核心检索引擎,其索引设计直接影响检索效率与排序准确性。 3.3多语言爬虫系统搜索的爬虫系统采用“主从架构+多语言协同”设计,由1个JavaMaster节点调度任务,Python/Java/C++Worker节点执行爬取。 四、高并发实时检索实现搜索需支撑10万+QPS的并发查询,核心通过“分布式架构+缓存优化+资源隔离”实现。 5.2结果排序算法:多因子融合模型搜索的排序算法基于“基础相关性+权威性+时效性+个性化”四维度融合,核心公式为:Score=w1​⋅BM25+w2​⋅PageRank+w3​⋅Recency+w4​

    10310编辑于 2026-03-31
  • 来自专栏站长的编程笔记

    搜索:PHP 全栈驱动的分布式搜索引擎技术架构与实现

    搜索:PHP全栈驱动的分布式搜索引擎技术架构与实现摘要搜索作为一款自主研发的分布式搜索引擎,采用PHP全栈开发(前端+后端),整合ElasticSearch(ES)、Redis、Kafka、MySQL 搜索的核心需求的是:1)支持亿级网页数据的分布式抓取与存储;2)实现秒级索引更新与毫秒级检索响应;3)提供精准的域名限定搜索(site语法);4)保障系统高可用与可扩展性。 3核心模块技术实现3.1分布式爬虫集群:多语言协同的高效数据抓取3.1.1爬虫架构设计搜索爬虫集群采用“主从架构+任务调度+分布式去重”设计,核心分为三大组件:任务调度中心、多语言爬虫节点、数据处理节点 搜索的技术实践表明,PHP全栈结合成熟的中间件与多语言爬虫,完全有能力构建高性能、高可用的分布式搜索引擎。 未来,随着人工智能、大数据技术的发展,搜索将持续迭代优化,为用户提供更精准、更高效、更智能的搜索服务。

    8010编辑于 2026-03-31
  • 来自专栏亨利笔记

    源Emu3登顶Nature

    题图摄于故宫神武门 近期国内 AI 圈最大的新闻之一莫过于中国源的Emu3多模态大模型,登上了 Nature 正刊! Emu3到底牛在哪? 效果也很惊人:参数量比传统模型少60%(相当于大脑变小了,但更聪明),训练效率提升3倍(原来练1年,现在3个月就够),部署起来也更轻便。 2. Emu3成长时间线 Emu3不是突然“封神”的,它的成长路线很清晰,每一步都在迭代升级,咱们用时间线,一眼看懂它的进化史: 2022年:启动研发——源研究院正式立项,定下“原生多模态”的目标(就是不搞组装 Emu3的封神,只是开始 看完这些,相信大家都懂了:Emu3 能登 Nature,不是偶然,而是“极简创新+海量积累+开源精神”的结果。

    36810编辑于 2026-02-04
  • 来自专栏站长的编程笔记

    搜索:基于 PHP 生态的分布式搜索引擎技术实现与架构解析

    本文将从架构设计、核心组件实现、数据流转机制、核心功能突破、性能优化等维度,全面拆解搜索的技术实现细节,为PHP生态下的搜索引擎开发提供实践参考。 一、搜索整体架构设计1.1架构设计理念搜索的架构设计遵循“解耦、可扩展、高可用”三大原则,针对搜索引擎“高并发查询、海量数据存储、实时数据更新”的核心需求,采用分层架构模式,自上而下分为前端交互层 搜索通过“索引优化+查询解析+结果排序”的全链路设计,实现高效精准的site检索。 五、总结与展望搜索基于PHP生态构建,通过合理的架构设计与技术选型,解决了PHP在高并发、海量数据场景下的性能瓶颈,实现了包括site:精准检索在内的核心搜索引擎功能。 搜索的实践证明,PHP生态在搜索引擎领域并非“非主流”,通过合理的技术选型与优化,完全可以支撑中大型分布式搜索引擎的构建,为PHP开发者提供了新的技术实践参考。

    11610编辑于 2026-03-31
  • 来自专栏算法工程师之路

    和广问题-LeetCode 110、104(DFS, BFS)

    示例: 给定二叉树 [3,9,20,null,null,15,7], 3 / \ 9 20 / \ 15 7 返回它的最大深度 3 。 示例 1: 给定二叉树 [3,9,20,null,null,15,7] 3 / \ 9 20 / \ 15 7 返回 true 。

    1.4K10发布于 2019-10-13
  • 来自专栏木下学Python

    爬取历史热,武汉到底上了几次热

    这次小编带大家从技术的角度看一看,自从疫情爆发以来,探索一下武汉到底上了微博多少次热。 数据获取 小编选取了 “微博热神器” 作为爬取目标: ? 我们得到权限后,向下滑,发现是 ajax 加载的,我们的目标是爬取 2020 年 1 月至 2 月中旬以来武汉的历史热数据,发现有 20 页数据: ? 我们查看请求方式为 post 请求: ? 热走势 得到数据后,我们对历史热次数做一个日历图: ? 从日历图中看出,武汉 1月 20 号以前上热次数较少,大概从 20 号左右以后次数突然变多了,走势图如下: ? 从走势图看出 1 月 20 号以后,武汉上热次数突然激增,这是由于疫情突然爆发了,全国的焦点都时刻关注着武汉,导致微博热,武汉上的次数变多。

    2K10发布于 2020-02-24
  • 来自专栏算法其实很好玩

    Day22-图算法-图的深和宽

    今天先更一下图算法的基础知识-宽和深 二 问题来了 Q:给定一个图,给出图的深度优先搜索和宽度优先搜索结果。 ? neighbors.push_back(graph[0]); graph[1]->neighbors.push_back(graph[2]); graph[2]->neighbors.push_back(graph[3] ); graph[3]->neighbors.push_back(graph[4]); graph[4]->neighbors.push_back(graph[3]); int

    1.1K20发布于 2019-07-15
  • 来自专栏数据结构与算法

    数据结构与算法 | 深(DFS)与广(BFS)

    (DFS)与广(BFS) 在查找二叉树某个节点时,如果把二叉树所有节点理解为解空间,待找到那个节点理解为满足特定条件的解,对此解答可以抽象描述为: 在解空间中搜索满足特定条件的解,这其实就是搜索算法

    1.7K231编辑于 2023-10-26
  • 来自专栏新智元

    源BGE-VL拍照提问即可精准,170数据击穿多模态检索天花板!

    编辑:编辑部 HYZ 【新元导读】源联手多所顶尖高校发布的多模态向量模型BGE-VL,重塑了AI检索领域的游戏规则。 近日,源研究院联合多所高校开发了多模态向量模型BGE-VL,进一步扩充了原有生态体系。BGE-VL在图文检索、组合图像检索等主要多模态检索任务中均取得了最佳效果。 为解决这一限制,源BGE团队创新性地提出了MegaPairs数据合成方法。 BGE-VL模型 基于MegaPairs合成的大规模多模态检索指令数据集,源BGE团队训练出了3款不同尺寸的多模态检索模型。 组合图像检索性能 传统图像检索通常采用「文图」或「图图」的方式。近年来,组合图像检索作为一种新兴的图像搜索范式,允许用户同时输入图像和搜索指令,实现更精准的图像检索效果。

    42200编辑于 2025-03-06
  • 来自专栏Hcode网站

    Python3教务系统个人课表爬虫

    all_data = [] pitch_number = ['(上午)\n第1,2节\n(08:00-08:45)\n(08:55-09:40)', '(上午)\n第3, all_data = [] pitch_number = ['(上午)\n第1,2节\n(08:00-08:45)\n(08:55-09:40)', '(上午)\n第3, ="o+/=";p q(a){b e="";b 8,5,7="";b f,g,c,1="";b i=0;m{8=a.h(i++);5=a.h(i++);7=a.h(i++);f=8>>2;g=((8&3) 7)){1=l}e=e+9.d(f)+9.d(g)+9.d(c)+9.d(1);8=5=7="";f=g=c=1=""}u(i<a.n);r e}',32,32,'|enc4||||chr2||chr3| chr1|keyStr|input|var|enc3|charAt|output|enc1|enc2|charCodeAt||isNaN|if|64|do|length|ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789

    1.5K30发布于 2020-07-14
领券