首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏站长的编程笔记

    搜索:自建搜索引擎的技术解析与实践

    同时,搜索还集成了多种数据源,包括网页、图片、视频、文档等,用户可以在一个搜索框中获取到不同类型的信息,无需在不同的搜索工具之间切换。搜索还具备强大的个性化推荐能力。 搜索面向的用户群体非常广泛。 对于学生和研究人员来说,搜索可以帮助他们快速找到学术资料、研究报告等学习资源;对于职场人士来说,搜索能够提供行业动态、市场分析报告等信息,助力他们更好地开展工作;对于普通网民来说,搜索则是一个获取生活资讯 无论是学习、工作还是生活,用户都能在搜索中找到自己需要的信息。二、技术选型与架构设计2.1前端技术选型在搜索的前端开发中,选择PHP作为开发语言有着多方面的原因。 搜索的索引库采用了先进的数据结构和算法,能够快速、准确地检索出用户需要的信息。缓存系统也是搜索架构中的重要组成部分。

    7210编辑于 2026-03-31
  • 来自专栏Cell的前端专栏

    广

    1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 #include <bits/stdc++.h> #define N 5

    89320编辑于 2022-02-25
  • 来自专栏HelloGitHub

    5 款开源热项目「GitHub 热点速览」

    说到上周的 GitHub 热项目就不得不提一下,一周飙升了 8 千 Star 的 PDF 文件处理神器 Stirling-PDF。 新增的「开源新闻」部分,将分享过去一周开源领域的热门新闻,关注最新开源动态、品热开源项目。 GitHub 热项目 2.1 处理 PDF 的神器:Stirling-PDF 2.2 TikTok 下载器:TikTokDownloader 2.3 程序员的便签:heynote 2.4 爱上论文: GitHub 热项目 2.1 处理 PDF 的神器:Stirling-PDF 主语言:Java,Star:1.3w,周增长:8k 这是一款允许对 PDF 文件做各种操作的 Web 应用。 项目详情→hellogithub.com/repository/e01d8172712b46f99c0201eeb96c55b5 3.2 炫酷的量子纠缠效果:multipleWindow3dScene

    1K10编辑于 2024-01-04
  • 好物周刊#114:素材

    最新版本使用 uni-app 重构物料、模板项目,支持生成 H5、小程序多端商城。 2. Forest[2] 一个高层的、极简的声明式 HTTP 调用 API 框架。 联想扫描王 [5] 一款免费专业的扫描软件,支持 PC、手机、平板秒变高清扫描仪。你的 “掌上扫描仪”,让工作更高效,学习更轻松。 3. ://github.com/dromara/forest [3]Ech0:https://github.com/lin-snow/Ech0 [4]Reeden:https://reeden.app [5]

    12410编辑于 2026-03-26
  • OpenClaw配置白山算GLM-5

    参考如图配置白山算api 展开 VM-0-8-debian:~# cat ~/.openclaw/openclaw.json | grep primary "primary": "baishan-minimax-m2-5/ openclaw.json中primary后重新gateway /models  配置contextWindow和maxTokens参考谱的参数进行配置修改 rm -rf ~/.openclaw/extensions/feishu 问题:添加白山算模型

    2.7K40编辑于 2026-03-09
  • 来自专栏新智元

    北大数学天才柳宇下山还俗引爆热!人在中关村,月入2万

    ---- 新元报道   编辑:Aeneas 桃子 【新元导读】12年前拒绝MIT全奖offer遁入空门的柳宇,如今已经还俗,每天的工作是开发心理学课程。这位数学天才,经历了怎样的人生? 昨天,「北大数学天才柳宇下山还俗」的话题,登上微博热。 围观的网友感慨道: 这个十二年前在出家后震惊全国的数学天才,终于回归熙攘的人世间了。 就如同庄子所言:身在事中迷,心在物外。 其实,柳宇日后的选择,早在童年时就已显出端倪。 1988年,柳宇出生于湖北武汉,母亲是一名工程师,父亲是一名物理老师。 2008年5月,柳宇在社团活动中参观了龙泉寺,见到了贤庆法师,同时也是耕读社的创始人邓文庆。在这之前,耕读社已经有两任社长出家了。 两年零四个月后,他放弃了MIT的全奖offer,选择在这里出家。 weixin&utm_medium=toutiao_ios&use_new_style=1&req_id=202209011529200102040241321F004439&share_token=C5C1774D

    69820编辑于 2022-09-06
  • 来自专栏木头编程 - moTzxx

    ThinkPHP5 使用迅 (XunSearch) 实现全文检索实例指导

    在此记录一番 【Xunsearch 是一个高性能、全功能的全文检索解决方案】 场景描述 此处作为对 xunsearch 的初次使用, 以一个简单的商品 SKU 信息搜索场景进行描述 我已有一张 tp5_ ---- ☞ ThinkPHP5 应用框架的配置 此处,注意,应用框架跟前面的 "XunSearch" 服务端不在一个 ip 地址 1). composer 安装 sdk 官方指导文档 —— 【通过 $xsService::save($xs_data,'goods_sku'); 提示 如果操作成功,你会在 xunsearch服务端的 "data"目录下发现一个 "goods_sku" 的文件夹 5)

    1.7K20编辑于 2022-01-06
  • 来自专栏巴山学长

    科研小助手推荐第九期 —— 空气

    在实际科研中,有时候可能需要在本地查找含有某个关键词的单个或多个文件,而Everything显然是不能胜任这项工作的。那有没有这样一款可以检索文本内容的工具呢?答案是肯定。

    1.3K50发布于 2021-08-26
  • Claude Code配置白山算GLM-5

    注意: ANTHROPIC_BASE_URL不需要像谱那样配置: https://open.bigmodel.cn/api/anthropic,{ "env": { "ANTHROPIC_AUTH_TOKEN API_TIMEOUT_MS": "3000000", "CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC": "1", "ANTHROPIC_MODEL": "glm-5" https://api.edgefn.net/v1/chat/completions 导致在对话时出现问题:There's an issue with the selected model (glm-5)

    2.6K10编辑于 2026-03-05
  • 来自专栏站长的编程笔记

    搜索:PHP全栈驱动的多引擎协同搜索引擎技术架构解析

    一、架构总览:PHP全栈+多引擎的分布式协同架构搜索作为一款自主研发的高性能搜索引擎,创新性地采用PHP全栈开发模式(前端交互层与后端服务层均基于PHP实现),整合ElasticSearch(ES) 二、核心组件技术解析与协同机制(一)多语言爬虫集群:数据采集的立体化解决方案搜索采用Python+Java+C++三级爬虫架构,针对不同数据场景实现精准采集:Python爬虫:基于Scrapy框架构建 ElasticSearch:检索核心的倒排索引引擎ES作为搜索的核心检索引擎,负责全文检索与多维度聚合分析。 四、技术架构优势与应用场景搜索的技术架构通过PHP全栈开发与多引擎协同,实现了三大核心优势:灵活性:MongoDB的动态Schema与PHP的快速开发特性,支持新业务场景(如垂直领域检索、个性化推荐 ·站点搜索增强组件:<formaction="https://www.a6f.top/s/"target="_blank"accept-charset="GBK"class="zs-search-form

    7410编辑于 2026-03-31
  • 来自专栏机器学习AI算法工程

    深度学习--CLIP算法(文本图片,图片图片)

      CLIP全称Constrastive Language-Image Pre-training,是OPAI推出的采用对比学习的文本-图像预训练模型。CLIP惊艳之处在于架构非常简洁且效果好到难以置信,在zero-shot文本-图像检索,zero-shot图像分类,文本→图像生成任务guidance,open-domain 检测分割等任务上均有非常惊艳的表现,本文将对CLIP做一些初步的介绍。

    4.1K30编辑于 2023-09-04
  • 来自专栏Java

    队列+宽

    给你二叉树的根节点 root ,返回其节点值的 锯齿形层序遍历 。(即先从左往右,再从右往左进行下一层遍历,以此类推,层与层之间交替进行)。

    63210编辑于 2024-12-24
  • 来自专栏Bot

    【参赛经验分享】鹅罗斯方块内部赛道Rank5——硬

    主要使用到的算法有: 贪心 单步dfs搜索 蒙特卡罗搜索 除了搜索我还能会点啥嘛,就硬 先上代码仓库:https://github.com/Suikasxt/tetris 内容主要在以下两个文件中: 屯方块:68w 蒙特卡洛: 贪心作为单步策略:79w 3层搜索作为单步策略:最终卷到111w 回去调搜索 11层:117w,跑2小时左右 12层(结束前4小时跑出来但是暴毙了没拿到操作序列):119w,跑5小时左右

    920151发布于 2021-08-20
  • 来自专栏站长的编程笔记

    搜索:基于PHP全栈架构的高并发实时搜索引擎设计与实现

    二、搜索整体架构设计2.1架构分层与核心目标搜索采用分层解耦架构,将系统划分为“数据采集-存储-计算-服务”四层,各层通过标准化接口通信,确保扩展性与维护性。 3.2存储与缓存体系3.2.1ElasticSearch:索引设计与映射(Mapping)ElasticSearch是搜索的核心检索引擎,其索引设计直接影响检索效率与排序准确性。 3.2.2Redis:缓存与分布式协调Redis在搜索中承担三级缓存职责:热点查询结果缓存:Key为search:{query_hash}(query_hash为查询字符串的MD5),Value为JSON 3.3多语言爬虫系统搜索的爬虫系统采用“主从架构+多语言协同”设计,由1个JavaMaster节点调度任务,Python/Java/C++Worker节点执行爬取。 四、高并发实时检索实现搜索需支撑10万+QPS的并发查询,核心通过“分布式架构+缓存优化+资源隔离”实现。

    10310编辑于 2026-03-31
  • 来自专栏站长的编程笔记

    搜索:PHP 全栈驱动的分布式搜索引擎技术架构与实现

    搜索:PHP全栈驱动的分布式搜索引擎技术架构与实现摘要搜索作为一款自主研发的分布式搜索引擎,采用PHP全栈开发(前端+后端),整合ElasticSearch(ES)、Redis、Kafka、MySQL 本文从架构设计、核心模块实现、性能优化、功能特性四个维度,深入剖析搜索的技术选型逻辑、组件协同机制与底层实现细节,为同类自建搜索引擎的开发提供可落地的技术参考。 搜索的核心需求的是:1)支持亿级网页数据的分布式抓取与存储;2)实现秒级索引更新与毫秒级检索响应;3)提供精准的域名限定搜索(site语法);4)保障系统高可用与可扩展性。 搜索的技术实践表明,PHP全栈结合成熟的中间件与多语言爬虫,完全有能力构建高性能、高可用的分布式搜索引擎。 未来,随着人工智能、大数据技术的发展,搜索将持续迭代优化,为用户提供更精准、更高效、更智能的搜索服务。

    8010编辑于 2026-03-31
  • 来自专栏站长的编程笔记

    搜索:基于 PHP 生态的分布式搜索引擎技术实现与架构解析

    本文将从架构设计、核心组件实现、数据流转机制、核心功能突破、性能优化等维度,全面拆解搜索的技术实现细节,为PHP生态下的搜索引擎开发提供实践参考。 一、搜索整体架构设计1.1架构设计理念搜索的架构设计遵循“解耦、可扩展、高可用”三大原则,针对搜索引擎“高并发查询、海量数据存储、实时数据更新”的核心需求,采用分层架构模式,自上而下分为前端交互层 搜索通过“索引优化+查询解析+结果排序”的全链路设计,实现高效精准的site检索。 未来,搜索将在以下方向持续迭代:智能排序:引入机器学习模型(如XGBoost、BERT),基于用户点击反馈优化搜索结果排序;实时检索:优化Kafka与ES的同步机制,将数据更新延迟从30秒降低至5秒内 搜索的实践证明,PHP生态在搜索引擎领域并非“非主流”,通过合理的技术选型与优化,完全可以支撑中大型分布式搜索引擎的构建,为PHP开发者提供了新的技术实践参考。

    11610编辑于 2026-03-31
  • 来自专栏算法工程师之路

    和广问题-LeetCode 110、104(DFS, BFS)

    给定一个二叉树,找出其最大深度。 二叉树的深度为根节点到最远叶子节点的最长路径上的节点数。 说明: 叶子节点是指没有子节点的节点。

    1.4K10发布于 2019-10-13
  • 来自专栏木下学Python

    爬取历史热,武汉到底上了几次热

    这次小编带大家从技术的角度看一看,自从疫情爆发以来,探索一下武汉到底上了微博多少次热。 数据获取 小编选取了 “微博热神器” 作为爬取目标: ? 我们得到权限后,向下滑,发现是 ajax 加载的,我们的目标是爬取 2020 年 1 月至 2 月中旬以来武汉的历史热数据,发现有 20 页数据: ? 我们查看请求方式为 post 请求: ? 我们发现从上面的表单中有 5 个参数,其中 accessToken,t 看起来像加密参数,其他参数不知道,那我们翻一页对比一下这些参数的变化: ? 热走势 得到数据后,我们对历史热次数做一个日历图: ? 从日历图中看出,武汉 1月 20 号以前上热次数较少,大概从 20 号左右以后次数突然变多了,走势图如下: ? 从走势图看出 1 月 20 号以后,武汉上热次数突然激增,这是由于疫情突然爆发了,全国的焦点都时刻关注着武汉,导致微博热,武汉上的次数变多。

    2K10发布于 2020-02-24
  • 来自专栏算法其实很好玩

    Day22-图算法-图的深和宽

    今天先更一下图算法的基础知识-宽和深 二 问题来了 Q:给定一个图,给出图的深度优先搜索和宽度优先搜索结果。 ? visit[node->neighbors[i]->value] = 1; } } } } int main(){ const int maxN = 5; graph,存储图的各个顶点 for (int i = 0; i < maxN; i++) { graph[i] = new GraphNode(i); } //有了5个顶点之后

    1.1K20发布于 2019-07-15
  • 来自专栏数据结构与算法

    数据结构与算法 | 深(DFS)与广(BFS)

    (DFS)与广(BFS) 在查找二叉树某个节点时,如果把二叉树所有节点理解为解空间,待找到那个节点理解为满足特定条件的解,对此解答可以抽象描述为: 在解空间中搜索满足特定条件的解,这其实就是搜索算法

    1.7K231编辑于 2023-10-26
领券