首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏后端开发从入门到入魔

    7-2 寻找大富翁

    7-2 寻找大富翁 分数 25 全屏浏览题目 切换布局 作者 陈越 单位 浙江大学 胡润研究院的调查显示,截至2017年底,中国个人资产超过1亿元的高净值人群达15万人。

    27710编辑于 2024-03-01
  • 来自专栏算法与数据结构

    PTA 7-2 符号配对(20 分)

    7-2 符号配对(20 分) 请编写程序检查C语言源程序中下列符号是否配对:/*与*/、(与)、[与]、{与}。 输入格式: 输入为一个C语言源程序。

    6.1K71发布于 2017-12-29
  • 来自专栏NLP/KG

    向量召回:深入评估离线体系,探索优质召回方法

    向量召回:深入评估离线体系,探索优质召回方法1.简介近年来,基于向量进行召回的做法在搜索和推荐领域都得到了比较广泛的应用,并且在学术界发表的论文中,基于向量的 dense retrieve 的方法也在不少数据集上都战胜了 在内网的不少文章中也都介绍了各种不同的模型和算法,但是目前我们还没有看到比较系统的介绍向量召回评估体系的文章,在这里我们抛砖引玉,对搜索在将向量召回应用到搜索方向过程中积累的召回评估方面的内容,进行了梳理和归纳 基于此,我们考虑可以固定不同版本模型建立的索引的召回条数,在线召回时统计通过截断模型后保留下来的结果的数量,以此作为模型在全量索引上的召回评估指标。 离线模型迭代指标A.召回指标: R1/R2/RAUC 等召回指标,衡量模型的召回率情况B.聚类指标: 衡量聚类的损失情况。 3.针对问题 3,我们对召回的结果计算 query 与召回结果之间的字重合度和 CQR(Title 分词对 Query 分词的覆盖情况),以此来衡量召回结果的下限,防止出现既召回部分非常好的结果,但同时也召回大量非常差的结果

    1.6K20编辑于 2023-10-17
  • 来自专栏刷题笔记

    7-2 树种统计 (20 分)

    本文链接:https://blog.csdn.net/shiliang97/article/details/102924532 7-2 树种统计 (20 分) 随着卫星成像技术的应用,自然资源研究机构可以识别每一棵树的种类

    1.1K10发布于 2019-11-07
  • 来自专栏freesan44

    PTA 7-2 找奇葩 (20 分)

    在一个长度为 n 的正整数序列中,所有的奇数都出现了偶数次,只有一个奇葩奇数出现了奇数次。你的任务就是找出这个奇葩。

    31820发布于 2021-09-10
  • 来自专栏刷题笔记

    7-2 到底有多二

    本文链接:https://blog.csdn.net/shiliang97/article/details/96301355 7-2 到底有多二 一个整数“犯二的程度”定义为该数字中包含2的个数与其位数的比值

    75330发布于 2019-11-08
  • 来自专栏常用算法专栏

    影响召回的准确性和召回速度的因素

    这些因素对召回的准确性和召回速度的影响主要体现在以下几个方面: 一、影响召回准确性的因素: 数据质量:数据质量是影响召回准确性的基础因素。 因此,数据的质量越高,召回的准确性就越高。 对检索需求的理解:系统对检索需求的理解程度直接决定了召回结果的准确性。 因此,选择合适的检索词也是提高召回准确性的关键。 二、影响召回速度的因素: 数据量大小:数据量越大,系统需要处理的文档就越多,因此召回速度就会相应降低。 系统性能:系统的硬件性能(如CPU、内存、存储等)和软件性能(如算法效率、索引结构等)都会影响召回速度。如果系统性能不足,就可能导致召回速度变慢。 检索策略:不同的检索策略对召回速度的影响也不同。 为了提高召回的准确性和召回速度,可以采取一些优化措施,如提高数据质量、优化检索策略、改进算法模型、提升系统性能等。同时,也需要根据具体的应用场景和需求来选择合适的召回策略和技术。

    25100编辑于 2025-04-05
  • 来自专栏NewBeeNLP

    召回向排序靠齐:多目标排序蒸馏召回

    召回主要是将用户所有可能感兴趣的内容取出来,排序(粗排、精排)主要是预测用户对每条内容感兴趣的程度。召回为整个推荐系统的后续阶段提供数据,保证了效果的上确界。 排序对召回提供的数据再更细致化的分析、预测和排序,保证最终用户看到的结果。可以说召回是服务于后续排序模型。 由于召回和排序是推荐的两个阶段,可以说是独立运行的过程。 在工业上,做召回和排序的可能是两波人。因此两者的目标可能存在不一致。比如:精排希望给转化率高或者浏览时长高的内容更高的评分,而召回依旧取出用户喜欢点击的内容,最终精排的能力受到了限制。 为了让召回的目标向后续的排序靠齐,我们需要一路以排序模型的目标为目标的召回方法,保证能提供排序模型所需要的数据。 多目标蒸馏召回 腾讯提出了一个多目标MMoE蒸馏DSSM召回的方法DMTL(如图1所示)。 MMoE的两个目标是点击和阅读时长。

    1.7K10编辑于 2022-11-11
  • PTA 7-2 方阵循环右移

    9610编辑于 2025-12-16
  • 来自专栏freesan44

    PTA 7-2 数字之王 (20 分)

    的每个数的各位数的立方相乘,再将结果的各位数求和,得到一批新的数字,再对这批新的数字重复上述操作,直到所有数字都是 1 位数为止。这时哪个数字最多,哪个就是“数字之王”。

    30520编辑于 2021-12-06
  • 来自专栏用户画像

    推荐系统的召回

    https://blog.csdn.net/jxq0816/article/details/82151302 所谓召回,在刚接触推荐系统的时候可能只看字面意思无法理解召回的意思,召回可以理解为向用户粗选一批待推荐的商品 之后会加一层CTR预估的rank模型,相当于精排序 推荐系统的主要模块即为:召回 => 排序(精排) => 过滤模块(对最终展示商品进行过滤,多样性排序等) 推荐系统是一个很大的话题,涉及到很多模块, 这里主要是调研了一下推荐召回环节的主流做法。 应用:电商中基本是item-based CF,即对于一个用户,先取出用户过去的行为session商品(如点击,加购物车,下单等),根据规则向用户的召回集中选择商品,可以配置多个召回源,如相似、相关、偏好店铺热销等

    2.3K30发布于 2018-09-26
  • 来自专栏深度学习与推荐系统

    再看经典召回算法

    一般经典的召回方法即采用多路召回的方式,如下图所示。 多路召回的特点就在于“多路”,满足了挑选物品的多样性,捕捉用户兴趣的多样性,可以根据需要保证你想要召回的物品总能通过某一路挑选出来。下面就详细介绍和分析一下每一路召回方法。 ▌基于兴趣标签的召回 对用户兴趣标签进行优先级划分,然后依次根据用户的兴趣标签挑选对应标签的物品。 ▌总结 总体来说,多路召回的好处就是召回的物品考虑到用户兴趣的多样化,一般不会出现某一领域的集中召回,但是由于每一路都需要确定一个Top K中的K这个参数,调参的空间过大。 同时对于不同的用户都是固定的K值,不够合理化,因为每一个召回路不同的用户偏好不同,也可能用户在某一召回路不应该有候选物品出现,但是固定的K参数是的必须在该召回路筛选出前K个物品。

    1.7K11发布于 2020-10-18
  • 来自专栏算法与数据结构

    PTA 7-2 列车调度(25 分)

    7-2 列车调度(25 分) 火车站的列车调度铁轨的结构如下图所示。 两端分别是一条入口(Entrance)轨道和一条出口(Exit)轨道,它们之间有N条平行的轨道。

    2.6K90发布于 2017-12-29
  • 来自专栏刷题笔记

    7-2 冒泡法排序 (30分)

    7-2 冒泡法排序 (30分) 将N个整数按从小到大排序的冒泡排序法是这样工作的:从头到尾比较相邻两个元素,如果前面的元素大于其紧随的后面元素,则交换它们。

    1.3K10发布于 2020-06-23
  • 来自专栏刷题笔记

    7-2 冒泡法排序 (30分)

    将N个整数按从小到大排序的冒泡排序法是这样工作的:从头到尾比较相邻两个元素,如果前面的元素大于其紧随的后面元素,则交换它们。通过一遍扫描,则最后一个元素必定是最大的元素。然后用同样的方法对前N−1个元素进行第二遍扫描。依此类推,最后只需处理两个元素,就完成了对N个数的排序。

    1.1K10发布于 2020-06-23
  • 来自专栏数据结构和算法

    7-2 歌唱比赛计分 (15分)

    7-2 歌唱比赛计分 (15分) 设有10名歌手(编号为1-10)参加歌咏比赛,另有6名评委打分,每位歌手的得分从键盘输入,计算出每位歌手的最终得分(扣除一个最高分和一个最低分后的平均分),最后按最终得分由高到低的顺序输出每位歌手的编号及最终得分

    30010编辑于 2023-11-30
  • 来自专栏freesan44

    PTA 7-2 找奇葩 (20 分)

    在一个长度为 n 的正整数序列中,所有的奇数都出现了偶数次,只有一个奇葩奇数出现了奇数次。你的任务就是找出这个奇葩。

    27110编辑于 2021-12-06
  • 来自专栏freesan44

    PTA 7-2 数字之王 (20 分)

    的每个数的各位数的立方相乘,再将结果的各位数求和,得到一批新的数字,再对这批新的数字重复上述操作,直到所有数字都是 1 位数为止。这时哪个数字最多,哪个就是“数字之王”。

    27200发布于 2021-09-11
  • 来自专栏NLP/KG

    推荐系统:召回算法超详细讲解[召回模型演化过程、召回模型主流常见算法(DeepMF_TDM_Airbnb Embedding_Item2vec等)、召回

    1.前言:召回排序流程策略算法简介 图片 推荐可分为以下四个流程,分别是召回、粗排、精排以及重排: 召回是源头,在某种意义上决定着整个推荐的天花板; 粗排是初筛,一般不会上复杂模型; 精排是整个推荐环节的重中之重 2.1 召回路径介绍 推荐系统中的i2i、u2i、u2i2i、u2u2i、u2tag2i,都是指推荐系统的召回路径。 第一种召回,是非个性化的。 2.2.1 多路召回 推荐服务一般有多个环节(召回、粗排序、精排序),一般会使用多个召回策略,互相弥补不足,效果更好。 精排模型非常耗时,所以召回的内容,会经过粗排之后,把少量的数据给精排进行排序 几种多路召回结果融合的方法 举个例子:几种召回策略返回的列表(Item-id,权重)分别为: 召回策略 返回列表 CTR,作为每天更新的动态加权 只考虑了点击率,并不全面 每种召回源CTR计算方法: 展现日志-带召回源:X,Y,Z,X,Y,Z 点击日志-带召回源:点击X * 则每种召回的CTR =

    4.6K30编辑于 2023-02-22
  • 来自专栏Zephery

    商品推荐系统-FAISS召回

    商品推荐系统-FAISS召回 1. 背景与挑战 在互联网电商、内容平台等实际业务中,商品库动辄百万量级,如何为每位用户从海量商品中迅速召回个性化、高相关的候选商品,是推荐系统最基础也最关键的一环。 第一环节:商品Embedding批量提取与存储 3.1 原因和意义 只有将文本型商品属性转化为稠密embedding(向量),才可以用数学距离度量内容相关性,支撑 FAISS 这样的相似度召回引擎。 第二环节:构建与优化FAISS召回系统 4.1 为什么选FAISS? 百万级大数据下的表现与实践建议 适用性:FAISS专为这种百万、千万级内容召回设计,单机64G内存可支持极大库,工程成熟。 总结 本文详细介绍了如何从零开始,批量提取并存储商品embedding、基于内容特征构建FAISS索引、高效实现百万级商品的个性化召回流程以及工程落地优化建议。

    91200编辑于 2025-06-11
领券