首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏悟道

    2-5 快速幂模板

    这个就是在快速乘的基础上改一下 sum=0--->sum=1 x+=x--->x*=x //快速幂模板 public double quickPow(double x,long y){ double sum=1; while(y>0){ if((y&1)==1){ sum*=x; } x*=x; y=y>>1; }

    33620发布于 2021-06-01
  • 来自专栏AI机器学习与深度学习算法

    学习分类 2-5 线性可分

    感知机非常简单同时又很容易理解,但是相对应的,缺点也很多。感知机最大的缺点就是它只能解决线性可分的问题。

    55610编辑于 2022-11-08
  • 来自专栏coding for love

    2-5 浅析webpack打包内容

    Hash:本次打包的一个标识。 Version:使用的webpack版本 Time:本次打包耗时 Built at: 生成时间

    85740发布于 2019-05-24
  • 来自专栏NLP/KG

    向量召回:深入评估离线体系,探索优质召回方法

    向量召回:深入评估离线体系,探索优质召回方法1.简介近年来,基于向量进行召回的做法在搜索和推荐领域都得到了比较广泛的应用,并且在学术界发表的论文中,基于向量的 dense retrieve 的方法也在不少数据集上都战胜了 在内网的不少文章中也都介绍了各种不同的模型和算法,但是目前我们还没有看到比较系统的介绍向量召回评估体系的文章,在这里我们抛砖引玉,对搜索在将向量召回应用到搜索方向过程中积累的召回评估方面的内容,进行了梳理和归纳 基于此,我们考虑可以固定不同版本模型建立的索引的召回条数,在线召回时统计通过截断模型后保留下来的结果的数量,以此作为模型在全量索引上的召回评估指标。 离线模型迭代指标A.召回指标: R1/R2/RAUC 等召回指标,衡量模型的召回率情况B.聚类指标: 衡量聚类的损失情况。 3.针对问题 3,我们对召回的结果计算 query 与召回结果之间的字重合度和 CQR(Title 分词对 Query 分词的覆盖情况),以此来衡量召回结果的下限,防止出现既召回部分非常好的结果,但同时也召回大量非常差的结果

    1.6K20编辑于 2023-10-17
  • 来自专栏Hank’s Blog

    2-5 R语言基础 factor

    #因子:分类数据 #有序和无序 #整数向量+标签label #Male/Female #常用于lm(),glm()

    41110发布于 2020-09-16
  • 来自专栏Deep learning进阶路

    2-5 线性表之循环链表

    2-5 线性表之循环链表 循环链表就是链表首尾相接连成一个环,可以用单链表 和 循环链表来实现。

    41240发布于 2019-07-02
  • 来自专栏刷题笔记

    2-5 Two Stacks In One Array (20 分)

    本文链接:https://blog.csdn.net/shiliang97/article/details/101173005 2-5 Two Stacks In One Array (20 分) Write

    71930发布于 2019-11-08
  • 来自专栏常用算法专栏

    影响召回的准确性和召回速度的因素

    这些因素对召回的准确性和召回速度的影响主要体现在以下几个方面: 一、影响召回准确性的因素: 数据质量:数据质量是影响召回准确性的基础因素。 因此,数据的质量越高,召回的准确性就越高。 对检索需求的理解:系统对检索需求的理解程度直接决定了召回结果的准确性。 因此,选择合适的检索词也是提高召回准确性的关键。 二、影响召回速度的因素: 数据量大小:数据量越大,系统需要处理的文档就越多,因此召回速度就会相应降低。 系统性能:系统的硬件性能(如CPU、内存、存储等)和软件性能(如算法效率、索引结构等)都会影响召回速度。如果系统性能不足,就可能导致召回速度变慢。 检索策略:不同的检索策略对召回速度的影响也不同。 为了提高召回的准确性和召回速度,可以采取一些优化措施,如提高数据质量、优化检索策略、改进算法模型、提升系统性能等。同时,也需要根据具体的应用场景和需求来选择合适的召回策略和技术。

    25100编辑于 2025-04-05
  • 来自专栏NetCore 从壹开始

    2-5 安装容器Web工具:Docker Portainer

    现在已经习惯了容器化了,不仅可以很快的配合CICD来实现部署,同时主要是也能解决一些疑难杂症,比如在Linux中经常会有各种图形图像的依赖包问题。特别是内网环境。

    95820编辑于 2023-01-09
  • 来自专栏NewBeeNLP

    召回向排序靠齐:多目标排序蒸馏召回

    召回主要是将用户所有可能感兴趣的内容取出来,排序(粗排、精排)主要是预测用户对每条内容感兴趣的程度。召回为整个推荐系统的后续阶段提供数据,保证了效果的上确界。 排序对召回提供的数据再更细致化的分析、预测和排序,保证最终用户看到的结果。可以说召回是服务于后续排序模型。 由于召回和排序是推荐的两个阶段,可以说是独立运行的过程。 在工业上,做召回和排序的可能是两波人。因此两者的目标可能存在不一致。比如:精排希望给转化率高或者浏览时长高的内容更高的评分,而召回依旧取出用户喜欢点击的内容,最终精排的能力受到了限制。 为了让召回的目标向后续的排序靠齐,我们需要一路以排序模型的目标为目标的召回方法,保证能提供排序模型所需要的数据。 多目标蒸馏召回 腾讯提出了一个多目标MMoE蒸馏DSSM召回的方法DMTL(如图1所示)。 MMoE的两个目标是点击和阅读时长。

    1.7K10编辑于 2022-11-11
  • 来自专栏刷题笔记

    2-5 修理牧场 (35 分)【优先队列】

    2-5 修理牧场 (35 分) 农夫要修理牧场的一段栅栏,他测量了栅栏,发现需要N块木头,每块木头长度为整数L​i​​个长度单位,于是他购买了一条很长的、能锯成N块的木头,即该木头的长度是L​i​​的总和

    1K10发布于 2020-06-23
  • 来自专栏用户画像

    推荐系统的召回

    https://blog.csdn.net/jxq0816/article/details/82151302 所谓召回,在刚接触推荐系统的时候可能只看字面意思无法理解召回的意思,召回可以理解为向用户粗选一批待推荐的商品 之后会加一层CTR预估的rank模型,相当于精排序 推荐系统的主要模块即为:召回 => 排序(精排) => 过滤模块(对最终展示商品进行过滤,多样性排序等) 推荐系统是一个很大的话题,涉及到很多模块, 这里主要是调研了一下推荐召回环节的主流做法。 应用:电商中基本是item-based CF,即对于一个用户,先取出用户过去的行为session商品(如点击,加购物车,下单等),根据规则向用户的召回集中选择商品,可以配置多个召回源,如相似、相关、偏好店铺热销等

    2.3K30发布于 2018-09-26
  • 来自专栏深度学习与推荐系统

    再看经典召回算法

    一般经典的召回方法即采用多路召回的方式,如下图所示。 多路召回的特点就在于“多路”,满足了挑选物品的多样性,捕捉用户兴趣的多样性,可以根据需要保证你想要召回的物品总能通过某一路挑选出来。下面就详细介绍和分析一下每一路召回方法。 ▌基于兴趣标签的召回 对用户兴趣标签进行优先级划分,然后依次根据用户的兴趣标签挑选对应标签的物品。 ▌总结 总体来说,多路召回的好处就是召回的物品考虑到用户兴趣的多样化,一般不会出现某一领域的集中召回,但是由于每一路都需要确定一个Top K中的K这个参数,调参的空间过大。 同时对于不同的用户都是固定的K值,不够合理化,因为每一个召回路不同的用户偏好不同,也可能用户在某一召回路不应该有候选物品出现,但是固定的K参数是的必须在该召回路筛选出前K个物品。

    1.7K11发布于 2020-10-18
  • 来自专栏育种数据分析之放飞自我

    笔记 | GWAS 操作流程2-5:杂合率检验

    一般自然群体,基因型个体的杂合度过高或者过低,都不正常,我们需要根据杂合度进行过滤。偏差可能表明样品受到污染,近亲繁殖。我们建议删除样品杂合率平均值中偏离±3 SD的个体。

    2.3K20发布于 2020-04-27
  • 来自专栏NLP/KG

    推荐系统:召回算法超详细讲解[召回模型演化过程、召回模型主流常见算法(DeepMF_TDM_Airbnb Embedding_Item2vec等)、召回

    1.前言:召回排序流程策略算法简介 图片 推荐可分为以下四个流程,分别是召回、粗排、精排以及重排: 召回是源头,在某种意义上决定着整个推荐的天花板; 粗排是初筛,一般不会上复杂模型; 精排是整个推荐环节的重中之重 2.1 召回路径介绍 推荐系统中的i2i、u2i、u2i2i、u2u2i、u2tag2i,都是指推荐系统的召回路径。 第一种召回,是非个性化的。 2.2.1 多路召回 推荐服务一般有多个环节(召回、粗排序、精排序),一般会使用多个召回策略,互相弥补不足,效果更好。 精排模型非常耗时,所以召回的内容,会经过粗排之后,把少量的数据给精排进行排序 几种多路召回结果融合的方法 举个例子:几种召回策略返回的列表(Item-id,权重)分别为: 召回策略 返回列表 CTR,作为每天更新的动态加权 只考虑了点击率,并不全面 每种召回源CTR计算方法: 展现日志-带召回源:X,Y,Z,X,Y,Z 点击日志-带召回源:点击X * 则每种召回的CTR =

    4.6K30编辑于 2023-02-22
  • 来自专栏Zephery

    商品推荐系统-FAISS召回

    商品推荐系统-FAISS召回 1. 背景与挑战 在互联网电商、内容平台等实际业务中,商品库动辄百万量级,如何为每位用户从海量商品中迅速召回个性化、高相关的候选商品,是推荐系统最基础也最关键的一环。 第一环节:商品Embedding批量提取与存储 3.1 原因和意义 只有将文本型商品属性转化为稠密embedding(向量),才可以用数学距离度量内容相关性,支撑 FAISS 这样的相似度召回引擎。 第二环节:构建与优化FAISS召回系统 4.1 为什么选FAISS? 百万级大数据下的表现与实践建议 适用性:FAISS专为这种百万、千万级内容召回设计,单机64G内存可支持极大库,工程成熟。 总结 本文详细介绍了如何从零开始,批量提取并存储商品embedding、基于内容特征构建FAISS索引、高效实现百万级商品的个性化召回流程以及工程落地优化建议。

    91200编辑于 2025-06-11
  • 来自专栏九彩拼盘的叨叨叨

    学习前端 第4周 第2-5

    了解什么叫响应式。 了解CSS3 Media Queries 了解Bootstrap 了解Bootstrap的全局 CSS 样式。特别是其中的栅格系统。 作业 用Bootstrap做页面 http://www.bootcss.com/ 。交互不需要实现

    19510发布于 2018-08-27
  • 来自专栏杨熹的专栏

    图解精度和召回

    我们根据召回率这个名字,可以考虑一个,召回的例子。 例如有一个汽车公司,他们有一些车发现有问题, 于是就要召回,他们告诉了车主判断问题的方法, 有些车是真的有问题,但是车主没判断出来, 有些车没问题,但车主认为有问题, 这个时候公司就要计算一下召回率,看有问题的车被召回了多少 精度—召回率 之间存在制衡 随着精度的增加,召回率会降低,召回率增加,精度就会降低。 有时如果需要召回率高,就可以接受较低的精度。 F1 score 是对精度和召回率的调和平均,有个公式 如果我们想创建一个具有最佳的精度—召回率平衡的模型,那么就要尝试将 F1 score 最大化。 对每个阈值可以计算相应的 精度 召回率 f1 等指标, ?

    1.8K30发布于 2019-02-20
  • 来自专栏讲编程的高老师

    权衡查准率和召回

    上一节讲了当遇到偏斜类的时候,如何对算法效果进行评价,使用查准率和召回率。在很多实际应用中,我们还希望能在查准率和召回率间进行权衡,使得两个指标都取得不错的结果。 权衡查准率和召回率的例子 还是用逻辑回归来进行癌症分类的例子,如下图。图中右上角框起来的是上节讲的“查准率”和“召回率”的定义公式,忘了的可以翻翻上一节的内容。 ? 我们就搞两个模型,一个是高查准率、低召回率的;一个是高召回率、低查准率的。 ? 对于大多数回归模型,你更改这个临界值(threshold)会改变查准率、召回率。 一种办法,算查准率P和召回率R的均值,如下图。 而到底怎样的查准率、召回率的取值比较好,可以使用F1值进行权衡。 又或者,可以同时两个模型并存:(1)高查准率、低召回率;(2)高召回率,低查准率。

    95930发布于 2021-05-13
  • 来自专栏搜推广技术

    搜索优化经验集--召回

    语言级优化召回引擎核心的计算、存储节点大多都是采用C++语言。以下优化主要针对C++语言层面。 比如用户要召回同时包含”搜索“和”召回“两个term的文档,需要将这两条拉链求交。如果直接用链表实现,求交操作效率比较低,需要从当前位置一个一个遍历查找(o(n)时间复杂度)。 rbm存储如前文所述,计算是召回逻辑的关键环节。拉链交并处理得到的每一个文档,都要经过过滤语法树的计算,通常是十万级别。同理,对这里性能热点的优化整体的召回性能都得到较大的提升。 而召回是系统的最底层,由于系统扇出,承受的QPS一般也远高于用户层实际触发的QPS。因此,稳定性对于召回系统而言至关重要。除了平常规范研发流程规范,对系统定期压测、做到对系统容量胸中有数外。 当系统压力过大,可以减少每个分片召回的文档数延长cache数据的有效时长,降低穿透率如果粗排在归并层,同样可以降低送粗排的文档数对merge层而言,可以选择:减少各分库的召回策略,以降低扇出压力摘库:直接将下游优先级不高的库流量摘掉

    2.2K41编辑于 2022-08-16
领券