首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏追不上乌龟的兔子

    文本嵌入,语义搜索与sentence-transformers库

    cos_sim = util.cos_sim(emb1, emb2) print("Cosine-Similarity:", cos_sim) # Cosine-Similarity: tensor([ query in queries: query_embedding = embedder.encode(query, convert_to_tensor=True) # We use cosine-similarity

    2.5K10编辑于 2023-12-24
  • 来自专栏追不上乌龟的兔子

    文本嵌入,语义搜索与sentence-transformers库

    cos_sim = util.cos_sim(emb1, emb2) print("Cosine-Similarity:", cos_sim) # Cosine-Similarity: tensor([ query in queries: query_embedding = embedder.encode(query, convert_to_tensor=True) # We use cosine-similarity

    2.5K10编辑于 2023-12-24
  • 来自专栏机器之心

    余弦相似度可能没用?对于某些线性模型,相似度甚至不唯一

    来自论文:《Is Cosine-Similarity of Embeddings Really About Similarity? 》 举两个随意产生结果的例子: 1. 图源:https://www.machinelearningplus.com/nlp/cosine-similarity/ 语义文本相似度(STS)预测:专门为语义相似度任务训练的微调模型 (如 STSScore

    35310编辑于 2025-02-03
  • 来自专栏山行AI

    AI跑车引擎——向量数据库第二篇

    - lior-k/fast-elasticsearch-vector-scoring: Score documents using embedding-vectors dot-product or cosine-similarity - lior-k/fast-elasticsearch-vector-scoring: Score documents using embedding-vectors dot-product or cosine-similarity

    2K30编辑于 2023-06-14
  • 来自专栏NewBeeNLP

    从 Sentence-BERT 谈句子表征

    STS 任务使用 Cosine-Similarity 对句子向量进行评估,Cosine-Similarity 对所有维度平等处理;而 SentEval 使用逻辑回归分类器对句子向量分类,这就允许某些维度对分类结果有更高或更低的影响

    2.1K10发布于 2021-11-15
  • 来自专栏mathor

    Sentence-Transformer的使用及fine-tune教程

    cos_sim = util.pytorch_cos_sim(emb1, emb2) print("Cosine-Similarity:", cos_sim)

    10.1K10发布于 2020-10-26
  • 来自专栏机器学习AI算法工程

    需求与匹配 | 从数据挖掘角度看世纪佳缘推荐系统

    但是这并非是一个无解的问题,我们回归Item-based的本源思考为什么热门的条目会受到额外的照顾,抛出业务场景,其实根源在于Cosine-Similarity里分母开的那个根号惹的祸,可以想象10000

    1.4K50发布于 2018-03-12
  • 来自专栏深度学习自然语言处理

    每日论文速递 | Embedding间的余弦相似度真的能反映相似性吗?

    A:这篇论文探讨了在高维对象(如单词、用户或物品)的语义相似性度量中,余弦相似性(Cosine-similarity)的适用性和局限性。

    1.5K10编辑于 2024-03-25
  • 来自专栏算法修养

    Lucene的索引系统和搜索过程分析

    算余弦值 cosine-similarity(q,d)   = V(q) · V(d) ––––––––– |V(q)| |V(d)| V(q) · V(d) ––––––––– |V(q)| 

    2.6K30发布于 2018-07-24
  • 来自专栏人工智能头条

    争议:婚恋网站的推荐系统,怎么做才能让用户不用再回家相亲?

    但是这并非是一个无解的问题,我们回归Item-based的本源思考为什么热门的条目会受到额外的照顾,抛出业务场景,其实根源在于Cosine-Similarity里分母开的那个根号惹的祸,可以想象10000

    1.7K30发布于 2018-06-05
  • 来自专栏机器之心

    每月都有重磅研究,2024全年值得一读的论文都在这了

    Multimodal Understanding Across Millions of Tokens of Context 论文链接: https://arxiv.org/abs/2403.05530 论文标题:Is Cosine-Similarity

    48100编辑于 2025-02-03
领券