首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏AI科技时讯

    乘积量化PQ:将高维向量压缩 97%

    为什么使用乘积量化乘积量化(Product Quantization, PQ)主要用于减少索引的内存占用,这在处理大量向量时尤为重要,因为这些向量必须全部加载到内存中才能进行比较。 第二个重要因素是量化器的训练。量化器需要一个比 k 大几倍的数据集来进行有效的训练。没有乘积量化,这将需要大量的训练数据。 乘积量化是如何工作的 乘积量化是一种高效的数据压缩技术,特别适用于大规模向量数据集。 , [9, 4, 5], [4, 6, 2]] 在乘积量化(PQ)中,原始的高维向量首先被分解为多个子向量,每个子向量可以通过其位置 j 来引用。 乘积量化的优势 乘积量化技术通过将高维向量映射到较低维的离散空间,显著降低了内存使用量。

    1.4K10编辑于 2024-07-15
  • 来自专栏AI大模型应用开发炼丹房

    乘积量化解析:高效压缩向量数据的智能方案​

    乘积量化(Product Quantization, PQ)​​:分割向量为子段,为每段创建代码本(codebook),压缩表示。在图像数据库中,PQ减少了存储开销50%,同时保持高召回率。​​

    40910编辑于 2025-08-26
  • 来自专栏奇点大数据

    话说量化2

    市场,是一个很古老的概念了,至少已经有三四千年以上的历史了。较早的关于市场的记录是在古埃及时期,公元前两千多年之前,就已经有“Bazar”这个概念了,汉语里面也留下了它音译的痕迹——“巴扎”。直到现在,在新疆少数民族聚居区仍然在使用这个词汇作为“集市”的用词概念。

    53020发布于 2018-09-14
  • 来自专栏PostgreSQL研究与原理解析

    PG 向量化引擎--2

    PG 向量化引擎--2量化引擎是OLAP数据库提升性能的有效技术。翻到PostgreSQL邮件列表有对向量化引擎的讨论。这里继续进行整理,以作分析。 对于Int32,此区域大小时4*BATCHSIZE,而对于Int16,大小时2*BATCHSIZE。所以使用原生数据可以只做一个memcpy来填充vtype的batch。 2、为什么VectorTupleSlot中包含元组的数据(batch)而不是向量(vtype的数组)? 我们是否可以得出结论,对于OLAP查询使用向量化引擎,对于OLTP查询使用行引擎会更好。 5、对于不能向量化的查询捕获并抛出异常不是处理此类情况最安全和最有效的方法。 花费的时间比预期要长:executor代码中很多东西都发生了改变: par.warkers PG9_6矢量化=关闭 PG9_6矢量化=开启 主矢量化=关闭jit=打开 主矢量化=关闭jit=关闭 主矢量化

    1.2K20编辑于 2022-02-09
  • 来自专栏计算机视觉理论及其实现

    笛卡尔乘积

    笛卡尔乘积 笛卡尔(Descartes)乘积又叫直积。设A和B是两个集合,A到B的笛卡尔积用A×B表示,它是所有形如(a,b)的有序对作为元素的组合,其中a∈A,b∈B。 笛卡尔积的符号化为:A×B={(x,y)|x∈A∧y∈B} 例:假设集合A=a,b,集合B=0,1,2,则两个集合的笛卡尔积为(a,0),(a,1),(a,2),(b,0),(b,1), (b,2)。

    1.7K20编辑于 2022-09-03
  • 来自专栏量化小白上分记

    量化笔面试概率题*2

    我投的基本都是量化岗,到现在3/20的通过率,总之很艰难。 因此E(k) = 2^(k+1) - 2,这样,E(4) = 30 ? 再举一个例子 ? 有一楼梯共m级,刚开始时你在第一级,若每次只能跨上一级或二级,要走上第m级,共有多少走法? 还是刚才的逻辑,假设走k级有f(k)种走法,显然f(1)=1,f(2)=2,如果第一次走了1级,剩下k-1级有f(k-1)种走法,如果第一次走了两级,剩下k-2级有f(k-2)种走法,即f(k)=f(k -1)+f(k-2)。 ,但速度会快很多,代码如下 def f(x): if x ==1: y = 1 elif x ==2: y = 2 else: s

    4.2K20发布于 2019-07-01
  • 来自专栏阿凯的Excel

    乘积求和及符合某个条件的乘积求和

    如何得到两个数组的乘积求和呢??案例如下: 已知每个地市的销售单价和销售数量,需要知道整个表的销售总金额,怎么做??? 逻辑上是将销售单价数组乘以销售数量数组,然后用Sum函数实现,本案例的公式外面有{ },看过上一期内容的就可以知道这个标志是数组运算的意思,编辑好Sum函数后=SUM(C2:C13*D2:D13),同时按住 英语好的很好理解,英语不好如我的,百度后就可以很好理解 Sum 求和 Product 乘积 合起来就是SumProduct 乘积后求和 后面接的参数就是N个数组相乘就好!

    6.5K90发布于 2018-03-08
  • 来自专栏yuyy.info技术专栏

    乘积尾零

    long tt=sum; while(1){ cout<<count<<endl; cout<<"-------"<<tt<<endl; long long tt2= tt; if(tt2/10*10==tt){ cout<<"tt2"<<tt2<<endl; count++; tt=tt/10; }else{ cout<<

    41310编辑于 2022-06-28
  • 来自专栏大模型成长之路

    【大模型学习 | BERT 量化实战(2) 】

    p_bert_embeddings_layernorm_weight', 'p_bert_embeddings_layernorm_bias', #⚠️ BERT 模型包含了 nn.Embedding 层,而当前 PT2E ① 权重分布本身就不光滑(有离群值)② 权重量化导致连续输入映射为不连续输出解决✅ 方法1:替换激活函数 GELU → ReLU✅ 方法2:尝试采用 QAT 逐层敏感性分析核心思想:将原模型逐层量化,观察产生精度下降的原因 isinstance(module, nn.Linear)]def run_sensitivity_analysis(model_fp32, tokenizer): print("Loading SST-2 .4f} | ΔAcc: {delta:.4f}") results.append((name, acc, delta)) results.sort(key=lambda x: x[2] Sensitive Layers:") for r in results[:5]: print(f"{r[0]:40s} | Acc: {r[1]:.4f} | ΔAcc: {r[2]

    78710编辑于 2025-06-27
  • 来自专栏InvQ的专栏

    求奇数的乘积

    <r;i++){ a[i]=sc.nextInt(); } for(int s:a){ if(s%2!

    91910发布于 2020-09-27
  • 来自专栏DeepHub IMBA

    使用ExLlamaV2量化并运行EXL2模型

    并且它还引入了一种新的量化格式EXL2,它为如何存储权重带来了很大的灵活性。 在本文中,我们将介绍如何量化EXL2格式的基本模型,以及如何运行它们。 量化EXL2模型 首先需要安装ExLlamaV2库: pip install exllamav2 #为了使用官方的一些脚本,我们还要把官方的代码clone到本地 git clone https:/ 量化过程使用现有脚本非常的简单。那么还有最后一个问题,为什么要使用“EXL2”格式而不是常规的GPTQ格式呢?EXL2带来了哪些新功能? 它支持不同级别的量化:它不局限于4位精度,可以处理2、3、4、5、6和8位量化。 它可以在一个模型和每一层中混合不同的精度,以保留最重要的权重和具有更多bit的层。 ExLlamaV2量化过程中使用了这种额外的灵活性。它会自动尝试不同的量化参数,并测量了它们引入的误差。

    1.1K10编辑于 2023-11-22
  • 来自专栏尾尾部落

    构建乘积数组

    B[i]的值可以看作图中矩阵第 i 行所有元素的乘积。我们可以先算下三角中的连乘,即我们先算出B[i]中的一部分,然后倒过来按上三角中的分布规律,把另一部分也乘进去。 B[i] = B[i-1] * A[i-1]; } int temp = 1; for(int j = A.length - 2; _bd_share_config={"common":{"bdSnsKey":{},"bdText":"","bdMini":"2","bdMiniList":false,"bdPic":"","bdStyle

    74030发布于 2018-09-04
  • 来自专栏软件工程

    构建乘积数组

    B[i]的值可以看作上图的矩阵中每行的乘积。 下三角用连乘可以很容求得,上三角,从下向上也是连乘。 且B[0]左边没数,设为1 //求出右部分以及左部分*右部分 int temp=1;//初始值为B[n]的右部分 for(int i=A.length-2;

    45220编辑于 2022-05-13
  • 来自专栏数据结构与算法

    乘积最大

    活动中,主持人给所有参加活动的选手出了这样一道题目: 设有一个长度为N的数字串,要求选手使用K个乘号将它分成K+1个部分,找出一种分法,使得这K+1个部分的乘积能够为最大。 同时,为了帮助选手能够正确理解题意,主持人还举了如下的一个例子: 有一个数字串:312,当N=3,K=1时会有以下两种分法: 1) 3*12=36 2) 31*2=62   这时,符合题目要求的结果是 :31*2=62   现在,请你帮助你的好朋友XZ设计一个程序,求得正确的答案。    输  入   程序的输入共有两行:   第一行共有2个自然数N,K(6≤N≤40,1≤K≤6)   第二行是一个长度为N的数字串。    输  出     结果显示在屏幕上,相对于输入,应输出所求得的最大乘积(一个自然数)。   

    1.4K100发布于 2018-04-13
  • 来自专栏前端小码农

    构建乘积数组

    构建乘积数组 题目描述 给定一个数组 A[0,1,…,n-1],请构建一个数组 B[0,1,…,n-1],其中 B 中的元素 B[i]=A[0]×A[1]×…×A[i-1]×A[i+1]×…×A[n- 示例: 输入: [1,2,3,4,5] 输出: [120,60,40,30,24] 提示: 所有元素乘积之和不会溢出 32 位整数 a.length <= 100000 思路分析 B[i]的意义是A数组不包括 i位置的所有乘积,分为i左边的元素乘积和i右边的所有的元素乘积。 对称遍历 从左往右遍历累乘,结果保存在数组 B 中,此时 B[i] 表示,A[i] 左边所有元素的乘积 然后从右往左遍历累乘,获取A[i] 右边所有元素的乘积 right,用 B[i]乘以right 两边遍历之后得到的 - 1] * a[i - 1]; } // 第二个for计算右边的 let right = 1; for(let i = len - 2;

    50330发布于 2020-07-16
  • 来自专栏人力资源数据分析

    KPI关键指标的量化设计(2

    我们在上篇文章讲到了如何根据岗位的工作职责进行KPI关键值的选择,那今天我们就来聊聊,如何进行量化的KPI指标的设计。 (2)Measurable可以衡量的:绩效指标是数量化或者行为化的,验证这些绩效指标的数据或者信息是可以获得的。 2、KPI量化指标的3大设计维度 在对KPI的设计中,我们根据数据的类型,我们一般会对KPI的数据有三种形式的量化指标设计 ? ? 1、KPI的标准指标,这个指标的数值是指在月度我们达标的数据 2、KPI保底数据,这个数据指标是我们每月必须一定要完成的数据指标, 3、KPI期望数据,这个数据是我们超出达标数据,跳一跳可以够得到的数据

    2.1K30发布于 2020-11-03
  • 来自专栏嘘、小点声

    股市技术面操作的量化交易--量化交易2-投资方法

    通常,我们认为人们是“风险厌恶”的,并构造如下形式的效用函数来代表投资者的投资偏好: U®=E®- 1/2 Aσ^2 ® 其中E®表示投资组合的预期收益率,σ^2 ®表示投资组合的方差; 预期收益率越高 资产组合 假设有两种资产E_1和E_2,其预期收益率和方差分别为r_1、σ_1^2和r_2、σ_2^2,收益率相关系数为ρ。另有,r_1<r_2、〖0<σ〗_1<σ_2。 如果同时投资于两种资产,权重分别为w_1、1-w_1, 则组合的期望收益率和方差可表示为: r=w_1 r_1+(1-w_1)r_2 σ^2= w_1^2 σ_1^2+〖(1-w_1)〗^2 σ_2^2 +2w_1 (1-w_1)ρσ_1 σ_2 容易证明,当且仅当ρ=1时资产组合标准差与预期收益呈线性关系。 由于ρ的取值范围在-1和1之间,因此通常情况下σ^2= w_1^2 σ_1^2+〖(1-w_1)〗^2 σ_1^2+2w_1 (1-w_1 )ρσ_1 σ_2<〖(w_1 σ_1+(1-w_1 )σ_2

    1.1K20发布于 2020-11-24
  • 来自专栏技术向

    乘积最大子数组

    示例 1: 输入: [2,3,-2,4] 输出: 6 解释: 子数组 [2,3] 有最大乘积 6。 示例 2: 输入: [-2,0,-1] 输出: 0 解释: 结果不能为 2, 因为 [-2,-1] 不是子数组。 ,那么最大乘积就会变成该元素本身,且连续性被断掉 如果该元素为负数: 如果到上一个元素为止的最大乘积也是负数,那么直接乘上就好了,同样的最大乘积也会变得更大 如果到上一个元素为止的最大乘积是正数,那么最大乘积就会不变 ,且连续性被断掉 以上四种情况中说到的最大乘积都是临时最大乘积,每遍历新的元素都需要进行比较来确定真正的最大乘积。 如果要得到乘以当前元素以后的最大乘积,需要记录最大乘积,也要记录最小乘积,因为最小值可能翻身变最大值。

    67920发布于 2020-07-14
  • 来自专栏数据结构与算法

    P1018 乘积最大

    活动中,主持人给所有参加活动的选手出了这样一道题目: 设有一个长度为N的数字串,要求选手使用K个乘号将它分成K+1个部分,找出一种分法,使得这K+1个部分的乘积能够为最大。 同时,为了帮助选手能够正确理解题意,主持人还举了如下的一个例子: 有一个数字串:312, 当N=3,K=1时会有以下两种分法: 1) 3*12=36 2) 31*2=62 这时,符合题目要求的结果是:31 *2=62 现在,请你帮助你的好朋友XZ设计一个程序,求得正确的答案。 输入输出格式 输入格式: 程序的输入共有两行: 第一行共有2个自然数N,K(6≤N≤40,1≤K≤6) 第二行是一个长度为N的数字串。 输出格式: 结果显示在屏幕上,相对于输入,应输出所求得的最大乘积(一个自然数)。

    842120发布于 2018-04-13
  • 来自专栏前端小书童

    最大单词长度乘积

    示例 2: 输入: ["a","ab","abc","d","cd","bcd","abcd"] 输出: 4 解释: 这两个单词为 "ab", "cd"。 抛砖引玉 传入一个字符串数组,返回数组中两个不含相同字符的字符串元素长度乘积的最大值 思路 先暴力破解一下(暴力 API 工程师 ㄟ( ▔, ▔ )ㄏ  ) 双循环枚举处两两不含相同字符的元素 保留枚举的符合要求元素长度的乘积

    3.2K20发布于 2021-11-26
领券