首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏全栈程序员必看

    (dfs + 离散

    能够将这些矩形的坐标离散,然后把边上的点标记一下。之后进行简单dfs就可以。 (注意离散的时候,两条边之间至少要隔一个距离) 代码: /* ID: wuqi9395@126.com PROG: LANG: C++ */ #include<map> #include<set> #

    42820编辑于 2022-07-07
  • 来自专栏练习两年半

    离散算法

    y总模板: vector<int> alls; // 存储所有待离散的值 sort(alls.begin(), alls.end()); // 将所有值排序 alls.erase (unique(alls.begin(), alls.end()), alls.end()); // 去掉重复元素 // 二分求出x对应的离散的值 int find(int x) //

    24810编辑于 2024-03-15
  • 来自专栏CSDN旧文

    『ACM-算法-离散』信息竞赛进阶指南--离散

    数据离散是一个非常重要的思想。 为什么要离散? 当以权值为下标的时候,有时候值太大,存不下。 所以把要离散的每一个数组里面的数映射到另一个值小一点的数组里面去。 image.png 通俗的说,离散是在不改变数据相对大小的条件下,对数据进行相应的缩小。 例如: 原数据:12,9999,9000900,150;处理后:1,3,4,2; 原数据:{100,200},{20,50000},{1,400};处理后:{3,4},{2,6},{1,5}; 但是离散仅适用于只关注元素之间的大小关系而不关注元素本身的值 // 离散 void discrete() { sort(a + 1, a + n + 1); for (int i = 1; i <= n; i++) // 也可用STL中的unique函数 = a[i - 1]) b[++m] = a[i]; } // 离散后,查询x映射为哪个1~m之间的整数 void query(int x) { return lower_bound(b +

    84220发布于 2020-10-28
  • 来自专栏我的机器学习之路

    连续数据离散

    数据量增大之后,难以通过肉眼观察到分界点,可以采用等间隔分级的方式进行粗暴的分级,但是通常效果不好:

    87541发布于 2020-10-26
  • 来自专栏用户画像

    LR 特征离散

    在工业界,很少直接将连续值作为逻辑回归模型的特征输入,而是将连续特征离散化为一系列0、1特征交给逻辑回归模型,这样做的优势有以下几点: (1)离散特征的增加和减少都很容易,易于模型的快速迭代; (2) 稀疏向量内积乘法运算速度快,计算结果方便存储,容易扩展; (3)离散后的特征对异常数据有很强的鲁棒性:比如一个特征是年龄>30是1,否则0。 如果特征没有离散,一个异常数据“年龄300岁”会给模型造成很大的干扰; (4)逻辑回归属于广义线性模型,表达能力受限;单变量离散化为N个后,每个变量有单独的权重,相当于为模型引入了非线性,能够提升模型表达能力 ,加大拟合; (5)离散后可以进行特征交叉,由M+N个变量变为M*N个变量,进一步引入非线性,提升表达能力; (6)特征离散后,模型会更稳定,比如如果对用户年龄离散,20-30作为一个区间,不会因为一个用户年龄长了一岁就变成一个完全不同的人 当然处于区间相邻处的样本会刚好相反,所以怎么划分区间是门学问; (7)特征离散以后,起到了简化了逻辑回归模型的作用,降低了模型过拟合的风险。

    1.2K40发布于 2019-08-29
  • 来自专栏图像处理与模式识别研究所

    归一离散

    x1.values.reshape(-1,1)#变为n行1列的二维矩阵形式 x2=scaler.fit_transform(x_reshape)#MinMaxScaler的fit.transform归一 .values.reshape(-1, 1)#变为n行1列的二维矩阵形式 x3=scaler.fit_transform(x_reshape)#MinMaxScaler的fit.transform归一 values.reshape(-1, 1)#变为n行1列的二维矩阵形式 y3 = scaler.fit_transform(y_reshape)#MinMaxScaler的fit.transform归一 -----------result count-----------------') print(pd.value_counts(result1)) plt.tight_layout() 算法:归一离散是前者将逐个样本缩放成单位范数 ,后者分割连续变量为若干个离散值。

    41030编辑于 2022-05-29
  • 来自专栏ypw

    离散思想详细讲解

    1.什么是离散 数据离散是一个非常重要的思想。 为什么要离散?当以权值为下标的时候,有时候值太大,存不下。 所以把要离散的每一个数组里面的数映射到另一个值小一点的数组里面去。 我们来看一下定义:离散,把无限空间中有限的个体映射到有限的空间中去,以此提高算法的时空效率。(by百度百科) 通俗的说,离散是在不改变数据相对大小的条件下,对数据进行相应的缩小。 假如你想写的更加专业就要采用以下步骤: 1、排序 2、去重 3、索引 首先我们要对所要进行离散的数据进行排序:一般使用sort对数组或结构体排序。 [x]的指针,upper_bound()=lower_bound()+1】 关键代码如下: #include<algorithm> // 头文件 //n 原数组大小 num 原数组中的元素 lsh 离散的数组 cnt 离散后的数组大小 int lsh[MAXN] , cnt , num[MAXN] , n; for(int i=1; i<=n; i++) { scanf("%d",&num[i]);

    1.1K30发布于 2020-09-10
  • 来自专栏编程驿站

    C++ 离散算法

    离散 离散离散数学中的概念。离散算法,指把无限空间中的离散数据映射到一个有限的存储空间中,并且对原数据进行有序索引。主打压缩的都是精。 遇到这种情况,可以对数列离散操作。 对原数据排序。 也称为离散)后,原数据分别被映射为{25,1}、{458,2}、{897,3}、{1234,4}、{7654,5} 原数据离散后常用操作是查找离散数据的离散(索引)值是多少。 离散后的值一般从1开始。 我们说,这个“倾角”已经被我们“离散”了。 2.3 最小矩形面积 对于某些坐标虽然已经是整数(已经是离散的了)但范围极大的问题,我们也可以用离散的思想缩小这个规模。

    53310编辑于 2024-03-02
  • 来自专栏TechBlog

    离散及模板详解

    离散 基本思想 首先,离散是指数值域非常大,例如 1-10^6 ,但是个数相对较少,例如只有 10^3 个, 但在我们的程序中需要通过这些数值作为下标,且依赖的是这些数值之间的顺序关系(当然通常这些数是有序的 如果为了这 10^3 个数而开一个 10^6 的数组过于浪费空间,因此我们可以采用离散的方法,将这些数映射到 0-10^3 上,这个过程就叫做离散。 vector<int> alls; // 存储所有待离散的值 sort(alls.begin(), alls.end()); // 将所有值排序 alls.erase(unique(alls.begin (), alls.end()), alls.end()); // 去掉重复元素 2.如何算出x离散后的值 ==> 用二分法 int find(int x) // 找到第一个大于等于x的位置 { ,整体是稀疏的,我们可以采用离散的方式进行映射。

    69720编辑于 2023-05-24
  • 来自专栏凹凸玩数据

    pandas:数据离散离散数据的后期处理(one-hot)

    大家好,我是黄同学 今天跟大家聊聊数据离散离散数据的后期处理。 1、什么是数据离散? 连续属性的离散,就是将连续属性的值域划分为若干个离散的区间。 2、为什么要进行数据离散?   数据离散可以有效的降低时间复杂度和内存开销。   对于某些机器学习算法来说,像决策树、随机森林、朴素贝叶斯。他们的数据集大多数都是针对的离散型数据。 如果将收入转换为离散数据类型(低薪、中薪、高薪),就能够很清楚的看出原始数字的含义。   离散后的特征对异常数据有很强的鲁棒性:对于年龄这个特征,如果年龄>30是1,否则0。 假如特征没有离散,一个异常数据“年龄300岁”会给模型造成很大的干扰。 更多数据离散的内容,可以参考如下文章:https://zhuanlan.zhihu.com/p/91181935 3、怎么进行数据离散?   

    3.4K00发布于 2020-03-16
  • 来自专栏ACM算法竞赛——模板

    ACM算法竞赛——离散(模板)

    vector<int> alls; // 存储所有待离散的值 sort(alls.begin(), alls.end()); // 将所有值排序 alls.erase(unique(alls.begin (), alls.end()), alls.end()); // 去掉重复元素 // 二分求出x对应的离散的值 int find(int x) // 找到第一个大于等于x的位置 { int

    51940编辑于 2022-05-14
  • 来自专栏数据结构与算法分享

    【简单】区间和(离散方法)

    数据范围 \rm{1} \le n,m \le {10^5} 输入样例 3 3 1 2 3 6 7 5 1 3 4 6 7 8 输出样例 8 0 5 题解 (离散、前缀和) 对于数据量比较小的数组,可直接使用前缀和操作即可 根据题意,虽然数据的范围很大({10^9}),但需要我们处理的坐标最多也就是\rm{3} \times {10^5},即 n + 2m (\rm{1} \le n,m \le {10^5}),所以将其离散可以节省很多不必要的操作 离散即是把无限空间中有限的个体映射到有限的空间中去,此题我们把需要处理的数组下标映射到一个新的容器 alls 中去,定义 find() 函数来返回离散容器 alls 中对应坐标的位置,最后,用之前的前缀和思想即可在较短时间实现题目要求 = 300010; int n, m; int a[N], s[N]; vector<int> alls;//需要操作的坐标 vector<PII> add, query; //二分查找坐标x在离散坐标容器

    81930发布于 2021-08-09
  • 来自专栏若尘的技术专栏

    数据清洗之 数据离散

    数据离散 数据离散就是分箱 一把你常用分箱方法是等频分箱或者等宽分箱 一般使用pd.cut或者pd.qcut函数 pandas.cut(x, bins, right=True, labels) x: 数据 bins: 离散的数目,或者切分的区间 labels: 离散后各个类别的标签 right: 是否包含区间右边的值 import pandas as pd import numpy as np

    2.1K117发布于 2021-05-14
  • 来自专栏用户画像

    机器学习 | LR 特征离散

    LR模型介绍:机器学习 | LR逻辑回归模型_公众号:算法攻城狮-CSDN博客 在工业界,很少直接将连续值作为逻辑回归模型的特征输入,而是将连续特征离散化为一系列0、1特征交给逻辑回归模型,这样做的优势有以下几点 : (1)离散特征的增加和减少都很容易,易于模型的快速迭代; (2)稀疏向量内积乘法运算速度快,计算结果方便存储,容易扩展; (3)离散后的特征对异常数据有很强的鲁棒性:比如一个特征是年龄>30是1, 如果特征没有离散,一个异常数据“年龄300岁”会给模型造成很大的干扰; (4)逻辑回归属于广义线性模型,表达能力受限;单变量离散化为N个后,每个变量有单独的权重,相当于为模型引入了非线性,能够提升模型表达能力 ,加大拟合; (5)离散后可以进行特征交叉,由M+N个变量变为M*N个变量,进一步引入非线性,提升表达能力; (6)特征离散后,模型会更稳定,比如如果对用户年龄离散,20-30作为一个区间,不会因为一个用户年龄长了一岁就变成一个完全不同的人 当然处于区间相邻处的样本会刚好相反,所以怎么划分区间是门学问; (7)特征离散以后,起到了简化了逻辑回归模型的作用,降低了模型过拟合的风险。

    68540编辑于 2022-11-26
  • 来自专栏TechBlog

    算法基础:离散及模板详解

    文章目录 离散 基本思想 算法思路 模板 例题:区间和 题目分析 code 离散 基本思想 首先,离散是指数值域非常大,例如 ,但是个数相对较少,例如只有 个, 但在我们的程序中需要通过这些数值作为下标 如果为了这 个数而开一个 的数组过于浪费空间,因此我们可以采用离散的方法,将这些数映射到 上,这个过程就叫做离散。 vector<int> alls; // 存储所有待离散的值 sort(alls.begin(), alls.end()); // 将所有值排序 alls.erase(unique(alls.begin (), alls.end()), alls.end()); // 去掉重复元素 2.如何算出x离散后的值 ==> 用二分法 int find(int x) // 找到第一个大于等于x的位置 { ,整体是稀疏的,我们可以采用离散的方式进行映射。

    1.5K20编辑于 2022-11-22
  • 来自专栏站长的编程笔记

    【说站】python数据离散是什么

    python数据离散是什么 概念 1、连续属性的离散就是将连续属性的值域上,将值域划分为若干个离散的区间,最后用不同的符号或整数 值代表落在每个子区间的属性值。 150, 165, 180, 195] sr = pd.cut(data, bins) # get_dummies pd.get_dummies(sr, prefix="身高") 以上就是python数据离散的介绍

    59630编辑于 2022-11-23
  • 来自专栏图灵技术域

    特征离散与选择EPSO算法详解

    步骤 (1)粒子初始:由于在高维数据上的多变量离散的搜索空间是巨大的。这意味着对于那些在初始候选方案中未被选中的特性,它们的切点将被设置为相应特性的最大值。 对于其他选择的特性,它们的切点是使用满足MDLP的最好的基于熵的切割点初始的。原则上,它们可以根据对应特性范围内的任何值进行初始。然而,完全随机的初始切点可能导致收敛速度较慢。 因此,具有较大信息增益的特性在初始过程中被选择的概率更大。 (2)粒子评价:基于粒子所产生的切点,训练数据转换为离散值的新训练集和较少的特征数,这要归功于消除特征,其切割点等于最小值或最大值。 然后根据转换训练集的分类精度,对每个粒子的离散和FS解进行评估,通过对整个离散数据的评估,提出的方法可以对所有选定特征的分割点进行评估,同时考虑特征交互。适应度函数采用平衡分类精度,如下: ? , Student Member, IEEE, Bing Xue, Member, IEEE, and Mengjie Zhang, Senior Member, IEEE 更多内容 基于PSO的特征离散与选择算法

    1.2K40发布于 2021-05-21
  • 来自专栏数据小魔方

    离散颜色标度连续的最佳方案

    今天给大家介绍一个ggplot2连续颜色映射函数中一组非常好用的预设函数,它可以很容易的帮我们实现特定离散颜色间的均匀连续。 ,因为RcolorBrewer色盘本身就是专为图形序列配色量身定制的,尽管其开发之初的主要意图是为满足离散序列的科学颜色搭配,但是将其用于连续场景也是很棒哒。 但是当你使用以上所提到的函数进行标度的设置之后,你无须进行颜色的制定了,可以直接通过封装的RcolorBrewer标度函数,设置色盘即可完成离散色盘色连续。 当然双向渐变的离散颜色组合或者多分类色组也是支持这种方式进行连续的。当然如果是带有负值的变量,使用这种双向渐变进行连续映射绝对是恰到好处。 但是多分类颜色连续以后看着就多少有些怪怪的。 RcolorBrewer包中所有离散色组颜色名称列表: ?

    3K50发布于 2018-04-11
  • 来自专栏ml

    poj-----Ultra-QuickSort(离散+树状数组)

    Sample Input 5 9 1 0 5 4 3 1 2 3 0 Sample Output 6 0 Source Waterloo local 2005.02.05 代码: 1 //离散+树状数组

    1.2K60发布于 2018-03-22
  • 来自专栏算法修养

    CodeForces 670C Cinema(排序,离散)

    2 2 3 2 2 3 output 2 input 6 6 3 1 1 3 7 5 1 2 3 4 5 2 3 4 5 1 output 1 bi为第一关键字,ci为第二关键字,排序,先离散一下

    76570发布于 2018-04-26
领券