首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏AI机器学习与深度学习算法

    机器学习入门 4-8 scikit-learn中的scaler

    可以理解成算法就包括对所有数据 - mean_train / std_train。针对后面来的数据,我们也使用同样的方式进行处理。 sklearn为了统一接口,将Scalar(归一化)这个类和机器学习算法这个类,他们整体的使用流程是一致的。下图就是sklearn封装Scalar这个类的使用流程: ? 当训练集传入Scaler中,这个Scaler也有一个fit,这个fit算法就是求出训练数据集对应的一些统计指标,比如,对于均值方差归一化来说,fit操作之后,就求出了训练集的均值和方差,之后Scaler 其实对比机器学习算法,只是将机器学习算法中的predict改成了transform。 有了transform,我们就可以方便使用Scaler对后续的样本进行归一化,进而送入机器学习的算法中来训练预测处理。 具体使用sklearn进行数据归一化操作如下: ? ? ? ? ?

    1.4K00发布于 2019-11-13
  • 来自专栏脑电信号科研科普

    theta悖论:4-8 Hz的EEG振荡既反映睡眠压力又体现认知控制

    利用FieldTrip中的相干源动态成像(DICS)算法进行波束形成器源定位,基于对标准MRI模板大脑的分割,利用SimBio工具箱实现了一个有限元头部模型。

    1.1K30编辑于 2023-01-16
  • 来自专栏IT技术圈(CSDN)

    浙大版《C语言程序设计(第3版)》题目集 习题4-8 高空坠球

    习题4-8 高空坠球 皮球从某给定高度自由落下,触地后反弹到原高度的一半,再落下,再反弹,……,如此反复。问皮球在第n次落地时,在空中一共经过多少距离?第n次反弹的高度是多少?

    1.7K10发布于 2020-09-15
  • 来自专栏烤包子

    算法笔记】道格拉斯-普克算法(经纬度或坐标点抽稀)

     道格拉斯-普克算法 (Douglas–Peucker algorithm,亦称为拉默-道格拉斯-普克算法、迭代适应点算法、分裂与合并算法)是将曲线近似表示为一系列点,并减少点的数量的一种算法。 选到点到直线距离的最大者与阈值相比较,若大于阈值,则记录该点,否则将直线两端点间各点全部舍去,如右图(2),记录第4个点,然后根据地4个点,将点分成两段1-4,4-8 然后分别对1-4,4-8重复第1、

    2.3K10发布于 2021-11-10
  • 来自专栏大数据成长之路

    scala快速入门系列【偏函数】

    示例二 定义一个列表,包含1-10的数字 请将1-3的数字都转换为[1-3] 请将4-8的数字都转换为[4-8] 将其他的数字转换为(8-*] 参考代码 ? 运行结果: List([1-3], [1-3], [1-3], [4-8], [4-8], [4-8], [4-8], [4-8], (8,*), (8,*)) ---- 本期的内容分享就到这里了

    39620发布于 2021-01-26
  • 来自专栏技术分享

    算法】----BF算法&KMP算法

    我们今天所讨论的两个算法就是有关该过程的算法。 事实上,对于检索,无非就是两个字符串的匹配过程,模式串是你想要匹配的串,主串是你搜索所在串。 BF算法和KMP算法是较为著名的模式匹配算法,接下来作出详细介绍。 BF算法 BF算法(Brute-Force)也称为暴力算法,其核心原理是逐个比较文本串和模式串的字符,如果匹配失败,则通过向右移动模式串的位置,再次进行比较。 在实际情况下,BF算法的效率并不高,特别是当文本串T和模式串P的长度很大时。对于较长的文本串和模式串,BF算法的时间复杂度可能会导致性能问题。 答案就是KMP算法。 KMP算法 KMP算法的核心思想是利用模式串自身的特点来加速匹配过程,避免重复匹配。

    58110编辑于 2024-06-18
  • 大模型备案实操指南:关键步骤与核心要点

    聚焦备案核心流程,助力开发者快速通过审核一、备案核心要求主体资质境内注册的独立法人企业设立专职算法安全负责人(3年以上相关经验)外资企业需通过数据跨境安全评估数据合规要点训练数据来源合法,无侵权违法内容用户个人信息处理符合 重要数据境内存储,跨境传输需安全评估内容安全机制建立“AI过滤+人工审核”双重机制防止生成违法、虚假、歧视性内容提供用户举报和申诉渠道二、备案材料清单必需材料1、主体资质文件营业执照复印件法定代表人身份证明算法安全负责人资质证明 3、审核反馈预计4-6轮反馈修改重点关注风险防控措施4、专家评审准备技术答辩提供风险评估预案时间规划材料准备:2-3周审核反馈:4-8周专家评审:1-2周总计:10-18周(建议预留缓冲时间)四、常见问题与解决方案材料准备阶段问题 1:安全自评估报告内容不足解决方案:重点说明数据安全、算法公平性、内容审核等具体措施问题2:训练数据来源证明不充分解决方案:提供数据采集协议、清洗流程、版权证明等完整链条审核反馈阶段问题1:风险防控措施不具体解决方案 、实用建议提升通过率要点提前规划:开发阶段就考虑备案要求专业支持:建议聘请法律顾问审核材料材料质量:确保数据翔实、方案可操作持续跟进:及时响应审核反馈资源投入预估时间成本:3-4个月人力投入:算法安全负责人

    61710编辑于 2025-11-25
  • 来自专栏PPV课数据科学社区

    算法】PCA算法

    小编邀请您,先思考: 1 PCA算法的原理是什么? 2 PCA算法有什么应用?

    2K40发布于 2018-04-18
  • 来自专栏用代码征服天下

    算法——排序算法

     基本思想:现在有一个数组arr= {12,35,99,18,76},需要将其从小到大排序

    1K10编辑于 2022-05-09
  • 来自专栏数据科学与人工智能

    算法】PCA算法

    小编邀请您,先思考: 1 PCA算法的原理是什么? 2 PCA算法有什么应用?

    1.9K60发布于 2018-03-27
  • 来自专栏数据科学与人工智能

    算法】Adaboost 算法

    小编邀请您,先思考: 1 Adaboost算法的原理是什么 ? 2 Adaboost算法如何实现? 是一个加法模型,而Adaboost算法其实是前向分步算法的特例。那么问题来了,什么是加法模型,什么又是前向分步算法呢? 3.1 加法模型和前向分步算法 如下图所示的便是一个加法模型 ? 这个优化方法便就是所谓的前向分步算法。 下面,咱们来具体看下前向分步算法算法流程: 输入:训练数据集 ? 损失函数: ? 基函数集: ? 输出:加法模型 ? 3.2 前向分步算法与Adaboost的关系 在上文第2节最后,我们说Adaboost 还有另外一种理解,即可以认为其模型是加法模型、损失函数为指数函数、学习算法为前向分步算法的二类分类学习方法。 前向分步算法逐一学习基函数的过程,与Adaboost算法逐一学习各个基本分类器的过程一致。 下面,咱们便来证明:当前向分步算法的损失函数是指数损失函数 ?

    2.5K140发布于 2018-03-27
  • 来自专栏数据科学与人工智能

    算法】SVD算法

    2 SVD算法与PCA算法有什么关联? 3 SVD算法有什么应用? 4 SVD算法如何优化? 前言 奇异值分解(Singular Value Decomposition,简称SVD)是在机器学习领域广泛应用的算法,它不光可以用于降维算法中的特征分解,还可以用于推荐系统,以及自然语言处理等领域,是很多机器学习算法的基石 本文就对SVD的原理做一个总结,并讨论在在PCA降维算法中是如何运用运用SVD的。 也可以用于推荐算法,将用户和喜好对应的矩阵做特征分解,进而得到隐含的用户需求来做推荐。同时也可以用于NLP中的算法,比如潜在语义索引(LSI)。 SVD小结 SVD作为一个很基本的算法,在很多机器学习算法中都有它的身影,特别是在现在的大数据时代,由于SVD可以实现并行化,因此更是大展身手。

    2K121发布于 2018-03-27
  • 来自专栏华章科技

    手把手教你用ECharts画柱状图

    series: [{ data: [100, 150, 120, 90, 50, 130, 110], type: 'bar' }] }; 可视化结果如图4- ▲图4-8 简单的柱状图 我们同样可以在代码中添加label以显示具体数值,例如在每个柱子上显示对应数值,代码如下: option = { xAxis: { type: 'category ▲图4-13 堆叠柱状图调整堆叠效果 关于作者:王大伟,毕业于华东理工大学,硕士学历,目前就职于平安金融壹账通,从事数据挖掘算法工作,擅长ECharts、Python、自然语言处理、数据分析挖掘、机器学习

    4K20发布于 2021-02-05
  • 来自专栏用户11163528的专栏(2)

    数据库服务器的 CPU 核心数怎么选

    - 内存:4-8 GB。- 存储:50-100 GB SSD。- 网络带宽:100 Mbps。二、中型数据库- 应用场景:中等规模的企业应用、电子商务网站、有一定并发访问量的应用。 - 推荐配置:- CPU 核心数:4-8 核。- 内存:8-16 GB。- 存储:100-500 GB SSD。- 网络带宽:1 Gbps。 - 中并发(100-1000 个并发用户):4-8 核。- 高并发(超过 1000 个并发用户):8 核以上。2. 查询复杂性:- 简单查询:4 核即可满足需求。

    4.2K10编辑于 2025-02-25
  • 来自专栏Super 前端

    算法--分治算法

    本文链接:https://ligang.blog.csdn.net/article/details/83866378 分治算法 分而治之,把一个复杂的问题分成两个或更多的相同或相似的子问题,再把子问题分成更小的子问题 经典递归案例: 示例: 归并排序 详见:javascript排序算法 示例: 二分查找法(二分法) 二分查找也称折半查找,其要求线性表必须采用顺序存储结构,而且表中元素按关键字有序排列。

    89531发布于 2019-08-15
  • 来自专栏半生瓜のblog

    算法】查找算法

    查找算法 查找的定义 查找:又称检索或查询,是指在查找表中找出满足一定条件的结点或记录对应的操作。 查找效率:查找算法中的基本运算是通过记录的关键字与给定值进行比较,所以查找的效率通常取决于比较所花的时间,而时间取决于比较的次数。通常以关键字与给定值进行比较的记录个数的平均值来计算。 数组是特殊的块索引(一个块一个元素): [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-xDbRyWBM-1635489015712)(查找算法.assets/image- [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-6LawbrgF-1635489015715)(查找算法.assets/image-20211028180620292.png )] 分块查找的算法分两步进行,首先确定所查找的节点属于哪一块,即在索引表中查找其所在的块,然后在块内查找待查询的数据。

    1K20编辑于 2023-05-13
  • 来自专栏数据科学与人工智能

    算法】xgboost算法

    小编邀请您,先思考: 1 XGBoost和GDBT算法有什么差异? XGBoost的全称是 eXtremeGradient Boosting,2014年2月诞生的专注于梯度提升算法的机器学习函数库,作者为华盛顿大学研究机器学习的大牛——陈天奇。 xgboost问世后,因其优良的学习效果以及高效的训练速度而获得广泛的关注,并在各种算法大赛上大放光彩。 ? 具体算法如下: 输入:训练集 ? 输出:提升树 步骤: (1)初始化 (2) 对m=1,2,3……M a)计算残差 ?

    2K90发布于 2018-03-27
  • 来自专栏数据科学与人工智能

    算法】GBDT算法

    小编邀请您,先思考: 1 GBDT算法的原理是什么? 2 GBDT算法如何做正则化处理? GBDT在BAT大厂中也有广泛的应用,假如要选择3个最重要的机器学习算法的话,个人认为GBDT应该占一席之地。 分类算法 GBDT的分类算法从思想上和GBDT的回归算法没有区别,但是由于样本输出不是连续的值,而是离散的类别,导致我们无法直接从输出类别去拟合类别输出的误差。 除了负梯度计算和叶子节点的最佳残差拟合的线性搜索,二元GBDT分类和GBDT回归算法过程相同。 多元分类算法 多元GBDT要比二元GBDT复杂一些,对应的是多元逻辑回归和二元逻辑回归的复杂度差别。 由于GBDT的卓越性能,只要是研究机器学习都应该掌握这个算法,包括背后的原理和应用调参方法。目前GBDT的算法比较好的库是xgboost。当然scikit-learn也可以。

    1.6K80发布于 2018-03-27
  • 来自专栏半生瓜のblog

    算法】分治算法

    分治算法 将一个规模为N的问题分解为k个较小的子问题,这些子问题遵循的处理方式就是互相独立且与原问题相同。 两部分组成: 分(divide):递归解决较小的问题。

    66610编辑于 2023-05-13
  • 来自专栏用代码征服天下

    算法——查找算法

    1、顺序查找: 定义: 顺序查找(Sequential Search) 又叫线性查找,是最基本的查找技术,它的查找过程是:从表中第一个(或最后一个)记录开始,逐个进行记录的关键字和给定值比较,若某个记录的关键字和给定值相等,则查找成功,找到所查的记录;如果直到最后一个(或第一个)记录,其关键字和给定值比较都不等时,则表中没有所查的记录,查找不成功。 代码: import java.util.Scanner; import org.junit.jupiter.api.Test; /** * 顺序查找

    1.1K10编辑于 2022-05-09
领券