首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏AI机器学习与深度学习算法

    机器学习入门 11-7 RBF核函数

    通常我们会将核函数表示成函数 K(x, y),其中 x, y 为两个样本点特征向量,核函数表示就是重新定义后 x 和 y 点乘。高斯核函数定义如下所示: ? 多项式特征基本原理就是升维,也就是将我们原来样本点按照某种规则扩充样本点维度。 ? 在多项式特征中,我们要做事情就是添加多项式特征,使得原本线性不可分数据变得线性可分。 比如如果原本样本点只有一个特征 x,那么现在为每一个样本点相对应添加新特征 x 平方,这样就可能使得原本线性不可分数据集变线性可分。 每个样本点: 第一个维度值就是样本点特征值 x; 第二个维度值就是新添加样本点特征值 x^2; 此时,我们所有数据点一下子变成了下图样子。 ? 下一小节将会具体使用高斯核函数 SVM 来看看分类结果是怎样,以及得到分类结果决策边界。此外在下一小节将会介绍高斯核函数中 γ 超参数具体作用。

    6.3K30发布于 2020-10-09
  • 来自专栏超级架构师

    三个无人讨论大数据发展趋势

    您在一年前讨论大数据将与今天对话截然不同。 我们最近看到数据科学从外围功能显着转变为核心功能,更大团队解决日益复杂分析问题。我们已经看到数据科学平台快速发展和对数据和分析团队巨大影响。 数据科学将在一年内谈论什么新发展?以下是我们三个预测: 大数据收益递减:数据大小不再是重点。 我们越来越多地看到更大数据通常不会更好。 尽管如果干净数据更多数据可能是有用,绝大多数业务用例都会减少边际回报。更多数据实际上可以减缓创新,使得数据科学家在测试需要更长时间并需要更多基础设施时,更难以快速迭代。 一个例子是美国联邦储备委员会发行SR 11-7,其要求包括“[要求]银行将模型使用和开发与验证分开,建立一个综合全公司模式风险功能,维护所有的库存模型,并充分记录他们设计和使用,“Risk.net 随着数据科学和分析推动更多组织决策,以及代表决策方案更大部分 - 期望更多内部和外部数据模型审查。 SR 11-7例子是说明性

    53350发布于 2018-04-09
  • 来自专栏愿天堂没有BUG(公众号同名)

    自从学了深入解析java虚拟机:FullGC和字符串去重后,我无敌了

    早期G1FGC使用单线程标记整理算法,后来为了充分发挥多核处理器优势,JEP 307提案为G1FGC设计了多线程标记整理算法,此时多线程FGC线程数量可以由-XX:ParallelGCThreads G1多线程FGC与Parallel GCFGC类似,是一个全局STW过程,G1使用线程组完成垃圾回收工作,整个阶段都不允许Mutator线程运行。 FGC实现位于G1FullCollector::collect(),如代码清单11-7所示: 代码清单11-7 G1 FGC void G1FullCollector::collect() { phase1 触发FGC场景有很多,举例如下: Mixed GC中如果老年代回收速度小于对象分配或晋升速度,会触发FGC; YGC最后会移动存活对象到其他分区,如果此时发现没有能容纳存活对象Region,会触发 由于FGC全局STW性,如果频繁发生FGC是比较糟糕信号,它暗示应用程序特性与当前G1参数配置不能良好契合,需要开发者找到问题并进一步调优处理。

    89720编辑于 2022-10-31
  • 来自专栏华章科技

    所到之处,寸草不生!深扒黑产工具和羊毛党操作流程

    导读:随着“互联网+”兴起,越来越多公司开始上线互联网业务,为了吸引客户或引来更多流量,企业就需要进行各种促销与补贴活动,但这些原本应该给真实用户带来优惠活动,却被互联网上另一群团体——黄牛、 笔者曾经以损失近1000台小米手机惨痛代价认识了这个群体,在后续工作中也组建了风控团队,在“6.18”“双11”活动中与这群人多次交手。在本文中,笔者将介绍对付羊毛党、黄牛一些经验。 很多没有互联网风控经验公司,或对运营配置不当公司,都会被这群团伙盯上。下面举两个例子。 1. 而刷机软件则可以瞬间改变手机各种信息,制造虚假手机信息,用于逃避一些风控策略检测,如图11-5和图11-6所示。 ? ▲图11-5 手机模拟器 ? 对于手机号和IP这类资源,几乎可以认为对方资源是无限,如图11-7所示。 ? ▲图11-7 IP代理池 2.

    3.9K21发布于 2020-07-29
  • 来自专栏华章科技

    马太效应和幂律分布是怎么回事?终于有人讲明白了

    为了观察真正发生了什么,请查看显示了布朗语料库中所有40234个不同单词完整分布图11-6和图11-7。 ▲图11-7 对数坐标轴下布朗语料库经验分布和Zipf分布 在对数刻度下,我们能看清所有东西,因为Zipf定律是幂率(power law)一个特例。 因此当我们遇到在对数图里成一条直线数据时,就是其理论分布可能是幂率明显信号。 经济学中幂率一个例子是帕累托法则,它指出80%结果源自20%起因。 除了在介绍马太效应时已经提到例子外,我们还发现幂率出现在如科技论文引用、地震震级和月球陨石坑直径等如此不同领域中,还有生物物种随时间推移而增多、分形学、食肉动物觅食模式以及太阳耀斑射线峰值强度 它指出了在很多种类数据中数字频率分布。 具体地,它指出,一个数第一位数字是1概率是30%,从2到9每个数字出现在第一位频率逐渐降低。

    1.9K11发布于 2020-08-07
  • 来自专栏其它

    【转】系统设计-第11章:设计一个信息推送系统

    面试官:都是候选人:哪些是重要特征?面试官:用户可以发布帖子,并在信息流页面上看到她朋友帖子。候选人:信息是按逆时针顺序排序,还是按任何特定顺序,如主题得分?例如,你亲密朋友帖子有更高分数。 一个新帖子在发布后会立即被送到朋友缓存中。优点:动态消息是实时生成,可以第一时间推送给朋友。获取信息流速度很快,因为信息流是在写时候预先计算。 读扇出信息源是在阅读时间内产生。这是一个按需分配模式。当用户加载她主页时,最近帖子被拉出。优点:对于不活跃用户或那些很少登录用户,读取时扇出效果更好,因为它不会在他们身上浪费计算资源。 数据不会被推送给朋友,所以不存在热键问题。缺点:获取信息源速度很慢,因为信息源不是预先计算。我们采用了一种混合方法,以获得两种方法好处并避免其中缺点。 图 11-6 显示了缓存中信息流示例。信息源检索深入研究图 11-7 说明了信息检索详细设计。如图11-7所示,媒体内容(图片、视频等)存储在CDN中,便于快速检索。

    86510编辑于 2024-10-30
  • 来自专栏小程序云开发入门

    点餐系统部署,Java点餐系统部署到腾讯云Linux服务器

    经过前面几节学习,我们在腾讯云Linux服务器上成功安装了jdk8,mysql8,并且教会了大家如何配置ssl证书实现https,今天我们就来正式部署点餐系统到linux服务器,这里以腾讯云服务器为例 准备工作 1,linux服务器安装jdk8 2,linux服务器安装mysql8 3,申请ssl证书,配置https 4,要有一个备案域名 上面这几条我前面的章节和视频都有讲解过,大家翻下我文章,或者去看下我视频 把证书放到我们项目里resources目录下 ? 二,配置ssl证书到点餐项目里 ? 把上图配置代码贴出来给大家,一定要注意,根据代码上注释来配置。 这样我们就可以成功加载到数据了 ? 然后点餐系统就可以提交发布了。 到这里我们点餐系统和点餐小程序就可以成功供外界使用了,后面会更新更多Java和小程序课程出来,请持续关注。 11-1~点餐系统部署到Linux服务器简介 11-7~在服务器上运行点餐系统供别人访问 11-8~小程序配置域名访问我们点餐后台 完整点餐系统+小程序视频:https://study.163.com

    4.3K30发布于 2020-10-22
  • 来自专栏AI机器学习与深度学习算法

    机器学习入门 11-9 SVM思想解决回归问题

    a SVM思想解决回归问题 回归问题本质其实就是找到一根直线(或曲线)能够最大程度拟合样本数据点,不同定义拟合方式对应着不同回归算法。 比如前面介绍线性回归算法定义拟合方式就是让样本点到预测这根直线MSE值最小。 SVM思想解决回归问题对拟合定义是指定一个margin值(在使用SVM思想解决分类问题时候,对应决策边界上下也有一个margin),与SVM思想解决分类问题margin不同,使用SVM思想解决回归问题期望在这个给定 margin范围内包含样本点越多越好,margin范围内样本点越多代表这个margin范围能够更好表达我们样本点,在这种情况下,取margin范围中间这根直线作为真正回归结果。 【机器学习】机器学习入门 11-6 到底什么是核函数 【机器学习】机器学习入门 11-7 RBF核函数 【机器学习】机器学习入门 11-8 RBF核函数中gamma 【Pytorch】PyTorch

    1.3K31发布于 2020-10-26
  • 来自专栏AI机器学习与深度学习算法

    机器学习入门 11-8 RBF核函数中gamma

    本小节将通过实践应用sklearn为我们封装高斯核SVM算法来进行具体分类并解释分类决策边界几何意义,着重实验不同gamma取值对最终分类决策边界影响。 a 高斯核中gamma 高斯核函数和概率论中高斯函数(正太分布)形式是一致。 高斯核函数中gamma越大,相对高斯函数中σ越小,此时分布曲线也就会越高越瘦; 高斯核函数中gamma越小,相对高斯函数中σ越大,此时分布曲线也就越矮越胖; 接下来使用sklearn中核函数为高斯核函数 使用高斯核函数进行分类决策边界其实就是针对其中某一类每一个样本点都有一个分布曲线,我们所观察决策边界可以想象成俯视每个样本点分布曲线,而这些样本点就是俯视时候看到分布曲线尖。 【技术干货】详解 Linux 中硬链接与软链接 【数据分析】详解 matplotlib 中两种标注方法 【机器学习】机器学习入门 11-6 到底什么是核函数 【机器学习】机器学习入门 11-7

    5.8K51发布于 2020-10-26
  • 来自专栏mathor

    matlab—图形界面(GUI)程序设计

    图11-6 对齐对象 对齐控件了以后,我们再考虑一个问题,按钮都有它各自作用,所以我们要让他展现不同名字,以直观让人知道这个按钮是干什么,所以我们需要修改控件样式,如何操作? 双击控件即可,比方说我要把第一个按钮名称改为,按钮1,我只需要双击控件,找到它对应属性进行修改 ? 图11-7 修改控件属性 这里我们还要多看一个属性,叫tag,如何辨别每个控件? 就通过它tagid ? 图11-8 tag 上面讲都是界面的一些知识,下面我们要讲就是关于GUI程序背后代码撰写部分,一个应用程序,除了有界面以外,还需要背后代码才能实现交互 ? 图11-15 选择确定axes 其实就加了个代码,将surf要画”tag“确定下来即可 下面我们做个小例子,这个例子功能是,当我滑动滑动条时候,静态文本显示值会随着我滑动而改变 首先是界面设计 图11-17 滑动条参数 然后我们稍微把静态文本字体调大一点,顺便记住他tag,后面要用到 ?

    5.3K20发布于 2018-07-24
  • 来自专栏开源能源管理系统

    MyEMS能源管理系统后台配置-设备管理

    MyEMS开源能源管理系统适用于建筑、工厂、商场、医院、园区电、水、气等能源数据采集、分析、报表,还有光伏、储能、充电桩、微电网、设备控制、故障诊断、工单管理、人工智能优化等可选功能。 查看绑定计量表:    1.点击菜单“系统管理”    2.点击菜单“设备管理”    3.点击标签页“绑定计量表”    4.选择设备“5-8#冷冻水泵”    5.右侧绿色框“5-8#冷冻水泵绑定表 ”下显示即为该设备所绑定计量表图11-4绑定计量表列表 添加绑定计量表:    1.点击菜单“系统管理”    2.点击菜单“设备管理”    3.点击标签页“绑定计量表”    4.选择设备“5- 11-7绑定参数列表 添加绑定参数:    1.点击菜单“系统管理”    2.点击菜单“设备管理”    3.点击标签页“绑定参数”    4.选择设备“5-8#冷冻水泵”    5.点击按钮“添加参数 .添加命令成功图11-11绑定命令 删除命令:    1.点击菜单“系统管理”    2.点击菜单“设备管理”    3.点击标签页“绑定命令”    4.在“设备”框中选择设备    5.拖动想删除数据点到红色回收桶中

    32610编辑于 2025-05-28
  • 来自专栏PowerBI战友联盟

    Power Query 真经 - 第 11 章 - 处理基于 Web 数据源

    使用 Power Query 一个非常有趣场景是,可以利用它从 Web 上抓取与业务相关数据,并用它来丰富自己公司数据。数据通常以两种不同方式之一存储在 Web 上。 存储在网站中文件。 如果有,将在【导航器】窗口左侧窗格中看到标题为 “HTML 表格” 列表。相反,在这里看到只是两个 “建议表格”,Power Query 引擎从 HTML 文档 CSS 推断出表。 短暂延迟后,Power Query 会根据用户示例输入信息以及其他网页上数据推断出用户真实提取意图,并自动填充这一列其他部分。 在如图 11-7 所示视图中,可以构建了一个表,根据第一列记录,从其中提取内容包括数据集,浏览次数,以及最后更新时间。 图 11-7 使用【示例添加表】获取数据 完成后,用户可以通过单击【确定】,然后选择进一步【加载】或【转换数据】来访问自定义表,如图 11-8 所示。

    4.4K30编辑于 2023-03-01
  • 来自专栏积累沉淀

    Python快速学习第十天

    大于1数字代表缓冲区大小(单位是字节),-1(或者是任何负数)代表使用默认缓冲区大小。 11.2 基本文件方法 打开文件方法已经介绍了,那么下一步就是用它们做些有用事情。 首先指定了我要读取字符数"4",然后(通过不提供要读取字符数方式)读取了剩下文件。注意,在调用open时可以省略模式,因为'r'是默认。 为了避免发生这种情况,可以使用在第五章介绍过while true/break语句。最终代码如代码清单11-7所示。 # 代码清单11-7 用不同方式写循环 f = open(filename) while True: char = f.read() if not char: break process(char) f.close 如在第五章提到,break语句不应该频繁地使用(因为这样会让代码很难懂);尽管如此,代码清单11-7中使用方法比代码清单11-6中方法要好

    1.7K60发布于 2018-01-11
  • 来自专栏程序猿DD

    宜家如何利用低代码平台提升员工效率,提高数据价值

    低代码开发已经在全球范围内不同行业、不同企业中得到应用,并且使用场景、角色等也在不断拓展。本文介绍低代码在零售领域应用:构建敏捷客户服务管理案例。 产品质量、品牌影响力并不能完全决定顾客购买意愿,售前、售中、售后购买体验,客服人员专业程度,都会影响潜在顾客购买。 整个2B销售过程涉及几个团队协作,销售部门利用定制电子表格来追踪相关预约、潜在客户、正在进行项目以及项目中涉及厨房用品采购流程等。 同时,公司也可以通过集中管理客户信息与客户建立起长久服务关系(不再是原来单纯买卖关系),为客户持续不断地提供优质服务。应用示例如图11-7所示。 图11-7 客户支持中心App页面 三、 带来收益 宜家家居销售工具投入生产还不到6个月。

    1.7K20发布于 2021-09-03
  • 来自专栏FPGA技术江湖

    一周玩转示波器(五)

    FPGA技术江湖"就是这么一个宠粉公众号,那就满足各位大侠需求,将相关教程以及学习资料整理整合后变成了“一周玩转示波器”。每日十分钟,坚持下去,量变成质变。 图10-3 1 表示被激活垂直光标(实线)与波形交点电压; 2 表示两条垂直光标与波形交点电压差; 3 表示被激活垂直光标相对于触发点时间差值; 4 表示两条垂直光标之间时间差值 3、平板示波器 调用 (1) 按“Save/Recall”区域“Menu”按键,打开菜单。 (2) 按“恢复波形”。 (3) 选择要从中调出波形位置(USB 或“R1/R2”),从而得到想要调用波形。 (2) 按“Ch1”或“Ch2”选择需要保存波形通道; (3) 按下方对应功能选择键,将波形数据存储到对应位置(R1—R4 中其中一个)。 ? 图11-7 END 后续会持续更新,带来Vivado、 ISE、Quartus II 、candence等安装相关设计教程,学习资源、项目资源、好文推荐等,希望大侠持续关注。

    1.4K20发布于 2020-12-29
  • 来自专栏SeanCheney的专栏

    《Scikit-Learn与TensorFlow机器学习实用指南》 第11章 训练深度神经网络(下)

    到目前为止,我们已经看到了四种加速训练方法(并且达到更好解决方案):对连接权重应用良好初始化策略,使用良好激活函数,使用批量规范化以及重用预训练网络部分。 这是 Boris Polyak 在 1964 年提出动量优化背后一个非常简单想法。相比之下,普通梯度下降只需要沿着斜坡进行小有规律下降步骤,所以需要更多时间才能到达底部。 简而言之,这种算法会降低学习速度,但对于陡峭尺寸,其速度要快于具有温和斜率尺寸。 这被称为自适应学习率。 它有助于将更新结果更直接地指向全局最优(见图 11-7)。 另一个好处是它不需要那么多去调整学习率超参数η。 ? 图11-7 AdaGard vs 梯度下降 对于简单二次问题,AdaGrad 经常表现良好,但不幸是,在训练神经网络时,它经常停止得太早。 它通过在第一步中使用指数衰减来实现(见公式 11-7)。 ? 公式11-7 RMSProp算法 它衰变率β通常设定为 0.9。

    1.3K20发布于 2020-10-27
  • 来自专栏啄木鸟软件测试

    在编程中处理adb命令—App自动化测试与框架实战(10)

    1.监听器   监听器是一些预定义Java接口。用户创建这些接口实现类,并把它们加入TestNG中,TestNG 便会在测试运行不同时刻调用这些类中接口方法。 在下例中,设置全局等待时间是30s,这是最长等待时间。   最直接方式是设置固定等待时间。    不管是否加载完成,隐式等待都会等待特定时间,它会让一个正常响应应用测试变慢,增加了整个测试执行时间。 InterruptedException e) {System.err.println(e);}finally{try {proc.destroy();} catch (Exception e2) {}}}   输出结果如图1111-7 CPU性能指标   在实际测试过程中可以多次调用上述代码,以获取不同阶段CPU值。其他性能指标的获取方法类似。

    1.8K30发布于 2019-12-12
  • 来自专栏区块链入门

    《DAMA-DMBOK2》读书笔记-第11章 数据仓库和商务智能

    面向主题、整合、随时间变化、包含汇总和明细、稳定历史数据集合”。 因为数据是整合,数据仓库不是简单运营数据副本。相反,数据仓库变成了一个数据记录系统。 随时间变化。数据仓库存储是某个时间段数据。 数据仓库中数据包括原子交易明细,也包括汇总后数据。 历史。业务系统重心是当前数据。数据仓库还包括历史数据,通常要消耗很大存储空间。 商务智能和大数据概念架构 图11-5 数据仓库/商务智能和大数据概念架构 表11-6 CDC技术比对 表11-6 CDC技术比对 图11 -7 发布流程示例 图11-7 发布流程示例

    1.4K40编辑于 2022-09-08
  • 大模型与智能体时代金融人工智能关键技术及应用场景全景图(2):金融犯罪合规与反洗钱 (FCC & AML) 应用场景解析

    传统基于规则(Rules-Based)FCC方法导致了海量误报(False Positives),引发了运营疲劳和监管摩擦。 在数据驱动决策、敏捷风险治理以及模型风险管理现代化这一框架下,FCC不再是被动防御防线,而是通过图神经网络(GNNs)、智能体AI(Agentic AI)和大语言模型(LLMs)转化为主动情报资产 风险覆盖深度提升传统规则系统难以发现复杂洗钱类型(如“特洛伊木马”交易或复杂贸易洗钱)。 这种透明度对于满足美联储SR 11-7模型风险管理指引至关重要。 AI高精度匹配减少了对合法商业活动干扰,保障了支付流顺畅。14.

    31400编辑于 2026-02-25
  • 来自专栏SeanCheney的专栏

    《机器学习实战:基于Scikit-Learn、Keras和TensorFlow》第11章 训练深度神经网络

    ,消失/爆炸梯度问题部分是由于激活函数选择不好造成。 这是 Boris Polyak 在 1964 年提出动量优化背后一个非常简单想法。相比之下,普通梯度下降只需要沿着斜坡进行小有规律下降步骤,所以需要更多时间才能到达底部。 简而言之,这种算法会降低学习速度,但对于陡峭维度,其速度要快于具有温和斜率维度。 这被称为自适应学习率。 它有助于将更新结果更直接地指向全局最优(见图 11-7)。 另一个好处是它不需要那么多去调整学习率超参数η。 ? 图11-7 AdaGard vs 梯度下降 对于简单二次问题,AdaGrad 经常表现良好,但不幸是,在训练神经网络时,它经常停止得太早。 它通过在第一步中使用指数衰减来实现(见公式 11-7)。 ? 公式11-7 RMSProp算法 它衰变率β通常设定为 0.9。

    1.7K10发布于 2019-10-25
领券