首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏AI机器学习与深度学习算法

    机器学习入门 10-4 F1 Score

    全文字数:4485字 阅读时间:13分钟 前言 本系列是《玩转机器学习教程》一个整理的视频笔记。 这就涉及到如何来解读精准率和召回率这两个指标,这个问题的答案和大多数机器学习领域中关于取舍问题的答案是一致的,都需要视具体的场景而定。 ▲精准率和召回率 对于一些场景来说,我们更加注重的是精准率。 ▲股票预测问题中更加注重精准率 比如我们要做一个机器学习算法来进行股票的预测,将股票预测这样的问题转换成一个二分类问题,预测未来的股票是升还是降,我们关注的是股票升的事件,因此将预测股票升这个事件发生定义为类别 训练好的算法在测试集上的准确率达到了97.5%,不过通过前几个小节的学习知道:对于这种极度偏斜的数据集来说,准确率很难来作为评价算法的性能的指标,因此有了混淆矩阵这个小工具,进而有了精准率和召回率这两个新的评价指标

    2K20发布于 2020-04-08
  • 来自专栏mysql

    hhdb数据库介绍(10-4)

    该功能用来查看和管理所有计算节点集群中存储节点所在实例的主从关系。实例信息可以通过主机名、端口号、和存储节点版本号进行筛选。

    74710编辑于 2025-03-13
  • 来自专栏完美Excel

    VBA专题10-4:使用VBA操控Excel界面之设置工作簿视图和窗口

    如果删除了拆分窗格,也需要下列代码行 '因为ActiveWindow对象的Split属性可能初始化为True .Split = False End With 说明:本专题系列大部分内容学习整理自 《Dissectand Learn Excel VBA in 24 Hours:Changingworkbook appearance》,仅供学习研究。

    5K20发布于 2020-08-04
  • 顶刊分享----空间免疫评分系统预测肝癌复发

    我们来学习一下HCC是全球癌症相关死亡的第三大原因,切除术后复发率约为70%。研究肿瘤复发需要充分考虑肿瘤微环境(TME)内的空间异质性和相互作用。 REC和非REC HCC之间最显著的差异是非REC HCC IF中NK细胞的富集评分显著高于REC HCC(P = 4.3 × 10-4),表明IF中NK细胞浸润增加的患者复发风险较低。 CD56+ ordinary NK(P = 3.5 × 10-2)、CD3-CD16+CD56+细胞毒性NK(P = 3.0 × 10-3)和CD3-CD57+ mature NK(P = 8.0 × 10 在模型开发阶段,利用这61名患者的全切片mIHC数据,构建并验证了一个基于极端梯度提升(XGBoost)的机器学习模型。预测HCC复发风险的算法。 人外周血的流式细胞术分析进一步证明,SPON2+NK细胞比SPON2-NK细胞表达显著更高水平的IFNγ(P = 1.0 × 10-4)和穿孔素(P = 2.0 × 10-4)。

    25320编辑于 2025-03-17
  • 来自专栏机器学习与自然语言处理

    Stanford机器学习笔记-10. 降维(Dimensionality Reduction)

    10-4给出了样本在3维空间的分布情况,其中图(2)是图(1)旋转调整后的结果。 图10-4 样本在3维正交空间的分布 ? 图10-5 样本投影在2维平面后的结果 由图10-4可以很明显的看出,对当前样本而言,s1平面比s2平面的最近重构性要好(样本离平面的距离更近);由图10-5可以很明显的看出,对当前样本而言,s1平面比 图10-6 PCA不是线性回归 分别基于上述两种目标的具体推导过程参见周志华老师的《机器学习》P230。 参考:《机器学习》  周志华

    1K80发布于 2018-03-13
  • 来自专栏Java技术圈子

    编译与优化

    上述3个处理过程里,执行插入式注解时又可能会产生新的符号,如果有新的符号产生,就必须转回到之前的解析、填充符号表的过程中重新处理这些新符号,从总体来看,三者之间的关系与交互顺 序如图10-4所示。 图10-4 Javac的编译过程[2] 我们可以把上述处理过程对应到代码中,Javac编译动作的入口是 com.sun.tools.javac.main.JavaCompiler类,上述3个过程的代码逻辑集中在这个类的 如果这些插件在处理注解期间对语法 树进行过修改,编译器将回到解析及填充符号表的过程重新处理,直到所有插入式注解处理器都没有 再对语法树进行修改为止,每一次循环过程称为一个轮次(Round),这也就对应着图10 本章小结 在本章中,我们从Javac编译器源码实现的层次上学习了Java源代码编译为字节码的过程,分析了 Java语言中泛型、主动装箱拆箱、条件编译等多种语法糖的前因后果,书中还有实战练习如何使用插入式注解处理器来完成一个检查程序命名规范的编译器插件

    66520编辑于 2023-02-28
  • 来自专栏新智元

    1780亿个参数,能识别25万个词条,这个语言模型的诞生只为挑战王者GPT-3?

    不仅可以写电邮、写文章、创建网站、甚至是生成用于Python深度学习的代码。 最近,一个名叫「侏罗纪」模型号称可以打败GPT-3。 究竟是谁这么有勇气,居然敢如此叫嚣? 不是侏罗纪公园的恐龙! 胆大,但有实力 在机器学习中,参数是模型的一部分,从历史训练数据中学来的。 一般来说,在语言领域,参数越多,模型就越复杂。 Jurassic-1 Jumbo这个模型包含了1780亿个参数。 优化程序方面,研究人员对J1-Large和J1-Jumbo分别使用了1.2×10-4和0.6×10-4学习率,以及200万和320万个token的批大小。 在小样本学习的测试上则各有输赢,不过平均得分两个模型持平。 在基准测试中,Jurassic-1回答学术和法律问题的表现已经能与GPT-3相当,甚至表现得更好。

    71330发布于 2021-08-25
  • 来自专栏机器学习算法与Python学习

    机器学习(8) -- 降维

    10-4给出了样本在3维空间的分布情况,其中图(2)是图(1)旋转调整后的结果。 图10-4 样本在3维正交空间的分布 ? 图10-5 样本投影在2维平面后的结果 由图10-4可以很明显的看出,对当前样本而言,s1平面比s2平面的最近重构性要好(样本离平面的距离更近);由图10-5可以很明显的看出,对当前样本而言,s1平面比 图10-6 PCA不是线性回归 分别基于上述两种目标的具体推导过程参见周志华老师的《机器学习》P230。 参考:《机器学习》 周志华

    1.1K100发布于 2018-04-04
  • 来自专栏IT技术圈(CSDN)

    浙大版《C语言程序设计(第3版)》题目集 习题10-4 递归求简单交错幂级数的部分和

    习题10-4 递归求简单交错幂级数的部分和 本题要求实现一个函数,计算下列简单交错幂级数的部分和: f(x,n)=x−x​2+x​3​​ −x​4+⋯+(−1)​n−1xn ​​ 函数接口定义: double

    1.5K10发布于 2020-09-15
  • 来自专栏CSDN技术头条

    实战Google深度学习框架:TensorFlow计算加速

    要将深度学习应用到实际问题中,一个非常大的问题在于训练深度学习模型需要的计算量太大。 图10-1展示了深度学习模型的训练流程图。深度学习模型的训练是一个迭代的过程。 图10-1 深度学习模型训练流程图 ? 图10-2 异步模式深度学习模型训练流程图 然而使用异步模式训练的深度学习模型有可能无法达到较优的训练结果。 图10-3 异步模式训练深度学习模型存在的问题示意图 ? 图10-4 同步模式深度学习模型训练流程图 为了避免更新不同步的问题,可以使用同步模式。 图10-4展示了同步模式的训练过程。从图10-4中可以看到,在每一轮迭代时,不同设备首先统一读取当前参数的取值,并随机获取一小部分数据。然后在不同设备上运行反向传播过程得到在各自训练数据上参数的梯度。

    1.5K80发布于 2018-02-12
  • 来自专栏化羽学Java

    Java实用类(五) -Math类和指定范围的随机数

    Math.random() * b )——>[a,a + b) //(int)(a + Math.random() * b )——[a,a + b) //4~9-->(int)(4 + Math.random() * (10 0; i < 20; i++) { int RandomNum = 0; //生成0~9的随机整数 RandomNum = (int)( 4+Math.random() * (10

    81220编辑于 2022-10-28
  • 来自专栏全栈程序员必看

    体验vSphere 6之7-为虚拟机启用容错

    图10-3 容错虚拟机所在主机 (4)在左侧选择另一个ESXi主机192.168.80.12,在”Virtual Machine”列表中可以看到正在运行的辅助虚拟机,如图10-4所示。 图10-4 辅助虚拟机运行截图 当ESXi主机内存是4GB、5GB时,尝试启动容错虚拟机,则会弹出”父资源池中可用内存资源不足”的提示,如图10-5所示。

    1.5K40编辑于 2021-12-23
  • 来自专栏生信菜鸟团

    文献导读(二):循环炎症细胞因子与五种癌症的风险:孟德尔随机分析

    上周是孟德尔随机化的实操,今天我们还是再回到文献中来学习学习—— 为什么选这个题? 用了什么方法? 得到什么样的结果和结论? 接下来就以方法学部分为主来进行一个学习的大动作—— 1孟德尔随机化,流程图必不可少 2如何选择细胞因子的工具变量 作者团队曾进行过一项研究:从北芬兰 1966 年出生队列(NFBC1966)、芬兰年轻人心血管风险研究 等人所描述的两种不同的顺式工具变量定义: a 顺式蛋白定量性状位点(cispQTL),涉及在相应基因位点上下游延伸 500 kb 范围内存在遗传变异的细胞因子,这些细胞因子与循环细胞因子浓度的相关性 p <1×10 -4,这就是我们的主要分析内容 b 顺式表达定量性状位点(cis-eQTL),选择相应基因位点上下游扩展 500 kb 范围内存在变异的细胞因子,这些变异与各组织的基因表达总量(p <1×10-4)和循环细胞因子浓度

    2.6K11编辑于 2023-09-09
  • 来自专栏杨建荣的学习笔记

    迁移到MySQL的架构演进(一)

    这是学习笔记的第 2010 篇文章 我们经过了一个相对漫长的周期把SQL Server业务迁移到了MySQL分布式架构,整个过程算是跌宕起伏。我来复现一下这个过程。 整体的系统现状梳理如下表10-4。 表10-4 数据业务与账单业务的对比 数据业务账单业务数据量400G+1024G+数据特点数据读写(插入,修改,查询)数据写入为主(插入,查询)数据属性事务性数据流水型数据数据保留周期物理备份保留周期

    90220发布于 2019-06-18
  • 来自专栏北京马哥教育

    实战Google深度学习框架:TensorFlow计算加速

    作者:才云科技Caicloud,郑泽宇,顾思宇 要将深度学习应用到实际问题中,一个非常大的问题在于训练深度学习模型需要的计算量太大。 02 深度学习训练并行模式 TensorFlow可以很容易地利用单个GPU加速深度学习模型的训练过程,但要利用更多的GPU或者机器,需要了解如何并行化地训练深度学习模型。 图10-1展示了深度学习模型的训练流程图。深度学习模型的训练是一个迭代的过程。 深度学习模型训练流程图 异步模式深度学习模型训练流程图 然而使用异步模式训练的深度学习模型有可能无法达到较优的训练结果。图10-3中给出了一个具体的样例来说明异步模式的问题。 图10-4展示了同步模式的训练过程。从图10-4中可以看到,在每一轮迭代时,不同设备首先统一读取当前参数的取值,并随机获取一小部分数据。然后在不同设备上运行反向传播过程得到在各自训练数据上参数的梯度。

    1.4K70发布于 2018-05-02
  • 来自专栏人工智能头条

    实战Google深度学习框架:TensorFlow计算加速

    作者:才云科技Caicloud,郑泽宇,顾思宇 要将深度学习应用到实际问题中,一个非常大的问题在于训练深度学习模型需要的计算量太大。 图10-1展示了深度学习模型的训练流程图。深度学习模型的训练是一个迭代的过程。 图10-1 深度学习模型训练流程图 ? 图10-2 异步模式深度学习模型训练流程图 然而使用异步模式训练的深度学习模型有可能无法达到较优的训练结果。 图10-3 异步模式训练深度学习模型存在的问题示意图 ? 图10-4 同步模式深度学习模型训练流程图 为了避免更新不同步的问题,可以使用同步模式。 图10-4展示了同步模式的训练过程。从图10-4中可以看到,在每一轮迭代时,不同设备首先统一读取当前参数的取值,并随机获取一小部分数据。然后在不同设备上运行反向传播过程得到在各自训练数据上参数的梯度。

    1.1K50发布于 2018-06-06
  • 来自专栏用户8928967的专栏

    第10章 手机响应式开发(上)

    带着问题去看书学习啦~ HTML5+CSS3+JavaScript Web 前端开发案例教程(慕课版)【不推荐】,微信读书中找到的学习Web前端书籍,第10章开始啦,耶(^-^)V 习题 10-1 简述什么是响应式网页设计及其优缺点 网格 浮动 定位 CSS 表格布局 多列布局 参考:https://developer.mozilla.org/zh-CN/docs/Learn/CSS/CSS_layout/Introduction 10 CSS3的Flex布局,而且只是为了示例,一笔带过的既视感,啊哈~~~ 我在怀疑,此书章节介绍Flex布局一些描述,是拷贝到了阮一峰网络日志滴~ 啊哈哈哈~ 上面有推荐文章,文章很好,排版也好,更易新手学习

    1K40发布于 2021-09-22
  • 来自专栏Hadoop数据仓库

    维度模型数据仓库(十五) —— 多重星型模式

    source.factory_master; COMMIT; 清单(五)- 10-2         使用Kettle转换初始装载工厂数据只需要一个表输入和一个表输出步骤即可,如图(五)- 10-2到图(五)- 10 图(五)- 10-2 图(五)- 10-3 图(五)- 10-4         工厂的信息很少改变,所以可能希望在一个CSV文件里提供任何关于工厂的最新信息。 执行清单(五)- 10-4里的脚本创建这个表。 product_code INT, production_date DATE, factory_code INT, production_quantity INT ); 清单(五)- 10

    65020编辑于 2022-12-02
  • 来自专栏华章科技

    干货请收好:终于有人把用户画像的流程、方法讲明白了

    标签体系 目前主流的标签体系都是层次化的,如下图10-4所示。首先标签分为几个大类,每个大类下进行逐层细分。在构建标签时,我们只需要构建最下层的标签,就能够映射到上面两级标签。 其中使用的技术方法主要是机器学习中的分类技术,常用的模型有LR、FM、SVM、GBDT等。 2. 至此我们就完成了对新闻内容从粗到细的“分类-主题-关键词”三层标签体系内容建模,新闻的三层标签如表10-4所示。 百万 ▲表10-4 三层标签体系 既然主题的准确率和覆盖率都不错,我们只使用主题不就可以了嘛? 本文摘编自《Spark机器学习进阶实战》,经出版方授权发布。

    5.6K61发布于 2018-12-10
  • 来自专栏全栈程序员必看

    干货请收好:终于有人把用户画像的流程、方法讲明白了「建议收藏」

    标签体系 目前主流的标签体系都是层次化的,如下图10-4所示。首先标签分为几个大类,每个大类下进行逐层细分。在构建标签时,我们只需要构建最下层的标签,就能够映射到上面两级标签。 其中使用的技术方法主要是机器学习中的分类技术,常用的模型有LR、FM、SVM、GBDT等。 2. 至此我们就完成了对新闻内容从粗到细的“分类-主题-关键词”三层标签体系内容建模,新闻的三层标签如表10-4所示。 量级 10-30 100-1000 百万 ▲表10-4 三层标签体系 既然主题的准确率和覆盖率都不错,我们只使用主题不就可以了嘛? 本文摘编自《Spark机器学习进阶实战》,经出版方授权发布。

    3.2K41编辑于 2022-09-05
领券