首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏杀马特

    颜色分类问题

    思路: 创建两个指针分别找0和2并完成就位操作,利用遍历数组找到2可以缩小遍历右界的遍历范围,

    13000编辑于 2025-01-23
  • 来自专栏互联网大杂烩

    分类问题数据挖掘之分类模型

    ---- ---- 聚类分析 聚类分析是一种无监督的分类方法,即不预先指定类别。 根据分类对象不同,聚类分析可以分为样本聚类(Q型)和变量聚类(R型)。 并且距离分类准则和距离计算方法都有多种,可以依据具体情形选择。 适用范围:属于智能聚类方法,用于解决海量数据或者具有复杂类别结构的聚类分析问题。可以同时处理离散和连续变量,自动选择聚类数,可以处理超大样本量的数据。 ---- 模糊聚类分析 采用模糊数学语言对事物按一定的要求进行描述和分类的数学方法称为模糊聚类分析。 ---- ---- 神经网络分类方法 神经网络分类算法的重点是构造阈值逻辑单元。一个阈值逻辑单元是一个对象,可以输入一组加权系数的量,对它们进行求和。如果这个和达到或者超过了某个阈值,则输出一个量。

    1.4K20发布于 2018-08-22
  • 来自专栏深度学习框架

    stack overflow 问题分类

    本教程的目的是带领大家学会如何给 stack overflow 上的问题进行打标签 首先我们需要导入要用到的函数库 import matplotlib.pyplot as plt import os import

    98620发布于 2021-07-28
  • 来自专栏图灵技术域

    机器学习多分类问题转二分类问题

    什么是多分类问题? 简单地说就是在监督学习下样本实例的标签有多个,而我们很多问题是二分类分体(正确,错误或者是0,1问题)。 通常情况是将多分类转化为二分类问题。 ? ---- 多分类问题转化为二分类问题 很简单,一个简单的思想就是分主次,采取投票机制。 转化的方式有两种,因为分类问题最终需要训练产生一个分类器,产生这个分类器靠的是训练样本,前面的二分类问题实际上就是产生了一个分类器,而多分类问题根据训练集产生的可不止是一个分类器,而是多个分类器。 像上面的5类,我把最中间的一类当成是第一类,并重新赋予类标签为1,而把四周的四类都认为是第二类,并重新赋予类标签维-1,好了现在的问题是不是就是二分类问题了?是的。 ---- 第二种分类方式 ,思想类似,也是转化为二分类问题,不过实现上不同。

    3.8K40发布于 2021-05-21
  • 来自专栏优化

    最优化问题及其分类

    归纳而言,最优化问题分为函数优化问题和组合优化问题两大类,其中函数优化的对象是一定区间的连续变量,而组合优化的对象则是解空间中的离散状态。 为所有状态构成的解空间, C(si)C(si)为状态 sisi对应的目标函数值,要求寻找最优解 s∗s∗,使得 ∀si∈Ω,C(s∗)=minC(si)∀si∈Ω,C(s∗)=minC(si).组合优化往往涉及排序、分类 image.png (2)加工调度问题 Job-shop问题是一类较TSP更为复杂的典型加工调度问题,是许多实际问题的简化模型。 因此,解决这些问题的关键在于寻求有效的优化算法。 (3)优化算法及其分类 所谓优化算法,其实就是一种搜索过程或规则,它是基于某种思想和机制,通过一定的途径或规则来得到满足用户要求的问题的解。 优化算法当然还可以从别的角度进行分类,如确定性算法和不确定性算法,局部优化算法和全局优化算法等。

    2.4K10编辑于 2022-06-01
  • 来自专栏火星娃统计

    深度学习-多分类问题

    深度学习-多分类问题 概述 数据来自路透社数据集,为kersa库自带的数据,包含不同的主题,每个主题最少有10个样本 代码 #导入数据 from keras.datasets import reuters model.add(layers.Dense(64, activation='relu'))# 增加节点 model.add(layers.Dense(46, activation='softmax'))# 最终的分类为 46类 # 添加模型参数 model.compile(optimizer='rmsprop',# 模型优化器 loss='categorical_crossentropy',#损失函数为分类交叉熵 (46,) 什么是one-hot编码 问题 最近做这几个项目,一直有这个东西萦绕在我的脑海,久久不能释怀,主要是书里的代码写的太复杂,影响到了理解,其实one-hot就是一开始学习统计分析对分类变量的哑变量设置 按道理神经网络可以处理这样的因子类型,并不需要这样处理,后来明白了,如果将分类变量放入一列,那么对于其他变量就整合了(类似于长数据),在训练神经网络的过程中,这种整合的运算会有可能对数据加权求均值,那么这样的运算就会丢失分类的信息

    88920发布于 2020-09-15
  • 来自专栏鸿的学习笔记

    分类问题中维度诅咒(上)

    这个问题的答案听起来有点反直觉:不,我们不能!事实上,在某一点之后,通过添加新特征来增加问题的维度实际上会降低我们的分类器的性能。这由图1示出,并且通常被称为“维度的诅咒”。 ? 分类的最终目标是训练基于这10个训练实例的分类器,能够正确地分类无限数量的狗和猫,这些我们没有任何信息的实例。现在让我们使用一个简单的线性分类器,并尝试获得完美的分类。 这似乎暗示增加特征的数量直到获得完美的分类结果是训练分类器的最佳方式,而在图1所示的引言中,我们认为这种情况不行。但是,请注意,当我们增加问题的维数时,训练样本的密度是如何呈指数下降。 然而,如果我们将高维分类结果投影回较低维的空间,则与该方法相关联的问题的严重性变得更明显: ? Figure 7. 虽然图7所示的具有决策边界的简单线性分类器看起来比图5中的非线性分类器更差,但是这种简单分类器更好地泛化了不可见的数据,因为它没有学习仅在我们的训练数据中的特定异常。

    1.4K20发布于 2018-08-06
  • 来自专栏机器学习/数据可视化

    TF-char3-分类问题

    Char3-分类问题 在人工智能上花一年时间,这足以让人相信上帝的存在————艾伦\cdot佩利 分类问题典型的应用就是教会机器如何去自动识别图片中物体的种类。 in R^{10} 真实标签y经过one-hot变成长度为10的稀疏向量y\in {0,1}^{10} 多输入和多输出的线性预测模型是o=W^Tx+b,希望其更接近真实标签y 误差计算 对于分类问题 存在的问题: 欠拟合(左图):线性模型,表达能力差 过拟合(右图):模型过于复杂,表达能力过强,伤害模型的泛化能力 2.

    93310发布于 2021-03-02
  • 来自专栏数据科学与人工智能

    【应用】信用评分卡:分类问题

    2 如何解决分类问题? 3 信用评分卡和分类问题的关系? 统计与数据挖掘中的分类问题 我必须说,当三岁以上的女孩Amishi宣布,她只是与我妻子的朋友而不是我交往时,我感到震惊。 大自然为我们提供了一个内置的方程式,通过高度的精确性来进行性别分类。 想象一下类似的机制来区分好的和坏的借款人。 你在谈论每个银行家的梦想。 正如我在前面的文章中提到的,记分卡在统计和数据挖掘的分类问题上有其根源。 大多数分类问题的想法是创建一个数学方程来区分二元变量。 由于海洋的盐度相当稳定,几滴水足以回答第一个问题。另一方面,第二个问题是黑天鹅问题。你可能需要访问每一颗行星来统治我们的智能生命形式的可能性。 注意 在下一篇文章中,我们将讨论信用评分卡的变量分类和粗分类的一个重要主题。 下回见。

    76610发布于 2018-10-08
  • 来自专栏阿泽的学习笔记

    GBDT 如何用于分类问题

    但越简单的东西越容易出现知识盲区,仔细想一下好像确实有点疑问:GBDT 用的是回归树,是如何做的分类呢? GBDT 通过多轮迭代,每轮迭代产生一个弱分类器,每个分类器在上一轮分类器的残差基础上进行训练。对弱分类器的要求一般是足够简单,并且是低方差和高偏差的。 因为训练的过程是通过降低偏差来不断提高最终分类器的精度。 二 GBDT如何用于分类的 第一步:「训练的时候,是针对样本 X 每个可能的类都训练一个分类回归树」。 GBDT 多分类的过程 ? 生成的过程其实非常简单,问题 是哪个特征最合适? 是这个特征的什么特征值作为切分点? 即使我们已经确定了花萼长度做为节点。花萼长度本身也有很多值。

    1.9K20发布于 2020-12-24
  • 来自专栏AI

    监督学习与分类问题

    无监督学习与聚类问题:K-Means、PCA等无监督学习是一种机器学习类型,它在没有标签数据的情况下从数据中学习结构和模式。 本文将详细介绍无监督学习中的聚类问题,并深入讲解常见的聚类算法:K-Means和主成分分析(PCA)。1. 聚类问题:K-Means算法聚类是无监督学习中最重要的任务之一,它试图将数据集中的对象根据相似性进行分组。

    46510编辑于 2025-01-16
  • 来自专栏AI机器学习与深度学习算法

    学习分类 2-1 设置问题

    设置问题 图片 作为引入分类问题的例子,这里不去考虑图像本身的内容,只是根据图像的尺寸将它分类为纵向图像和横向图像。 下图尺寸的图像会被分类成纵向图像。 下图尺寸的图像会被分类成横向图像。 图片 这里使用白色和黑色两种样式的点来区分类别,白色的点是纵向图像,黑色的点是横向图像。不过,只有两个训练数据确实太小了,需要再增加一些数据。 如下所示是上面六组数据的散点图。 分类的目的就是找到这条直线。如果找到这条线,就可以根据点在线的哪一边来判断图像是横向还是纵向的。 References: 1.《白话机器学习的数学》

    41830编辑于 2022-11-08
  • 来自专栏用户画像

    Tensorflow解决MNIST手写数字分类问题

    官网:https://www.tensorflow.org/tutorials/layers

    71020发布于 2019-02-22
  • 来自专栏数据派THU

    将时间序列转换为分类问题

    在此背景下,比较了分类算法 XGBoost、随机森林和逻辑分类器。文章的另外一个重点是数据准备。我们必须如何转换数据以便模型可以处理它。 ,可以将问题定义如下: 预测股票代码 AAPL 的股价第二天会上涨还是下跌。 然后就是应该考虑手头有什么样的机器学习模型的问题。我们想预测第二天股票是上涨还是下跌。所以这是一个分类问题(1:股票第二天上涨或 0:股票第二天下跌)。在分类问题中,我们预测一个类别。 它属于树提升算法,将许多弱树分类器依次连接。 总结 我们这篇文章的主要目的是介绍如何将股票价格的时间序列转换为分类问题,并且演示如何在数据处理时使用窗口函数将时间序列转换为一个序列,至于模型并没有太多的进行调优,所以对于效果评估来说越简单的模型表现得就越好

    1.2K10编辑于 2023-05-11
  • 来自专栏生物信息学、python、R、linux

    逻辑回归中的多分类问题

    一般情况下解决多分类问题有如下两种方式: 1)OvR (One vs Rest) 每次将某个与剩下的所有的分类,n个类别进行n次分类,选择分类得分最高的。 2). OvO (One vs One) 两两组合,比如四个类别有六个组,选择赢数最高的分类

    85930发布于 2020-11-12
  • 来自专栏鸿的学习笔记

    分类问题中的维度诅咒(下)

    一个有趣的问题是,当我们增加特征空间的维度时,圆(超球面)的体积相对于正方形(超立方体)的体积如何变化。维度d的单位超立方体的体积总是1 ^ d = 1。 这种令人惊讶且违背直觉的观察部分地解释了与分类中的维度的诅咒相关联的问题:在高维空间中,大多数训练数据驻留在限定特征空间的超立方体的角落中。 如何避免维度的诅咒 图1表明,当问题的维数变得太大时,分类器的性能会降低。那么“太大”这个意味着什么呢,以及如何避免过拟合。遗憾的是,没有固定的规则来定义在分类问题中应该使用多少个特征。 分类器方差的增加对应于过拟合。 另一个有趣的问题是应该使用哪些特征。给定一组N个特征;我们如何选择M个特征的最佳子集,使得M <N?一种方法是在图1所示的曲线中搜索最优。 试图找到原始特征的最佳线性或非线性组合以减少最终问题的维度的算法被称为特征提取方法。产生原始N个特征的不相关的线性组合的公知的维数降低技术是主成分分析(PCA)。

    1.6K10发布于 2018-08-06
  • 来自专栏翻译scikit-learn Cookbook

    Generalizing with multiclass classification多分类问题简单介绍

    在这部分,我们学习多分类问题,根据你算法的选择,你既可以自由的得到一个多分类算法,或者你得定义一个比较的模型。 首先,我们通过一个粗略的决策树模型的例子来拟合一个多分类数据集,像我们之前讨论的一样,我们将很自由的使用几个分类器来实现多分类,所以我们只要拟合这个例子来证明它能工作就行,然后继续。 We'll also import LogisticRegression while we're at it: 如我们所见,我们能够使用最小的影响来拟合分类器,现在,让我们继续多分类分类器的例子。 好了,所以现在我们已经设置好一个一对多的结构,所有要做的是就是评估数据点与分类器的相似性。我们将用数据点的最大相似性来标记分类。 如我们所见,第二个分类器(索引为1)有更高的赞同的相似性,因此,我们给这个点标注1.

    73220发布于 2019-12-02
  • 来自专栏讲编程的高老师

    神经网络中的多分类问题

    本小节学习的是多个类别分类问题,上一个小节最后是手写数字的识别,其实这就是一个比较典型的多分类问题,将采集到的手写数字图片识别为0-9中的一个。 看下面这个图: ? 这就需要对图像也进行处理,一个图对应抽取出一个输入向量,就是用一个向量来表示这一个图,而这个图是四个分类中的哪一个我们事先是知道的。 然后这些东西就是training set. 如下图所示: ? 我们用这个建成的网络就可以进行图像的分类了。

    85640发布于 2020-09-10
  • 来自专栏图灵技术域

    TensorFlow实现简单神经网络分类问题

    下面给出一个简单的二分类问题的神经网络算法(完整的流程) 神经网络具体结构如下图: ? 训练流程图: ? 几个解释: ①Numpy 是一个科学计算的工具箱的,这里通过Numpy生成模拟数据集。

    1.3K20发布于 2021-05-21
  • 来自专栏AI科技时讯

    分类问题的评估指标一览

    前言 最近分类问题搞的有点多,但对一些指标依旧有模糊的地方(虽然做了笔记), 事实证明, 笔记笔记,没有进到脑子里呀。 四、F1-Score F1-Score 能够很好的评估模型,其主要用于二分类问题, 计算如下: ? 而 更一般的有 ? : ? 其实, ? 对于一个多分类问题,假设,对于分类 ? 而言有: ? , 那么各种 F1 的值计算如下。 ,考虑到实际的环境中,真实样本分布和训练样本分布相同的情况下,这种指标明显是有问题的, 小类别起到的作用太大,以至于大样本的分类情况不佳。 九、最后 对于最终分类指标的选择, 在不同数据集,不同场景,不同时间下都会有不同的选择,但往往最好选出一个指标来做优化,对于二分类问题,我目前用 AUC 比较多一些, 多分类我还是看 F1 值。

    1K30发布于 2020-09-10
领券