首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏ATYUN订阅号

    机器学习项目:使用Keras和tfjs构建血细胞分类模型

    血细胞数据集 数据集就像数据科学家的金矿一样,如果数据集可用于特定问题,它可以减少工程团队所需的大量工作,因为不需要开发其他东西来收集和存储数据。 数据集:https://www.kaggle.com/paultimothymooney/blood-cells 数据集结构:数据集包含12,500个血细胞增强图像。 血细胞数据集的类别 每个类包含3000个图像。该图显示了每个类的示例图像: ? 来自四个类的示例图像 我将每个图像的大小减小到(80x80x3),以便训练。 divide each input by its std zca_whitening=False, # apply ZCA whitening rotation_range=10

    1.9K30发布于 2018-09-26
  • 来自专栏云上修行

    DINOv3目标检测入门实战:基于血细胞分类的完整实现

    本文将详细介绍如何使用DINOv3进行目标检测任务,以血细胞分类为例,展示从数据准备到模型训练再到推理部署的完整流程。1. 概述目标:训练一个模型,可以输入一张血细胞图片,认出血细胞中的血小板、红细胞、白细胞并获得它们的位置。 4.1 完整训练脚本训练脚本 bccd_rf_train.py 的主要流程:参数解析和环境设置数据路径验证DINOv3模型加载特征提取(训练集和验证集)数据平衡处理随机森林训练模型评估模型和配置保存"""血细胞分类训练脚本 = 'cpu'def print_header(args: argparse.Namespace): """打印程序标题和配置信息""" print("="*80) print("血细胞分类训练 训练输出训练过程会输出详细的统计信息:================================================================================血细胞分类训练

    2.3K33编辑于 2025-10-23
  • 来自专栏程序员阿常

    10 种常见的BUG分类

    9、性能问题 1)页面加载慢,延迟超过3秒 2)占用CPU、内存的大小,内存泄漏 10、安全相关 1)IP和端口号要改为域名显示 2)SQL注入测试 3)服务器安全问题 阿常碎碎念: 以上原内容来自网络检索

    2K50编辑于 2022-12-07
  • 来自专栏单细胞天地

    血细胞的单细胞转录组图谱

    意义:提供了单细胞分辨率的人血细胞转录图谱,从而为探索生理和病理造血提供了全面的参考。 他们接着整合了所有造血细胞的单细胞转录组图谱,然后通过UMAP进行降维和可视化。 然而,在单细胞水平下lncRNAs在造血细胞中的表达谱尚未见报道。因此,他们基于lncRNA表达水平,构建一个包含7192个血细胞的转录图谱。 Atlas 总结 该研究借助单细胞转录组深度测序技术,覆盖了从造血干细胞到祖细胞再到各谱系成熟血细胞在内的32种类型的血细胞,绘制了人全血细胞的精细分子图谱。 总的来说,该研究图谱全面地整合了血细胞的转录组信息和免疫表型信息,为后续血液生理学和病理学研究提供了重要的血细胞注释依据和参考价值。

    1.3K20编辑于 2022-03-14
  • 来自专栏最新医学影像技术

    CBC2019——全血细胞自动识别计数 (CBC)

    今天将分享全血细胞自动识别计数 (CBC)完整实现版本,为了方便大家学习理解整个流程,将整个流程步骤进行了整理,并给出详细的步骤结果。感兴趣的朋友赶紧动手试一试吧。 一、CBC2019介绍 全血细胞 (CBC) 计数是医疗专业人员经常要求评估健康状况的重要测试。血液主要是三种细胞:红细胞(RBC)、白细胞(WBC)和血小板。 红细胞是最常见的血细胞类型,占血细胞的 40-45% 。血小板在血液中也大量存在。白细胞,仅占血细胞总数的 1%。红细胞将氧气输送到身体组织,组织接收的氧气量受到红细胞数量的影响。 由于这些血细胞数量巨大,使用血细胞计数板的传统手动血细胞计数系统非常耗时且容易出错,并且大多数情况下的准确性在很大程度上取决于临床实验室分析人员的技能。 三、CBC2019数据集 全血细胞计数 (CBC) 数据集包含360个血涂片图像及其注释文件,分为训练集、测试集和验证集。

    49110编辑于 2024-03-02
  • 来自专栏月亮与二进制

    从cifar10分类入门深度学习图像分类(Keras)

    引 之前需要做一个图像分类模型,因为刚入门,拿cifar10数据集练了下手,试了几种优化方案和不同的模型效果,这里就统一总结一下这段学习经历。 cifar10是是一个图像数据集(官网),包含10种类别的32*32大小的图像共60000张。另外还有cifar100,包含100种类别的更多图像。因此,cifar10分类就是一个图像多分类任务。 因此,本文要说的就是使用Keras框架来开发多种模型和优化方法去训练一个基于cifar10数据集的图像多分类模型。 最后就是接上输出层了,这层的神经元数量我们用分类数来表示,在cifar10中就是10类,最后的激活函数我们用softmax,这个函数适合多分类任务,sigmoid适合二分类任务。 完整的代码可以看我的github 结 以上,就是用Keras实验各种模型和优化方法来训练cifar10图像分类了,我认为这是一个很好的入手深度学习图像分类的案例,而Keras也是一个很好上手的框架,在这段学习过程中我受益良多

    1.8K10发布于 2021-11-23
  • 来自专栏机器学习AI算法工程

    keras实战项目——CIFAR-10 图像分类

    如果是进行百万张图片的分类,每个图片都有数以百万计的特征,我们将拿到一个 百万样本 x 百万特征 的巨型矩阵。传统的机器学习方法拿到这个矩阵时,受限于计算机内存大小的限制,通常是无从下手的。 实战项目——CIFAR-10 图像分类 最后我们用一个keras 中的示例, 本文源码地址: 关注微信公众号datayx 然后回复“图像分类”即可获取。 首先做一些前期准备: ?

    91710发布于 2019-10-28
  • 来自专栏yw的数据分析

    10X单细胞测序细胞分类

    介绍 文章对已知的多种细胞系混合后进行单细胞10X RNA测序,研究多克隆之间的互作模式。我们这里介绍里面的单细胞测序基因表达细胞分类操作。 不过文章选用的是已知固有SNP进行分类,基因表达分类用于和SNP分类进行比较。 = 'pca', dims = 1:n_pcs, k.param = 10 FindClusters(seuObj, resolution = clust_res, verbose = FALSE) 原文出处 http://www.thecodesearch.com/2021/02/04/10x 单细胞测序细胞分类/

    67410发布于 2021-02-22
  • 来自专栏机器学习/数据可视化

    机器学习分类模型10大评价指标

    公众号:尤而小屋作者:Peter编辑:Peter大家好,我是Peter~机器学习分类模型的评价指标是在衡量模型在未知数据集上的性能表现,通常基于混淆矩阵和相关的评价指标。 最近建立了一个分类模型,在选择评价指标的时候进行了对比不同指标之间,同时也查阅了很多的资料和博客,发现了一个问题:Accuracy是准确率,Precision是精确率;还是说反过来? 于是我问了ChatGPT:机器学习分类模型中哪个代表准确度,accuracy 还是Precision? 下面小编就从混淆矩阵开始,给大家详细介绍下机器学习分类模型中的多个评价指标。混淆矩阵Confusion Matrix开局一张图:图片其中,Pos代表Positive,Neg代表Negative。 ROC曲线越是接近左上角,表示分类器的性能越好,其真阳性率和假阳性率之间的平衡越好;如果AUC值接近0.5,则表示分类器的性能较差。

    1.5K10编辑于 2023-10-13
  • 来自专栏Deep learning进阶路

    pytorch进行CIFAR-10分类(4)训练

    经过前面的数据加载和网络定义后,就可以开始训练了,这里会看到前面遇到的一些东西究竟在后面会有什么用,所以这一步希望各位也能仔细研究一下

    82910发布于 2019-05-25
  • 来自专栏自学笔记

    基于SVM的思想做CIFAR-10图像分类

    之前讲SVM的算法:https://www.jianshu.com/p/8fd28df734a0 线性分类 线性SVM就是一种线性分类的方法。输入 ? ,输出 ? ,每一个样本的权重是 ? 得到的结果很明显是dog分数最大,cat的分数最低,但是图片很明显是猫,什么分类器是错误的。 一般来说习惯会把w和b合并了,x加上一个全为1的列,于是有 ? ? 所以正确的分类score应该是要大于其他的分类score一个阈值: ? ? 就是正确分类的分数, ? 就是其他分类的分数。所以,这个损失函数就是: ? 代码实现 首先是对CIFAR10的数据读取: def load_pickle(f): version = platform.python_version_tuple() if version /Data/cifar-10-batches-py' x_train, y_train, x_test, y_test = loadCIFAR10(cifar10_name) X_val

    1.8K30发布于 2018-09-07
  • 骨折分类数据集1129张10类别

    数据集类型:图像分类用,不可用于目标检测无标注文件 数据集格式:仅仅包含jpg图片,每个类别文件夹下面存放着对应图片 图片数量(jpg文件个数):1129 分类类别数:10 类别名称:["avulsion_fracture

    13200编辑于 2025-07-20
  • 基于yolov8的血细胞检测计数系统python源码+onnx模型+评估指标曲线+精美GUI界面

    【算法介绍】 基于YOLOv8的血细胞检测与计数系统是一种利用深度学习技术,特别是YOLOv8目标检测算法,实现高效、准确血细胞识别的系统。 该系统能够自动识别并计数图像或视频中的血细胞,包括红细胞、白细胞和血小板等,为医疗诊断提供重要支持。 YOLOv8以其高速和高精度的目标检测能力著称,适用于实时目标检测应用。 该系统通过收集并预处理包含各种血细胞类型的图像或视频数据,利用YOLOv8算法进行模型训练,从而学习血细胞的特征和分类信息。 在实时检测阶段,系统能够快速接收并处理图像或视频输入,准确识别并计数血细胞,生成详细的统计报告。 该系统不仅提高了血细胞检测的自动化程度和准确性,还减少了人为误差,大大减轻了医护人员的工作负担。 【效果介绍】 【测试环境】 windows10 anaconda3+python3.8 torch==1.9.0+cu111 ultralytics==8.2.70 【模型可以检测出类别】 Platelets

    21710编辑于 2025-07-16
  • 来自专栏自学笔记

    基于SVM的思想做CIFAR-10图像分类

    之前讲SVM的算法:https://www.jianshu.com/p/8fd28df734a0 线性分类 线性SVM就是一种线性分类的方法。输入 ? ,输出 ? ,每一个样本的权重是 ? 得到的结果很明显是dog分数最大,cat的分数最低,但是图片很明显是猫,什么分类器是错误的。 一般来说习惯会把w和b合并了,x加上一个全为1的列,于是有 ? ? 所以正确的分类score应该是要大于其他的分类score一个阈值: ? ? 就是正确分类的分数, ? 就是其他分类的分数。所以,这个损失函数就是: ? 代码实现 首先是对CIFAR10的数据读取: def load_pickle(f): version = platform.python_version_tuple() if version /Data/cifar-10-batches-py' x_train, y_train, x_test, y_test = loadCIFAR10(cifar10_name) X_val

    76420发布于 2019-01-23
  • 来自专栏红色石头的机器学习之路

    基于线性SVM的CIFAR-10图像集分类

    那么本文就将带领大家动手写出自己的SVM程序,并且应用到图像的分类问题中。我们将在经典的CIFAR10图像数据集上进行SVM程序验证。 话不多说,正式开始! 1. 以二维平面为例,确定一条直线对正负样本进行分类,如下图所示: ? 很明显,虽然分类线H1、H2、H3都能够将正负样本完全分开,但是毫无疑问H3更好一些。 这就是SVM的基本思想:尽量让所有样本距离分类超平面越远越好。 2. 线性分类与得分函数 在线性分类器算法中,输入为x,输出为y,令权重系数为W,常数项系数为b。 所以说,Δ=1Δ=1\Delta=1 或 Δ=10Δ=10\Delta=10,实际上没有差别,对W的伸缩完全可以抵消掉 ΔΔ\Delta 的数值影响。因此,通常把 ΔΔ\Delta 设置为1即可。 线性SVM实战 首先,简单介绍一下我们将要用到的经典数据集:CIFAR-10。 CIFAR-10数据集由60000张3×32×32的 RGB 彩色图片构成,共10分类

    1.8K20发布于 2019-05-25
  • 血细胞检测数据集VOC+YOLO格式2757张4类别

    数据集格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):2757 标注数量(xml文件个数):2757 标注数量(txt文件个数):2757 标注类别数:4 标注类别名称:["Platelets","RBC","WBC","sickle cell"] 每个类别标注的框数: Platelets 框数 = 2235 RBC 框数 = 39206 WBC 框数 = 2285 sickle cell 框数 = 2417 总框数:46143 使用标注工具:labelImg 标注规则:对类别进行画矩形框 重要说明:暂无 特别声明:本数据集不对训练的模型或者权重文件精度作任何保证,数据集只提供准确且合理标注

    31610编辑于 2025-07-16
  • 来自专栏python与大数据分析

    基于Pytorch构建AlexNet网络对cifar-10进行分类

    (10).全连接层1+ReLU+Dropout:有4096个神经元,训练参数(6*6*256)*4096=37748736。 dataset_train = CIFAR10(root='. /data', train=True, download=True, transform=transformers) dataset_test = CIFAR10(root='. optimizer.zero_grad() # 保存训练结果 outputs = model(inputs).to(device) # 计算损失和 # 多分类情况通常使用 cross_entropy(交叉熵损失函数), 而对于二分类问题, 通常使用sigmod loss = F.cross_entropy(outputs, labels) # 获取最大概率的预测结果

    1K10编辑于 2023-09-03
  • 来自专栏python与大数据分析

    基于Pytorch构建GoogLeNet网络对cifar-10进行分类

    3、添加两个辅助分类器帮助训练 避免梯度消失,用于向前传导梯度,也有一定的正则化效果,防止过拟合。 图片 具体代码如下,因为里面的层数太多,所以在此就不做推算了: classGoogLeNet(nn.Module): def __init__(self, num_classes=10

    78810编辑于 2023-09-03
  • 来自专栏python与大数据分析

    基于Pytorch构建LeNet网络对cifar-10进行分类

    通过卷积、池化等操作进行特征提取,最后利用全连接实现分类识别。 LeNet5包含 3 个卷积层,2 个池化层,1 个全连接层。 下面是他的网络结构示意图: CIFAR-10数据集由10个类别的60000张32x32彩色图像组成,每个类别有6000张图像。有50000个训练图像和10000个测试图像。 # 输出为:16* 10* 10= 4704 self.maxpool2 = nn.MaxPool2d(2, 2) # output_size = 10/ 2= 5 # optimizer.zero_grad() # 保存训练结果 outputs = model(inputs).to(device) # 计算损失和 # 多分类情况通常使用 cross_entropy(交叉熵损失函数), 而对于二分类问题, 通常使用sigmod loss = F.cross_entropy(outputs, labels) # 获取最大概率的预测结果

    77910编辑于 2023-09-03
  • 来自专栏python与大数据分析

    基于Pytorch构建ResNet网络对cifar-10进行分类

    out # ResNet定义 classResNet(nn.Module): def __init__(self, block, layers, num_classes=10 avg_pool): AvgPool2d(kernel_size=3, stride=1, padding=1) (fc): Linear(in_features=2048, out_features=10

    1K30编辑于 2023-09-03
领券