首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏Hank’s Blog

    4-6 R语言函数 排序

    #sort:对向量进行排序;返回排好序的内容 #order:返回排好序的内容的下标/多个排序标准 > x <- data.frame(v1=1:5,v2=c(10,7,9,6,8),v3=11:15,v4=c(1,1,2,2,1)) > sort(x$v2) [1] 6 7 8 9 10 > sort(x$v2,decreasing = TRUE) [1] 10 9 8 7 6 > order(x$v2) [1] 4 2 5 3 1 > x[order(x$v2),] v1 v

    40040发布于 2020-09-16
  • 来自专栏yuyy.info技术专栏

    《代码整洁之道》笔记(4-6章节)

    个人认为注释还是要写,算是对代码的中文翻译,因为我们的英语水平,命名习惯各不相同。

    32710编辑于 2022-06-28
  • 来自专栏量子位

    支持移动GPU、推断速度提升4-6

    TensorFlow用于移动设备的框架TensorFlow Lite发布重大更新,支持开发者使用手机等移动设备的GPU来提高模型推断速度。

    1.1K30发布于 2019-04-24
  • 来自专栏人人都是极客

    支持移动GPU、推断速度提升4-6

    随着 TensorFlow Lite GPU 后端开发者预览版的发布,将能够利用移动 GPU 来选择模型训练 (如下所示),对于不支持的部分,将自动使用 CPU 进行推理。

    1.7K20发布于 2019-03-15
  • 来自专栏yuyy.info技术专栏

    《Go语言精进之路:从新手到高手的编程思想、方法和技巧1》4-6章笔记

    醍醐灌顶到没有,别扭确实存在。当然这需要一段时间来适应,说下这段时间最难接受的点吧。 1、文件的单一职责做不好,一个文件里有多个结构体,想知道某个结构体有哪些方法,需要借助IDE 2、命名使用单字母,特定场景能理解,例如循环里的i,遍历map的k,v,但是很多单字母不是这种常见场景里的。代码整洁之道里说命名要见名知意,宁愿用长命名也不用无法表达清楚的短命名,这点go背道而驰。此书里说有时需要短命名加注释,而代码整洁之道里说注释就不应该存在,如果要用注释,说明写的代码无法准确清晰的表达意思。

    1.2K20编辑于 2022-09-21
  • 来自专栏AI机器学习与深度学习算法

    机器学习入门 4-6 网格搜索与k近邻算法中更多超参数

    kNN更多距离定义 定义训练集中的数据点与新的数据点之间的距离,默认使用的是明科夫斯基距离,对应的p = 2,也就是欧拉距离的定义,当然kNN中还有其他距离可以使用: ?

    83700发布于 2019-11-13
  • 来自专栏人工智能与演化计算成长与进阶

    15非监督学习异常检测4-6构建与评价异常检测系统

    当我们开发一个异常检测系统时,我们从带标记(异常或正常)的数据着手,我们从其中选择一部分正常数据用于构建训练集,然后用剩下的正常数据和异常数据混合的数据构成交叉检验集和测试集。 我们这样分配数据: 6000 台正常引擎的数据作为训练集 2000 台正常引擎和 10 台异常引擎的数据作为交叉检验集 2000 台正常引擎和 10 台异常引擎的数据作为测试集 测评方法 根据 训练集 异常检测监督学习只有很少量的异常数据(通常只有 20-50 个样本的数据)即 y=1,而有大量的正常数据 y=0同时拥有大量的异常是数据和正常数据有许多不同种类的异常非常难使用少量的正向类数据来训练算法有足够多的正向类实例 ,足够用于训练算法,未来遇到的异常实例与训练集中的异常实例会非常近似未来遇到的异常可能与只掌握的异常非常的不同 例如例如1.欺诈行为检测1.邮件过滤器2.生产质量评估2.天气预报3.检测数据中心的计算机的运行状况

    1.8K11发布于 2020-08-14
  • 来自专栏desperate633

    4-6课 数据的过滤where子句操作符使用通配符进行过滤

    实际查询中,通常不会检索所有行,需要对数据进行筛选过滤,选出符合我们需要条件的数据。

    2.3K10发布于 2018-08-22
  • 来自专栏全栈程序员必看

    训练模型还要训练吗_多模态预训练模型

    若使用已保存好的镜像reid_mgn:v1,在本机上可按如下操作训练 # 1.进入已保存环境的镜像(reid_mgn:v1(8.48G)、pytorch/pytorch:1.0.1-cuda10.0 personReID ufoym/deepo:testv1 /bin/bash (75服务器) # 2.进入到工程目录 cd /home/personReID/MGN-pytorch-master # 3.复制预训练模型到指定路径 打开另一个终端 docker ps 查看容器内镜像(找到reid_mgn:v1 前对应的数字字符串%%%%) docker stats %%%%% 实时监测内存情况 # 4.训练 (在原终端继续进行,注:demo.sh是已改好参数的) sh demo1.sh 补充: 训练前需要修改的文件及代码 1.demo.sh文件 修改data路径(把你的数据集路径添加到 –datadir)、 :需将数据集文件名由原始的Market-1501-****改为和代码匹配的Market1501 2.trainer.py 修改train、test中的epoch 3.main.py 如果是单GPU训练

    1K20编辑于 2022-11-08
  • 来自专栏IT技术圈(CSDN)

    浙大版《C语言程序设计(第3版)》题目集 练习4-6 猜数字游戏

    练习4-6 猜数字游戏 猜数字游戏是令游戏机随机产生一个100以内的正整数,用户输入一个数对其进行猜测,需要你编写程序自动对其与随机产生的被猜数进行比较,并提示大了(“Too big”),还是小了(“Too

    1.2K20发布于 2020-09-15
  • 来自专栏学习之路

    【算法训练】:贪心(算法 & 题目训练

    在对问题求解时,总是做出在当前看来是最好的选择。也就是说,不从整体最优上加以考虑,他所做出的仅是在某种意义上的局部最优解。贪心算法不是对所有问题都能得到整体最优解,但对范围相当广泛的许多问题他能产生整体最优解或者是整体最优解的近似解。

    37710编辑于 2024-10-22
  • 来自专栏人工智能前沿讲习

    ICLR2019 | 表示形式语言:比较有限自动机和循环神经网络

    在实验过程中,我们首先选择一个自动机,并随机生成一组符合该自动机的正负样本序列,然后将样本数据喂给RNN进行训练。 最后将训练得到的RNN的隐层状态与自动机状态进行对比,分析两种状态间是否存在某种映射关系。 我们一共选择了大约500个自动机进行实验,结果显示这种映射关系确实存在。 图1展示了用正则语言[(([4-6]{2}[4-6]+)?)3[4-6]+]生成的样本训练得到的RNN网络的t-SNE嵌入。虽然,右侧的MDFA包含6个状态,我们发现左侧的RNN状态呈现出5个点簇。 图1:右侧是刻画正则语言[(([4-6]{2}[4-6]+)?)3[4-6]+]的自动机,左侧是对应的RNN的隐层状态空间可视化的结果。该图用不同的颜色区分DFA状态。 训练得到的RNN将DFA中的状态1(绿色)和状态2(蓝色)合并为一个状态。状态1和状态2均可独立地表示[4-6]*。 一个自动机M的抽象A也是一个自动机,其状态是由M的状态聚类生成的超状态。

    1.2K10发布于 2020-05-13
  • 来自专栏IT技术圈(CSDN)

    浙大版《C语言程序设计(第3版)》题目集 习题4-6 水仙花数

    习题4-6 水仙花数 水仙花数是指一个N位正整数(N≥3),它的每个位上的数字的N次幂之和等于它本身。例如:153=13+53+33。 本题要求编写程序,计算所有N位水仙花数。

    93440发布于 2020-09-15
  • 来自专栏用户2442861的专栏

    Tesseract:训练

    资源文件的训练 如果刚才按照建议进行过了尝试,应该能发现哪些是必要的文件,它们是: unicharset inttemp pffmtable normproto shapetable 训练的过程就是为了从训练数据中产生这些东西 数据准备 首先要准备好训练用的文本数据,根据不同的应用场景,对文本数据的要求会不一样。 项目网站上说到,每个字在训练用的数据文件中一般应该有 10 个样本,低频字也至少要有 5 个,高频的应该在 20 个以上。 不过就我目前进行的中文训练情况来看,每个字一个样本得到的结果也没有明显的差异,读者可以自行试验。 图像与BOX文件生成 有了数据文件后,我们需要用这些数据文件中的文字来生成图像,用这些图像去进行训练

    2.2K10发布于 2018-09-19
  • 来自专栏全栈程序员必看

    对抗训练

    对抗训练 对抗训练是防御对抗样本攻击的一种方法。将对抗样本和正常样本一起训练是一种有效的正则化,可以提高模型的准确度,同时也能有效降低对抗样本的攻击成功率。 不过这种防御也只是针对同样用来产生训练集中的对抗样本的方法。 探索网络对底层任务的理解层次,通过对抗训练减少原有独立同分布的测试集的错误率——在对抗扰动的训练集上训练网络 对抗样本的定义和产生 从2013年开始,深度学习模型在多种应用上已经能达到甚至超过人类水平

    1.1K30编辑于 2022-09-20
  • 来自专栏Timeline Sec

    渗透训练

    专项训练 SQL注入: https://github.com/Audi-1/sqli-labs XSS: https://github.com/haozi/xss-demo https://xss-game.appspot.com Tj1ngwe1/upload-labs XXE: https://github.com/c0ny1/xxe-lab SSRF: https://github.com/m6a-UdS/ssrf-lab 综合训练

    52710发布于 2019-12-17
  • 来自专栏MySQL解决方案工程师

    模型训练

    模型训练是改变词汇分布的一个更重要的方法,从零开始训练一个模型需要耗费大量的成本,对于一般用户来说是不可能完成的任务。 用户通常会使用一个已经在大规模数据上训练好的预训练模型进行进一步训练,这个预训练模型可能是在一个通用任务或数据集上训练得到的,具有对一般特征和模式的学习能力。 Fine-tuning:微调会采用预先训练的模型(例如,BERT)和带有标签的数据集对全部的参数进行调整,是经典的机器学习训练方法。 Prarm. Efficent FT:通过将一组非常小的参数隔离起来进行训练或者向模型中添加一些新参数,可以降低训练成本。 训练成本 模型训练需要耗费硬件成本,最后给出一个基于OCI的不同训练方法的硬件成本。

    98610编辑于 2024-06-14
  • 来自专栏sofu456

    gan训练

    gan对mnist数据集训练 使用非卷积神经网络,对1维数据模拟,卷积是对2维数据模拟 import torch import torchvision import /discriminator.pth') 单个图片训练(训练使用一张图片中的每个小图片) import torch from torch import nn from torch import autograd

    73631发布于 2019-07-09
  • 来自专栏人人都是极客

    4.训练模型之准备训练数据

    终于要开始训练识别熊猫的模型了, 第一步是准备好训练数据,这里有三件事情要做: 收集一定数量的熊猫图片。 将图片中的熊猫用矩形框标注出来。 将原始图片和标注文件转换为TFRecord格式的文件。 收集熊猫图片倒不是太难,从谷歌和百度图片上收集 200 张熊猫的图片,应该足够训练一个可用的识别模型了。 最后需要将数据集切分为训练集合测试集,将图片文件打乱,然后按照 7:3 的比例进行切分: random.seed(42) random.shuffle(all_examples) 最后还需要一个 label map 文件,很简单,因为我们只有一种物体:熊猫 label_map.pbtxt: item { id: 1 name: 'panda' } 训练一个熊猫识别模型所需要的训练数据就准备完了 ,接下来开始在 GPU 主机上面开始训练

    2.4K80发布于 2018-03-16
  • 来自专栏AI

    AI训练师入行指南(四):模型训练

    现在,我们正式进入训练阶段:用特定数据集将模型从粗坯打磨成传世珍宝。 “用翡翠原石雕佛像,用和田玉刻印章——特定数据集就是AI模型的专属玉料。” 训练模型就像雕刻师根据玉料特性选择刻刀和技法,只有匹配的数据集才能让模型成为真正的“智能珍宝”。 1. 数据集的核心价值领域适配性:用医疗影像数据训练的模型,能识别癌症结节;用电商评论训练的模型,能感知用户情绪波动。 质量决定上限:标注精准的1000条数据,胜过混乱的10万条噪声数据。 训练技法则如同雕刻师的手艺:Adam优化器智能调节“刻刀力度”,3e-4学习率在收敛速度与稳定性间精准平衡,Dropout随机屏蔽神经元防止过度雕刻。 终极心法: 用torch.save()保存每个训练阶段——这是你的“时光回溯”按钮

    89110编辑于 2025-03-31
领券