首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏新智元

    【干货】BERT模型的标准和花式

    Transformer 模型。 之后这三个向量拼接起来的输入会喂入 BERT 模型,输出各个位置的表示向量。 单句标注 Google 公开的 BERT 预训练模型,根据语言,可分为英文,中文,多语言(104 种语言)。 而这篇文章,直接用 BERT 多语言预训练模型在所有语言上,所有任务上,进行 finetune。 而 BERT 原模型只能生成单句的句子向量,或者句子对的。

    4.4K10发布于 2019-05-13
  • 来自专栏阿泽的学习笔记

    算法模型指南

    在算法项目落地过程中,如果只考虑机器学习相关部分,个人感觉最花时间的两个部分是数据质量问题处理和模型实验与迭代。 从第6部分开始是更深入的通过数据分析来进行模型的一些介绍,以及后续的测试,工程化,上线的简介,比较适合有经验的算法工程师阅读。 确保模型能够运行,并在小数据集上overfit,或复现一些已知结果。 评估并分析结果。后续会详细介绍分析手段方法。 参数。对模型的各种参数,模型结构进行各种调整。 数据与模型。 问题对应的典型数据集,例如我们可以收集一系列节假日,办公型门店的历史数据,用于后续改进的检验集。 主要操作是更换模型或者预处理方法。AutoML往往最终达到的效果更高,但需要的尝试次数往往远远大于人工。会有大量的操作花费在超参搜索上。

    1.7K43发布于 2021-07-06
  • 来自专栏数据科学(冷冻工厂)

    Python 模型超参数

    超参数的一些示例: 树的数量或树的深度 矩阵分解中潜在因素的数量 学习率(多种模式) 深层神经网络隐藏层数 k均值聚类中的簇数 超参数的调整,对于提升模型的相关性能有一定的作用。 3. 书 封面 超参数是构建有用的机器学习模型的重要元素。本书为 Python 超参数调整方法[2](机器学习最流行的编码语言之一)。 了解强大的失败者方法以及最佳实践 探索流行算法的超参数 了解如何在不同的框架和库中调整超参数 深入了解 Scikit、Hyperopt、Optuna、NNI 和 DEAP 等顶级框架 掌握可立即应用于机器学习模型的最佳实践

    62530编辑于 2023-02-27
  • 来自专栏crmeb

    9 个 Java 性能技巧,YYDS!

    在我们学习特定的 Java 编程性能之前,先来探讨一些通用的技巧。1. 在明确必要之前别急着优化这可能是最重要的性能优化技巧之一。你应该遵循常见的最佳实践做法并在案例中高效地应用它。 常见的通用技巧到此结束。接下来让我们仔细看看一些特定于 Java 的技巧。5. 使用 StringBuilder 以编程方式连接字符串在 Java 中有很多不同的选项来连接字符串。 所以,最后,这段代码在日志文件中写入 “This is a test0 1 2 3 4 5 6 7 8 9” 。 Apache Commons StringUtils.Replace 而不是 String.replace一般来说,String.replace 方法可以正常工作,并且效率很高,尤其是在你使用 Java 9 thistest.replace(“test”, “simple test”);// with thisStringUtils.replace(test, “test”, “simple test”);9.

    47540编辑于 2022-07-07
  • 来自专栏Java后端技术栈cwnait

    Java 9 中的 GC 基础

    本文将主要讲解GC需要知道的一些基础知识,会涉及到一些GC的实现细节,但不会对实现细节做很全面的阐述,如果你看完本文之后,能对GC有一个大致的认识,那本文的写作目的也就达到了。 本文将包含以下内容: GC的作用范围 GC负责的事情 JVM中的4种GC G1的一些细节 使用Java 9正式版对G1进行测试 一些简单的GC方法 一、GC的作用范围 要谈GC的作用范围,首先要谈JVM GC,Java 9中默认使用G1。 一些简单的GC方法 1. 使用不同的索引对象 引用的类型会直接影响其所引用对象的GC行为,当要做一些内存敏感的应用时,可以参考使用合适的引用类型。 在Parallel里,可以通过参数调节最大停止时间(-XX:MaxGCPauseMillis,默认无设置)和吞吐量(-XX:GCTimeRatio,默认值是99,即最大使用1%的时间来做垃圾回收)来

    79840发布于 2019-08-02
  • 来自专栏java一日一条

    Java 9 中的 GC 基础

    本文将主要讲解GC需要知道的一些基础知识,会涉及到一些GC的实现细节,但不会对实现细节做很全面的阐述,如果你看完本文之后,能对GC有一个大致的认识,那本文的写作目的也就达到了。 本文将包含以下内容: GC的作用范围 GC负责的事情 JVM中的4种GC G1的一些细节 使用Java 9正式版对G1进行测试 一些简单的GC方法 一、GC的作用范围 要谈GC的作用范围,首先要谈JVM 一些简单的GC方法 1. 使用不同的索引对象 引用的类型会直接影响其所引用对象的GC行为,当要做一些内存敏感的应用时,可以参考使用合适的引用类型。 在Parallel里,可以通过参数调节最大停止时间(-XX:MaxGCPauseMillis,默认无设置)和吞吐量(-XX:GCTimeRatio,默认值是99,即最大使用1%的时间来做垃圾回收)来 G1提供了丰富的基于不同目的的可调的参数,列表如下: ?

    72020发布于 2018-09-14
  • 来自专栏csico

    模型的选择与

    交叉验证(所有数据分成n等分 ) 最常用的为10折交叉验证 举例: 4折交叉验证(分成4等分时): 最后求出4个准确率的均值 网格搜索:参数 对模型预设几种超参数组合,每组超参数都采用交叉验证来进行评估 ,选出最优参数组合建立模型 API from sklearn.model_selection import GridSearchCV # coding=utf8 import numpy as np gc.score(x_test,y_test) print(gc.best_score_) # 显示在交叉验证中最好的结果 print(gc.best_estimator_) # 显示选择最好的模型参数

    53430编辑于 2021-12-29
  • 来自专栏鸿的学习笔记

    吴恩达谈 MLOps:数据比模型更重要

    在之前的 AI 系统设计当中,大家似乎更重视对模型这一块,而忽视了对数据的,吴恩达认为前者是 Model-centric(以模型为中心),后者是 Data-centric(以数据为中心)。 并且从 实证经验表明,优化模型获得的收益不如优化数据集。在讲座举的钢板缺陷检测任务当中,baseline准确率为76.2%,各种换模型参数的骚操作之后,对准确率几乎没有提升。 但是吴恩达认为把时间花费在对数据质量的优化上面,可能要比花费时间对模型进行,受益会更多。 Model-centric: 以调整模型代码、模型超参数为主的系统策略,在这种策略下,可以认为数据集是固定的 Data-centric: 与Model-centric相对,以调整数据集为主的系统策略 通常,以模型为中心的科学家偏爱某个模型家族,这很可能构成了他们在研究生院论文的主题。他们根据问题首先从模型开始,并努力通过特征工程使数据适合其模型

    1.3K40发布于 2021-04-23
  • 来自专栏架构师之旅

    Java9中的GC基础

    本文将主要讲解GC需要知道的一些基础知识,会涉及到一些GC的实现细节,但不会对实现细节做很全面的阐述,如果你看完本文之后,能对GC有一个大致的认识,那本文的写作目的也就达到了。 本文将包含以下内容: GC的作用范围 GC负责的事情 JVM中的4种GC G1的一些细节 使用Java 9正式版对G1进行测试 一些简单的GC方法 一、GC的作用范围 要谈GC的作用范围,首先要谈JVM GC,Java 9中默认使用G1。 一些简单的GC方法 1. 使用不同的索引对象 引用的类型会直接影响其所引用对象的GC行为,当要做一些内存敏感的应用时,可以参考使用合适的引用类型。 在Parallel里,可以通过参数调节最大停止时间(-XX:MaxGCPauseMillis,默认无设置)和吞吐量(-XX:GCTimeRatio,默认值是99,即最大使用1%的时间来做垃圾回收)来

    86870发布于 2018-01-30
  • 来自专栏嵌入式与Linux那些事

    Linux 性能工具的 9 张图

    它们展示了:Linux 可观察性工具、 Linux 静态性能分析工具、 Linux 基准测试工具、 Linux 工具和Linux sar。 性能观察工具: 静态性能工具 性能压测工具: 性能工具 sar perf-tools 追踪工具 BPF性能工具:

    32521编辑于 2024-07-05
  • 来自专栏AI

    AI模型的评估与

    AI模型的评估与:交叉验证、ROC、F1-score等在机器学习和人工智能(AI)应用中,模型的评估和是非常关键的步骤。 发现问题:通过不同的评估方法,我们可以发现模型可能存在的问题,如过拟合、欠拟合等。进行模型:评估可以帮助我们调整模型的超参数或选择更合适的算法。2. 模型:提高模型性能的技巧超参数是提升模型性能的关键步骤。超参数是模型训练过程中需要手动设置的参数,它们直接影响模型的训练效果和最终性能。 常见的方法包括:网格搜索(Grid Search):通过遍历指定的参数空间,逐一尝试不同的超参数组合,从而找到最优的参数配置。 Bishop这本书是模式识别和机器学习领域的经典教材,书中深入探讨了模型评估和的理论基础,并涉及了多种评价指标。

    1.1K00编辑于 2025-01-27
  • 来自专栏chenchenchen

    SQL之性能

    针对专门操作符的 前面,讲的是关于查询条件的一般规则,在这一节中,将讨论如何使用专门的操作符来改进 SQL 代码的性能。 本文总结的是一些 SQL 性能的比较初级的方面,SQL 还包括 Order by,Group by 以及 Index 等等。

    2.3K30发布于 2019-12-03
  • 来自专栏LhWorld哥陪你聊算法

    【Spark篇】---Spark之代码,数据本地化,内存,SparkShuffle,Executor的堆外内存

    一、前述 Spark中大致分为以下几种 ,代码,数据本地化,内存,SparkShuffle,调节Executor的堆外内存。 二、具体    1、代码 1、避免创建重复的RDD,尽量使用同一个RDD 2、对多次使用的RDD进行持久化 如何选择一种最合适的持久化策略? 通过日志或者WEBUI 3、内存 ? Spark  JVM主要是降低gc时间,可以修改Executor内存的比例参数。 RDD缓存、task定义运行的算子函数,可能会创建很多对象,这样会占用大量的堆内存。 Spark中如何内存

    2.1K30发布于 2018-09-13
  • 离线推理全流程&模型

    整体概述小模型推理方案:ATC转换架构图:ModelZoo-PyTorch指导文档:https://gitee.com/ascend/ModelZoo-PyTorch/blob/master/ACL_PyTorch /docs/README.md模型推理离线推理导出Onnx参考链接:ONNX的导出Onnx转om参考链接1:Onnx转Om参考链接2:ATC工具介绍离线推理参考链接:离线推理Chinese_CLIP上机操作 Chinese_CLIP模型介绍参考链接传统模型基于昇腾迁移适配全流程模型支持度分析msit analyze安装msit: https://gitee.com/ascend/msit/blob/master 图片模型转换:pt->onnx:参考链接执行分析命令:使用onnx-sim对onnx模型进行简化export bs=24onnxsim models/vit-b-16.txt.fp32.onnx models (onnx->om)atc工具使用指导:链接AOE自动(onnx->om)使用指导:链接模型压缩:官方指导文档:链接离线推理Chinese_CLIP模型推理指导ais_bench使用安装:链接推理执行

    24700编辑于 2025-06-20
  • 来自专栏肉眼品世界

    9张Linux性能工具图,建议收藏!

    它们展示了:Linux 可观察性工具、 Linux 静态性能分析工具、 Linux 基准测试工具、 Linux 工具和Linux sar。 性能观察工具: 静态性能工具 性能压测工具: 性能工具 sar perf-tools 追踪工具 BPF性能工具:

    65710编辑于 2022-01-20
  • 来自专栏纯洁的微笑

    Tomcat 性能之 JVM

    因此在对Web 容器( 应用服务器) 的中必不可少的是对于 JVM 的。 对于 JVM 的,主要有两个方面考虑: 内存大小配置 垃圾回收算法选择 当然,确切的说,以上两点并不互相独立,内存的大小配置也会影响垃圾回收的执行效率。 延迟、吞吐量 其他 JVM 配置 垃圾回收算法对应到的就是不同的垃圾收集器,具体到在 JVM 中的配置,是使用 -XX:+UseParallelOldGC 或者 -XX:+UseConcMarkSweepGC 所谓,就是一个不断调整和优化的过程,需要观察、配置、测试再如此重复。有相关经验的朋友欢迎留言补充! 说到底,那上面的这些选项是要配置在哪里呢?

    2.2K30发布于 2019-05-06
  • 来自专栏有关SQL

    Hive 性能,这 9 点都掌握了?

    compute statistics for columns sender, topic; analyze table tweens compute statistics for columns ; 语句级别的

    1.5K20发布于 2019-12-25
  • 来自专栏个人积累

    数据库 项目

    Springboot项目 配置文件 更改Tomcat的相关配置 设置Tomcat的最大连接数 设置请求头最大内存 设置post请求的最大内存 设置Tomcat最大线程数 设置Tomcat 的最小工作线程数 JVM 设置项目启动的参数 在vm option处添加配置内容 -XX:MetaspaceSize=128m #(元空间默认大小) -XX:MaxMetaspaceSize=128m

    1K51发布于 2020-10-10
  • 来自专栏SmartSi

    Spark 性能之Shuffle

    因此,如果要让作业的性能更上一层楼,就有必要对 shuffle 过程进行。 但是也必须提醒大家的是,影响一个 Spark 作业性能的因素,主要还是代码开发、资源参数以及数据倾斜,shuffle 只能在整个 Spark 的性能中占到一小部分而已。 因此大家务必把握住的基本原则,千万不要舍本逐末。下面我们就给大家详细讲解 shuffle 的原理,以及相关参数的说明,同时给出各个参数的建议。 2. 5. shuffle相关参数 以下是Shffule过程中的一些主要参数,这里详细讲解了各个参数的功能、默认值以及基于实践经验给出的建议。 建议:在资源参数中讲解过这个参数。如果内存充足,而且很少使用持久化操作,建议调高这个比例,给 shuffle read 的聚合操作更多内存,以避免由于内存不足导致聚合过程中频繁读写磁盘。

    1.8K31发布于 2019-08-08
  • 来自专栏运维经验分享

    tomcat 8 9 性能 优化 centos 7 linux

    个人分类: tomcat 不要单纯为了而去,应该有针对性的去发现不足,解决问题,以提高性能。 所以,的前提是做好各种监控分析,包括服务器基础资源使用、各个应用运行状况、代码质量、数据库状况、等等,根据业务的并发,服务器资源,以及存在的问题,有针对性的去优化。 ==========正文============== 性能的提升,主要从以下几个方面入手: 1,架构 负载均衡,高可用,nginx + tomcat  动静分离,容器化 等, 不具体阐述 2 ,代码 3,tomcat 相关参数优化,jvm。 (1),连接数,线程数,缓存,修改server.xml。 打开被注释的默认连接池配置 默认配置: <! 5,操作系统 硬件: CPU、内存、硬盘、带宽 。 这个属于 不差钱 性质的优化。人民币玩家 不废话。 系统:内核参数.

    2.4K70发布于 2019-03-16
领券