首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏全栈程序员必看

    db4o java,db4o Java版性能测试评估

    public class Testdb4oIndex { public static class Record { String strKey; long intKey; }; public 100000; static public void main(String[] args) { new File(FILE).delete(); Configuration conf = Db4o.configure Integer.MAX_VALUE); conf.automaticShutDown(false); conf.lockDatabaseFile(false); ObjectContainer db = Db4o.openFile

    38710编辑于 2022-09-13
  • 来自专栏芋道源码1024

    如何精确评估开发时间的 4 个小套路?

    来源:http://t.cn/E6rf8uT 评估开发时间的重要性 初学者为什么评估不准? 如何精确评估开发时间 1、任务拆分 2、合理认知时间 3、预留buffer(缓冲区) 4、回头看 总结 ---- 一个程序员能否精确评估开发时间,是一件非常重要的事情。 APP需求迭代为例,项目计划像这样: 1.UI设计图 11.01 - 11.03(3工作日) 2.API接口讨论与设计 11.04(1工作日) 3.移动端开发 11.05 - 11.15(8工作日) 4. 越是老程序员越是“胆小”,评估时间越准。 如何精确评估开发时间 最近几年,我都是以小时为单位进行时间评估的,有没有觉得有点恐怖?长期以来这样的习惯让我收获颇多。 4、回头看 在实际开发过程中,测量实际花费时间,并与估算相比较。如果有些地方相差较大,就要看差在哪里,然后在下次预估中避免相同的差错。 总结 编程经验不等同于估算经验。

    2.3K20发布于 2019-06-21
  • 来自专栏blog-技术博客

    人工智能_4_k近邻_贝叶斯_模型评估

    tf.fit_transform(x_train) # print(tf.get_feature_names()) # 全部文章中所有的词 x_test = tf.transform(x_test) # 朴素贝叶斯进行评估 常用于文本分类 缺点: 前提是一个词的出现与另一个无关,当词之间出现关联时,效果不好 if __name__ == "__main__": # knnCls() naviebayes() pass 模型评估 ) y_true:真实目标值 y_pred:估计器预测目标值 terget_names:目标类别名称 return:每个类(目标值)的精确率与召回率 模型选择与调优 交叉验证:让别评估模型更加准确 param_grid=none,cv=None) estimator:估计器(knn) 此时估计器中不用再写超参数 param_grid:估计参数 {"n_neighbors":[1,2,3,4,5 sklearn.model_selection import GridSearchCV gc = GridSearchCV(KNeighborsClassifier(),param_grid={"n_neighbors":[1,2,3,4,5

    62120发布于 2020-05-08
  • 来自专栏贾志刚-OpenCV学堂

    OpenCV4 C# YOLO11姿态评估模型部署

    YOLO11姿态评估模型 YOLO11是YOLOv5跟YOLOv8作者推出最新升级版本模型,支持分类、检测、分割、姿态评估、OBB。 这里以YOLO11姿态评估模型为例,演示OpenCV C#如何运行,YOLO11-pose模型的输入与输出。 (3, 0), kypt.At<float>(3, 1)), Scalar.RandomColor(), 2); // nose->right_eye->right_ear.(0, 2), (2, 4) 2); Cv2.Line(frame, new Point(kypt.At<float>(2, 0), kypt.At<float>(2, 1)), new Point(kypt.At<float>(4, 0), kypt.At<float>(4, 1)), Scalar.RandomColor(), 2); // nose->left_shoulder->left_elbow->left_wrist

    11710编辑于 2026-04-02
  • 来自专栏HyperAI超神经

    谷歌发布 HEAL 架构,4评估医学 AI 工具是否公平

    作者:加零 编辑:李宝珠,三羊 面向健康公平问题,Google 团队开发了 HEAL (The health equity framework) 框架,能够定量评估基于机器学习的医疗健康方案是否「公平」 ) 框架,能够定量评估基于机器学习的医疗健康方案是否「公平」。 HEAL 架构:4评估皮肤科 AI 工具公平性 HEAL 框架包含 4 个步骤: 确定与卫生健康不公平有关的因素,并定义 AI 工具性能指标 明确并量化先前存在的健康差异 (disparities) 此外,研究人员选择 top-3 agreement 作为评估 AI 工具性能的指标,其定义是,AI 建议的前 3 项条件中至少有一项与皮肤科专家小组的参考诊断相匹配的病例比例。 * 公平性评估:在模型部署前后,都应进行公平性评估。这包括使用各种公平性度量标准来评估模型对不同群体的影响,并根据评估结果进行必要的调整。

    39210编辑于 2024-05-13
  • 来自专栏深度学习与python

    以 Log4j 为例,如何评估和划分安全风险

    那么,安全专业人员如何评估漏洞可能带来的风险,并将组织的精力集中在修复那些最重要的漏洞上呢? 3 评估和划分潜在的漏洞利用 在根据漏洞的可利用性对其进行划分并以此来确定修复优先级时,你需要考虑以下的部分或全部标准: 漏洞的严重程度:CVSS(Common Vulnerability Scoring 4 限制侦察活动 攻击者通常会根据事先准备好的剧本,使用在 MITRE ATT&CK 中记录的战术和技术展开攻击活动。这些战术遵循的是网络杀伤链等模型,从侦察活动开始,然后再进行初步的攻击。 6 结论 Log4j 告诉我们,漏洞是不可避免的,但这不应该成为阻止组织使用开源代码作为创新和实现其他有价值的目标的障碍。 在指导组织开展安全工作时,安全主管们可以获取跨所有基础设施的应用程序流量的全面可见性,结合漏洞可利用性评估和优先级排序的策略,在寻找攻击痕迹时持续保持警惕,降低与 Log4j 和下一个重大漏洞相关的风险

    56430编辑于 2022-06-11
  • 来自专栏生信技能树

    4篇:对ATAC-SeqChIP-seq的质量评估(一)——phantompeakqualtools

    ChIP-Seq质量评估 在下游分析前,最好是先对peak calling 后的ChIP-Seq数据进行质量评估。 failed experiment 交叉相关性质量评估度量值 交叉相关谱图可以计算评估ChIP_Seq实验信噪比的度量值,并且实验设计确保fragment length准确。 包含的信息如下: COL1:Filename:比对过滤的bam文件名 COL2:numReads :有效的测序深度 COL3:estFragLen:逗号分隔的交叉相关峰以相关性递减顺序排列的值 COL4: :交叉相关最小的链位移 COL8: min_corr:交叉相关最小值 COL9: Normalized strand cross-correlation coefficient (NSC) = COL4 / COL8 COL10: Relative strand cross-correlation coefficient (RSC) = (COL4 - COL8) / (COL6 - COL8) COL11

    5.7K30发布于 2018-09-21
  • “大模型安全评估”需要评估哪些?

    因此,构建一套科学、系统、多维度的安全评估体系,不再是可选项,而是确保其健康发展的必然要求。 #大模型备案##安全评估##生成式人工智能#一、语料安全评估二、生成内容评估暴力、仇恨与非法内容: 评估模型是否会生成宣扬暴力、恐怖主义、种族歧视、性别歧视、仇恨言论等的内容。 三、涉知识产权、商业秘密评估四、涉民族、信仰、性别等评估五、涉透明性、准确性、可靠性等评估事实准确性与反幻觉: “幻觉”是指模型生成看似合理但实则错误或虚构的信息。 评估需检验模型在知识密集型任务(如问答、摘要)中的事实准确性,及其对不确定信息的处理能力。逻辑一致性与连贯性: 评估模型在长文本生成或多轮对话中,是否能在逻辑上保持前后一致,避免自相矛盾或答非所问。 六、模型性能(拒答率)评估大模型的安全评估是一个动态、持续且多学科交叉的复杂工程,它需要技术专家、伦理学家、法律学者、社会科学家和领域专家的共同参与。

    61410编辑于 2025-08-26
  • 来自专栏生信喵实验柴

    BUSCO 评估

    背景 用于转录组和基因组组装质量进行评估的软件,前面介绍了quast,今天的是busco,对于动物植物较大的基因组拼接结果评估,这个软件很好用。 busco简介 BUSCO(Benchmarking Universal Single-Copy Orthologs)主要用于转录组和基因组组装质量进行评估的软件。 BUSCO 对拼接结果的评估与 quast 不同,它并不追求基因组拼接的长度,而关注的是是否将一些单拷贝直系同源基因拼接出来。 BUSCO 评估的原理其实不难,软件根据 OrthoDB 数据库,构建了几个大的进化分支的单拷贝基因集。 包括基因组组装评估(all)、转录组组装评估(OGS)以及基因预测评估(trans) 其他选项 -sp :做 AUGUSTUS 用于训练的物种名字 -e :blast 的 e 值

    2.1K41编辑于 2022-05-23
  • 来自专栏生信喵实验柴

    quast评估

    一、组装结果评估 1、准确性 基因组大小接近真实大小,拼出来的一般小于真实大小; GC含量接近真实GC含量,一个物种含量固定,可以判断污染; 基因组框架没有问题; 三、quast评估 今天给大家介绍一款,quast QUAST: Quality Assessment Tool for Genome Assemblies,可以对不同软件拼接的基因组序列, 软件官网:QUAST:http://bioinf.spbau.ru/quast #quast 评估案例: quast.py -r MGH78578.fasta spades.fa soapdenovo.fa

    1.7K20编辑于 2022-05-23
  • 来自专栏用户8715145的专栏

    主机安全风险评估的类型 评估工具

    在实际使用中难免会遇到一些病毒,所以大家采购时会有一些主机安全风险评估,会选择一些相对平稳的主机,以免后期运用造成数据的丢失和工作效率低下的问题。 那么主机安全风险评估有哪些种类,和怎么控制风险的发生呢,小编给大家整理了一下相关介绍。 安全风险评估和工具 电脑的使用现在已经很普遍了,使用电脑就会有一些隐私的数据,想达到数据的安全以及防止数据的安全性,我们要对主机进行一个安全风险的评估。安全风险评估分为哪些呢? 风险评估一方面是对安全手段的评估,另一方面要对实际安全效果的评估。要想达到这种目的,我们要通过安全扫描、手工检查、渗透测试、安全审计、安全策略等方法进行安全风险评估。 企业更要有安全意识,把基础网络和重要信息的制度输入给员工,结合开展风险评估、应控等形式提高基础网络和信息系统的维护。

    1.7K30编辑于 2021-12-03
  • 来自专栏SAP ERP管理实践

    SAP 物料的“评估类型”和“评估类别”

    (1)自产的价值与外购的价格不一样; (2)不同的制造商制造相同的物料,价格不同; (3)不同的产地制造相同的物料,价格不同; (4)相同物料不同批次有不同的价格; (5)破损及维修后的物料与新的物料价值不一样 由于“分割评估”涉及技术部分更多,将主要步骤分享如下: 一、后台定义部分 (1)激活“分割评估”功能; (2)定义“评估类型”(ValuationType)(如本文中提到“自制品”、“外购品”两种评估类型 ,并选择相应帐户分类参考参数(与评估类相关),评估类型是评估类别的细分); (3)定义“评估类别”(ValuationCategory)(分割评估的标准,将其中的评估类型与相应工厂激活); (4)定义“ 评估区域”(ValuationArea)(评估区域可以公司范围内,也可以在工厂范围内) 二、前台操作部分 (1)定义物料主数据,将评估类别定义在会计视图中(其价格控制须选移动平均价V); (2)定义“评估类型 ”为自制品的物料主数据(其评估级别与价格控制据需要填制); (3)定义“评估类型”为外购品的物料主数据(其评估级别与价格控制据需要填制); 注:前台操作第一步为第二步、第三步奠定基础,起作用的将是各制带评估类别的物料

    9.8K43发布于 2021-04-23
  • 来自专栏zingpLiu

    模型评估

    文章从模型评估的基本概念开始,分别介绍了常见的分类模型的评估指标和回归模型的评估指标以及这些指标的局限性。部分知识点举例加以阐述,以便加深理解。 2 评估指标的局限性 在模型评估过程中,分类问题、排序问题、回归问题往往需要使用不同的指标进行评估。在诸多的评估指标中,大部分指标只能片面地反映模型的一部分性能。 如果不能合理地运用评估指标,不仅不能发现模型本身的问题,而且会得出错误的结论。 3 分类模型的评估指标 正样本:需要判定概率为1的类型的样本叫做正样本。 import f1_score ROC ROC曲线 from sklearn.metrics import roc AUC ROC曲线下的面积 from sklearn.metrics import auc 4 第三,可以找一个更合适的指标来评估该模型。

    1.6K30发布于 2019-04-01
  • 来自专栏数据森麟

    又是模型评估?到底怎么评估?『附 AUC 评估的三计算方法』

    前面一节提到了模型评估指标中 ROC 的详细概念和四个常见的问题,以后在遇到 ROC 想必再也不会发懵了:聊聊模型评估的事儿,附 roc 常见的四个灵魂发问 但是一般在说到 ROC 的时候,就会不自觉地提到 在上面的例子中,一共有 2*2=4 个正负样本二元组,其中正样本得分大于负样本得分的二元组有 4 个,所以上例中的 总结一下,大概是这样的: 在 M 个正类样本,N 个负类样本,一共有 M*N 个二元组 写成公式是这样的: 正样本,负样本 其中在比较正样本和负样本的得分时: P正>P负,score=1 P正=P负,score=0.5 P正<P负,score=0 也就是说如果上例中 4 个正负二元组, 其中 例如:正样本 A、B 和负样本 C、D,假设 A>C 、A>D、B>C、B>D 都发生 对于 A 而言,rank1=M+N=4,存在 2-1=1 个正样本得分比它小、4-2=2 个负样本得分比它小。 +(rank_M-1),对应上例中的 (4-2)+(3-2+1)=4 上式的整体结果再除以 M×N 得到的就是正类样本的得分大于负类样本的得分占整体的比例,公式为: 同样的,当两个样本的得分相等时,无论是同类

    3.8K10发布于 2021-03-11
  • 来自专栏SAP最佳业务实践

    SAP S4 HANA新变化-MM-IM物料帐:物料评估

    物料帐强制启用 Description This simplification makes it mandatory to use the Material Ledger (ML) in all SAP S/4HANA IMG migration activities:  Customizing migration配置迁移: o from SAP ERP or SAP Simple Finance to SAP S/4HANA  Data migration数据迁移: o from SAP ERP or SAP Simple Finance to SAP S/4HANA 1511: transaction: SPRO --> o from SAP ERP or SAP Simple Finance to SAP S/4HANA 1610: transaction: SPRO -->Migration to SAP S/4HANA If you performing an upgrade from S/4HANA 1511 to S/4HANA 1610, no manual IMG Material Ledger data migration

    2.2K60发布于 2018-03-28
  • 来自专栏全栈程序员必看

    模型评估

    问题4 ROC曲线相比P-R曲线有什么特点? 相比P-R曲线,ROC曲线有一个特点,当正负样本的分布发生变化时,ROC曲线的形状能够基本保持不变,而P-R曲线的形状一般会发生较剧烈的变化。 4 A/B测试的陷阱 在互联网公司中,A/B测试是验证新模块、新功能、新产品是否有效,新算法、新模型的效果是否有提升,新设计是否受到用户欢迎,新更改是否影响用户体验的主要测试方法。 离线评估无法完全消除模型过拟合的影响,因此,得出的离线评估结果无法完全替代线上评估结果 离线评估无法完全还原线上的工程环境。一般来讲,离线评估往往不会考虑线上环境的延迟、数据丢失、标签数据缺失等情况。 因此,离线评估的结果是理想工程环境下的结果。 线上系统的某些商业指标在离线评估中无法计算。离线评估一般是针对模型本身进行评估,而与模型相关的其他指标,特别是商业指标,往往无法直接获得。 (4)集成学习方法。集成学习时把多个模型集成在一起,来降低单一模型的过拟合风险,如Bagging方法 降低“欠拟合”风险的方法 (1)添加新特征。

    98140发布于 2021-05-20
  • 来自专栏Python与算法之美

    评估指标metrics

    本篇我们介绍评估指标。 一,评估指标概述 损失函数除了作为模型训练时候的优化目标,也能够作为模型好坏的一种评价指标。但通常人们还会从其它角度评估模型的好坏。 这就是评估指标。 通常损失函数都可以作为评估指标,如MAE,MSE,CategoricalCrossentropy等也是常用的评估指标。 但评估指标不一定可以作为损失函数,例如AUC,Accuracy,Precision。因为评估指标不要求连续可导,而损失函数通常要求连续可导。 编译模型时,可以通过列表形式指定多个评估指标。 如果有需要,也可以自定义评估指标。 自定义评估指标需要接收两个张量y_true,y_pred作为输入参数,并输出一个标量作为评估值。 如果编写函数形式的评估指标,则只能取epoch中各个batch计算的评估指标结果的平均值作为整个epoch上的评估指标结果,这个结果通常会偏离拿整个epoch数据一次计算的结果。

    2.1K30发布于 2020-07-20
  • 来自专栏全栈程序员必看

    分类模型评估方法_政策评估的模型与方法

    错误率(error_rate)和精度(accuracy)是分类任务中最常用的两个指标,既适用于二分类任务也适用于多分类任务;

    83030编辑于 2022-11-10
  • BLOOM评估系统:自动化LLM行为评估框架

    BLOOM评估系统:自动化LLM行为评估框架项目概述BLOOM(Bloom Rollout Pipeline)是一个开源的大语言模型行为评估系统,专门用于自动化测试和评估LLM的特定行为模式。 :behavior: sycophancy # 目标行为total_evals: 50 # 评估场景数量rollout: target: "claude-sonnet-4" # 目标模型 model: "gpt-4o" # 评估器模型运行评估管道python bloom.py seed.yaml启用调试模式python bloom.py seed.yaml --debug \ --model claude-sonnet-4 \ --output-dir results/transcripts/manual结果输出评估结果保存在results/目录下,包含:understanding_results.json ": { "id": "openai/gpt-4o", "org": "openai", "name": "GPT-4o" }, # DeepSeek

    21010编辑于 2026-01-05
  • 来自专栏FreeBuf

    评估的意义

    这一期主题是体系评估,那么这里其实评估的不仅仅的是安全体系的评估,还有业务的评估、风险的评估、设备的评估、人员的评估等等。而且主要是涉及中层的工作。 评估的意义是什么? 业务方面应该由业务所有者(项目合作者)来进行评估,也就是由高层进行,评估后如果业务可以实施,交由中层进行业务设计,此时要对风险、选用设备进行评估,同时还要对人员进行评估。 (4)影响力 评估业务的影响力也是必要的,如果可以通过一个业务来提升知名度,那么成本把控也许会显得不那么重要 整个业务评估阶段的影响因素重视程度是相关联的,并没有统一的标准,没有什么阀值,基于市场变化是评估最大的难度 等保与体系管理的风险评估大多是评估这些,而我说的风险评估是业务本身的风险,包括业务被中断、投入变化等等,当然两个风险评估是都要做的。 最后总结一下评估工作,很多人说评估是没有必要的浪费时间,在行动派眼中评估是空想,但我更想说的是,其实任何行动之前都是要评估的,如果评估结果告诉你这件事情可以不做,总要好过做一半发现他没有意义要更节省时间

    1.3K10发布于 2020-02-12
领券