搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏全栈程序员必看
联想开天 N7 评测
开天 N7 系列笔记本电脑基于兆芯开先 KX-6640MA 处理器平台，搭配 16GB 双通道内存和 512GB NVMe 高速 SSD，辅以国产 BIOS、OS 定制调优；1.29kg 超轻单机重量，联想开天 N7更多使用感受和评价：http://www.adiannao.cn/dy KX-6640MA 处理器采用了陆家嘴架构，16nm 工艺，4 核 4 线程，2.2GHz-2.6GHz，4MB
72230编辑于 2022-08-25
来自专栏GiantPandaCV
星辰AI大模型TeleChat-7B评测
前言受中电信 AI 科技有限公司的邀请，为他们近期开源的TeleChat-7B大模型做一个评测。 TeleChat-7B开源亮点 TeleChat-7B最大的亮点在于其开源的全面性。其中部分例子取自：https://github.com/SkyworkAI/Skywork#chat%E6%A8%A1%E5%9E%8B%E6%A0%B7%E4%BE%8B%E5%B1%95%E7%A4% TeleChat-7B: 梦里人散尽，眼前空留影。红楼梦未完，心中情难了。记录文用户：写一篇关于房地产的工作日志 TeleChat-7B：房地产工作日志日期：2021年7月10日今天是我在房地产公司工作的第十天。
80020编辑于 2024-02-22
来自专栏软件绿色联盟动态
7大生鲜电商类应用Alarm占用情况评测
四测试应用本次测试选取了7款生鲜电商类App及版本：应用名称版本盒马 4.24.1 每日优鲜 9.6.2 京东到家 7.1.1 苏宁小店 4.0.11 多点 4.4.5 永辉生活 5.10.0.51
97610编辑于 2022-03-31
来自专栏搜狗测试
软件品质评测系统-评测体系
2 ● 评测体系的内容 ● 评测体系可大可小，根据评测的内容而有所不同，一个完整的评测体系应包含：评测对象评测属性评测场景评测指标在进行评测体系的设计之前，首先应明确评测对象是什么，可以大到一个系统有了评测对象后，根据产品的需求或者应解决的问题，就可以确认哪些评测属性，比如准确度，覆盖度，再比如多样性，健壮性等。评测属性再向下，确认好评测属性的应用场景及指标项，综合形成评测矩阵。将以上结合，就是一个完整的评测体系。 ? 3 ● 评测体系的设计方法 ● 评测对象相对来说比较明确，接下来就是被测对象的特质进行评测属性的选择，以及确认好评测属性后进行评测矩阵的划分。评测场景的选择确认好了评测属性以后，接下来就是针对评测属性进行评测场景的覆盖及指标项的选择。评测场景一般是根据实际应用场景结合实现细节进行敲定。评测矩阵当评测属性，评测场景及评测指标一一敲定后，我们可以根据矩阵思想，将属性，场景及指标建立成一个二维矩阵，后续可以按照迭代的版本维护起来，全面的展示该评测对象需要重点评测的全部内容。
3.5K20发布于 2020-07-14
来自专栏搜狗测试
软件品质评测系统-评测结果展示
1 ● 为什么要进行数据展示 ● 在前几次的分享中，设计了好的评测体系、具备了数据挖掘分析能力、选择高效稳定的评测执行工具后，我们会拿到第一手的评测数据。在我们之前的实践过程中，拿到原始评测数据后会通过观察数据给出一个评测结论。长此以往发现这样并不利于保存数据记录，并且没法反映出一段时间内评测指标的变化趋势。 2 ● 哪些数据需要展现 ● 评测结果展现对于在评测设计时选定的评测指标，需要准确完整地展现在评测系统中。我们据此设计了一个评测的结果报告，每次评测完成后会通过该报告给出评测结论： ? 即我们最终展示给用户的评测结论以及各类图标数据，都应当与原始的评测结论、数据保持一致，同时评测结果的展示要与最终上线后预期的结果或趋势保持一致，这样的评测结论才是可信的、有指导意义的。
3.2K20发布于 2020-08-11
来自专栏前行的CVer
LLM评测
当前开源大模型中，Mixtral-8x22B-Instruct-v0.1在 MT-Bench（多轮会话&指令遵循）、MMLU（信息知识）中表现基本持平头部开源模型，并比GPT3.5略好，但在TruthfulQA（客观事实）上略逊于头部开源模型。Mixtral模型当前处于开源大模型第一梯队。但通过Mixtral Demo体验，其支持语言主要为欧洲语系，且在回复质量上还是存在诸如指令遵循、信息冗余、misinfo等明显问题。
2.2K10编辑于 2024-08-05
来自专栏趣Python
M-Arch（番外7）GD32L233评测-FLASH读写
闪存控制器（FMC），提供了片上闪存需要的所有功能。一般而言，MCU的Flash包括4个部分：
1K30编辑于 2022-03-22
来自专栏LuckQI
icx项目评测
icx目前的吞吐量为每秒7到15笔交易，燃料费稍微高一点：21Gwei，采取其独创的LFT共识机制（Loop容错），这是拜占庭容错机制的一种，与以太坊和NEO等公链相比，优势不算太大。（注：在评测公链项目时，我把“使用区块链的必要性”调整为了“产品特色与创新”） ◆代币升值逻辑：16/40 这一点看的有点困惑，感觉icon项目代币升值逻辑的不确定性主要体现在两个方面：一是每年增发与否取决于一个名叫
1.7K20发布于 2018-07-19
来自专栏PHP学习网
PHP技能评测
公司出了一些自我评测的PHP题目，其中好多题目在面试的时候都会碰到，大家可以看看学习学习。 1. 魔术函数有哪些,分别在什么时候调用? 7、如果是用MyISAM的话，merge引擎可以大大加快应用部门的开发速度，他们只要对这个merge表做一些select count(*)操作，非常适合大项目总量约几亿的rows某一类型(如日志，调查统计 7.Mysql的存储类型有哪几种?什么是聚簇索引非聚簇索引?
1.6K30编辑于 2022-08-03
来自专栏LuckQI
项目评测etherparty
●总得分：51.1/100分想做的目标很好，但是产品特色和目前的团队配置可能还需要进一步的补强，未来也有必要根据后续的推动情况，作进一步的动态评测。
1.7K20发布于 2018-07-19
来自专栏数据结构与算法
2840 WIKIOI——评测
2840 WIKIOI——评测时间限制: 1 s 空间限制: 2000 KB 题目等级 : 白银 Silver 题目描述 Description Wikioi上有一题有N个测试点，时限为 iostream> 2 #include<cstdio> 3 #include<cstring> 4 using namespace std; 5 int tot; 6 int main() 7
1.6K80发布于 2018-04-13
来自专栏机器之心
业界 | MobileNet在手机端上的速度评测：iPhone 8 Plus竟不如iPhone 7 Plus
令人惊讶的是，iPhone 7 plus 获胜了。iPhone 7 plus 真的很快，它在任何条件下对于实时应用都没有问题。最后，我们来看一下为什么 iPhone 7 plus 比 iPhone 8 plus 速度快。如上所述，运行快慢取决于每个处理器，即 iPhone 7 plus 的 GPU 更加适合我们的网络。我在编码器和解码器中配置 MobileUNet，然后评估 iPhone 7 plus 和 iPhone 8 plus 的性能。 ? 图 7. iPhone 7 Plus 和 iPhone 8 Plus 上的速度对比。很明显，解码器是 iPhone 8 Plus 的性能瓶颈，只使用了 Conv2DTranspose。 iPhone 7 Plus 的 GPU 能够优化 Conv2DTranspose，而 iPhone 8 Plus 的 GPU 不具备此功能。
1.9K100发布于 2018-05-10
来自专栏机器之心
7 Papers & Radios | RobustART评测模型鲁棒性；用Transformer做风格迁移遭质疑
· 霍普金斯大学提出了第一个在大规模数据集 ImageNet 上面向模型结构（ARchitecture Design）和训练技巧（Training Technique）且针对多种噪音类型的模型鲁棒性评测基准该 benchmark 全面评测了 44 种经典的手工设计和 1200 种 NAS 采样得到的模型架构以及 10 余种模型训练技巧对于鲁棒性（对抗噪音、自然噪音、系统噪音等）的影响。 (from Dacheng Tao) 7. (from Vijay Kumar) 7. Harnessing Perceptual Adversarial Patches for Crowd Counting. (from Claire Tomlin, Stefan Schaal) 7.
81750发布于 2021-09-27
来自专栏C博文
RTX 5070显卡深度评测：GDDR7显存如何提升AI训练与游戏体验？
RTX 5070 评测：GDDR7显存助力AI训练与游戏体验提升 1. 同时，GDDR7显存在能效上也有显著改进——三星宣称其功耗效率较GDDR6提升30%，美光和海力士则表示提升可达50% (GDDR7 vs GDDR6 – What’s the difference? 对于RTX 5070这种仅192-bit位宽的中高端卡来说，GDDR7的高速特性尤其重要，它能让窄位宽的显存系统也获得充足带宽，避免因为内存带宽不足而限制GPU性能 (GDDR7 vs GDDR6 – 许多媒体建议消费者在RTX 5070发布时稍作观望，等待AMD新卡的评测数据出炉，再根据两者实际表现和价格走向做出选择 (NVIDIA is Selling Lies | RTX 5070 Founders 在经过我们全面的深度评测后，可以自信地说——RTX 5070不负众望，值得推荐给广大用户。
7.3K10编辑于 2025-07-14
来自专栏搜狗测试
不可缺少的评测方案-主观性能感知评测！
“主观性能感知评测”。该评测选取主要使用场景，由人工操作与竞品对比，根据执行人员的主观感受来评测应用的流畅度，下面来介绍一下如何制定主观性能评测方案。 APP选取 1. 制定评测标准由于本评测为主观性能评测，不会有详细数据输出，因此就以是否卡顿制定标准，制定标准如下： 1. 流畅：无任何卡顿感觉，使用顺畅； 2. 一般流畅：没有明显的卡顿感觉，用户难以感知； 3. ，网络环境需要保持一致，最好不要切换网络，如果网络情况不佳，建议更换一个稳定的网络进行评测； 3．每次执行评测时，应用版本不能更换； 4．每次执行评测时，执行人员不能更换；执行测试根据测试方案执行表格中的总结主观性能感知评测，在评测中是不可缺少的，能直观的反映出应用与竞品在用户使用层面的差距。
1.8K10发布于 2020-06-04
来自专栏个性化推荐评测
TTS系统评测方法介绍--WSRD AI评测实验室
AI评测实验室针对TTS前端、后端的存在的问题，选取TTS评测指标，制定各指标评测方法，形成了一套系统的TTS评测方案。二、评测指标介绍针对上文提到的前后端可能存在的问题，选择如下指标来评测TTS。 [lf3hxj32az.png] 三、评测方法介绍本章详细介绍评测时重点关注的发音准确性评测和MOS评测。评测方法数字部分的评测方法与符号类似，为加快标注速度直接对前端归一化输出做判断，而不是对测试语料进行标注后再与前端输出结果做比较，形式如下： [lqd2s3xxui.jpg] 3.2 MOS评测 MOS 语料建设前端的评测通过发音准确、韵律准确等来评测，MOS评测应该专注于整体自然度，因此准备测试语料的时候尽量避开了多音字、符号、数字语料，从各领域和TTS实际应用场景摘选常规文本作为测试语料。
19.1K115发布于 2018-07-02
来自专栏移动应用测试
视频负反馈评测
视频评测 1、获取视频vid 评测的模型训练完成后，就可以用来评测线上的数据了。线上数据的获取，视频这边是从播放记录拿的数据。 2、获取视频评论将评测的脚本放到公司的 Docker上，评测脚本每天定时执行。执行时从 mdb 获取 vid，然后脚本根据 vid 获取视频的评论。 3、开始评测将一个视频的所有评论使用模型评测，如果评论结果为问题视频（根据负面视频的占比），还会将该 vid 对应的信息补全（视频标题，封面图等信息）方面后期运营同学处理评测结果。结果处理 1、人工下线视频模型评测出的视频，不会是 100% 的问题视频，总会有失误的情况。因此将评测出的视频放到了一个 mdb 的表里面，由运营同学再次人工审核下线，而不是直接下线。 3、模型结果和优化当前的的评测模型每天能识别出 100 多个问题视频，经过人工确认的视频有 40-80 个，占比 70% 左右。运营同学手工确认的问题视频，后台也会收集用来优化模型。
1.6K60发布于 2018-07-17
来自专栏技术成长
如何评测图系统
可以使用工具来进行性能测试，例如使用Apache JMeter等工具模拟并发请求，测量系统的吞吐量和响应时间。
1.2K61编辑于 2023-11-03
来自专栏搬砖笔记
Linux评测Bench脚本
中文脚本 wget -N --no-check-certificate https://raw.githubusercontent.com/FunctionClub/ZBench/master/ZBench-CN.sh && bash ZBench-CN.sh 英文脚本： wget -N --no-check-certificate https://raw.githubusercontent.com/FunctionClub/ZBench/master/ZBench.sh && bash ZBench.s
2.8K10编辑于 2021-12-13
来自专栏搜狗测试
如何设计评测方案
作为测试，所在项目组上线一个新功能或者评估核心功能品质时，都需要通过评测进行定量评估效果。那么怎样才能更好的评估功能效果，设计出合理的评测方案呢？今天我们以评测功能效果的评测设计方案为例进行讲解。一、明确评测目的任何一件事情都是以目标为导向，目标不同，采取的行动方式也会不同。所以，明确评测的目的特别重要。对要评测功能的实现逻辑掌握程度，决定着思考的评测方案的全面性和合理性。因为只有了解了功能的运行框架逻辑，我们才能分析出哪些因素会影响评估结果，以及评测的维度如何选取。四、确定评测指标确定评测维度后，要考虑的就是横向指标。通过评测目的进行指标的演化和拆解，抽取关注的指标。然后通过指标进行二次拆解，分析哪些数据会影响指标的数值。六、评测执行过程设计设计评测方案分为两部分：评测执行过程和数据集。通过前期工作的准备，其实我们已经完成了事情的80%。
1.8K20发布于 2020-01-02

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

联想开天 N7 评测

星辰AI大模型TeleChat-7B评测

7大生鲜电商类应用Alarm占用情况评测

软件品质评测系统-评测体系

软件品质评测系统-评测结果展示

LLM评测

M-Arch（番外7）GD32L233评测-FLASH读写

icx项目评测

PHP技能评测

项目评测etherparty

2840 WIKIOI——评测

业界 | MobileNet在手机端上的速度评测：iPhone 8 Plus竟不如iPhone 7 Plus

7 Papers & Radios | RobustART评测模型鲁棒性；用Transformer做风格迁移遭质疑

RTX 5070显卡深度评测：GDDR7显存如何提升AI训练与游戏体验？

不可缺少的评测方案-主观性能感知评测！

TTS系统评测方法介绍--WSRD AI评测实验室

视频负反馈评测

如何评测图系统

Linux评测Bench脚本

如何设计评测方案

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐