首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏音视频技术

    唐敏豪:我给MSU评测9

    在唐敏豪看来,MSU视频编码大赛是目前业界规模最大的编码器客观评比平台,对视频编码器的开发者和使用者都有很高的参考价值,但MSU的评测对于特定的业务场景不具有绝对的参考价值。 LiveVideoStack:作为面向通用场景的视频编码器的评测,您可以给MSU打多少分?还有哪些需要改进的地方? 唐敏豪:关于打分,满分10分我希望可以给9分。

    1.2K20发布于 2019-11-28
  • 来自专栏搜狗测试

    软件品质评测系统-评测体系

    2 ● 评测体系的内容 ● 评测体系可大可小,根据评测的内容而有所不同,一个完整的评测体系应包含: 评测对象 评测属性 评测场景 评测指标 在进行评测体系的设计之前,首先应明确评测对象是什么,可以大到一个系统 有了评测对象后,根据产品的需求或者应解决的问题,就可以确认哪些评测属性,比如准确度,覆盖度,再比如多样性,健壮性等。 评测属性再向下,确认好评测属性的应用场景及指标项,综合形成评测矩阵。 将以上结合,就是一个完整的评测体系。 ? 3 ● 评测体系的设计方法 ● 评测对象相对来说比较明确,接下来就是被测对象的特质进行评测属性的选择,以及确认好评测属性后进行评测矩阵的划分。 评测场景的选择 确认好了评测属性以后,接下来就是针对评测属性进行评测场景的覆盖及指标项的选择。评测场景一般是根据实际应用场景结合实现细节进行敲定。 评测矩阵 当评测属性,评测场景及评测指标一一敲定后,我们可以根据矩阵思想,将属性,场景及指标建立成一个二维矩阵,后续可以按照迭代的版本维护起来,全面的展示该评测对象需要重点评测的全部内容。

    3.2K20发布于 2020-07-14
  • 来自专栏搜狗测试

    软件品质评测系统-评测结果展示

    1 ● 为什么要进行数据展示 ● 在前几次的分享中,设计了好的评测体系、具备了数据挖掘分析能力、选择高效稳定的评测执行工具后,我们会拿到第一手的评测数据。 在我们之前的实践过程中,拿到原始评测数据后会通过观察数据给出一个评测结论。长此以往发现这样并不利于保存数据记录,并且没法反映出一段时间内评测指标的变化趋势。 2 ● 哪些数据需要展现 ● 评测结果展现 对于在评测设计时选定的评测指标,需要准确完整地展现在评测系统中。 我们据此设计了一个评测的结果报告,每次评测完成后会通过该报告给出评测结论: ? 即我们最终展示给用户的评测结论以及各类图标数据,都应当与原始的评测结论、数据保持一致,同时评测结果的展示要与最终上线后预期的结果或趋势保持一致,这样的评测结论才是可信的、有指导意义的。

    2.9K20发布于 2020-08-11
  • 来自专栏前行的CVer

    LLM评测

    当前开源大模型中,Mixtral-8x22B-Instruct-v0.1在 MT-Bench(多轮会话&指令遵循)、MMLU(信息知识)中表现基本持平头部开源模型,并比GPT3.5略好,但在TruthfulQA(客观事实)上略逊于头部开源模型。Mixtral模型当前处于开源大模型第一梯队。 但通过Mixtral Demo体验,其支持语言主要为欧洲语系,且在回复质量上还是存在诸如指令遵循、信息冗余、misinfo等明显问题。

    1.9K10编辑于 2024-08-05
  • IT专家深度评测:2025年9月十大网络监控软件横向对比

    为此,我特地从一个资深评测专家的角度,梳理并评测了目前国内市场上主流的十款网络监控软件。本次评测综合考量了产品的功能全面性、易用性、扩展性、自动化能力、性价比以及本土化支持等多个维度。 十大网络监控软件深度评测1. ManageEngine OpManager亮点: 集成度高,功能全面,部署简便,性价比突出,本地化支持出色。 9. 烽火网管亮点: 传统网络设备厂商,适用于传统网络架构。烽火的网管产品主要针对传统的网络架构和设备,功能稳定,但界面和功能设计相对传统。 评测总结与建议经过一番深度评测,我们可以看到,市场上没有一款“放之四海而皆准”的完美产品。每款软件都有其独特的定位和优势。 希望这份评测能帮助您做出最明智的决策。

    97110编辑于 2025-09-12
  • 来自专栏LuckQI

    icx项目评测

    (注:在评测公链项目时,我把“使用区块链的必要性”调整为了“产品特色与创新”) ◆代币升值逻辑:16/40 这一点看的有点困惑,感觉icon项目代币升值逻辑的不确定性主要体现在两个方面: 一是每年增发与否取决于一个名叫

    1.6K20发布于 2018-07-19
  • 来自专栏LuckQI

    项目评测etherparty

    ●总得分:51.1/100分 想做的目标很好,但是产品特色和目前的团队配置可能还需要进一步的补强,未来也有必要根据后续的推动情况,作进一步的动态评测

    1.6K20发布于 2018-07-19
  • 来自专栏PHP学习网

    PHP技能评测

    公司出了一些自我评测的PHP题目,其中好多题目在面试的时候都会碰到,大家可以看看学习学习。 1. 魔术函数有哪些,分别在什么时候调用?     说个我现有用的数据库平台容量:主从数据总量在几百T以上,每天十多亿 pv的动态页面,还有几个大项目是通过数据接口方式调用未算进pv总数,(其中包括一个大项目因为初期memcached没部署,导致单台数据库每天处理 9千万的查询 一致性哈希,一种分布式节点key分布算法,可选; 9.MySQL索引底层数据结构是怎样存储的,为什么使用索引会查询的快?    

    1.5K30编辑于 2022-08-03
  • 来自专栏数据结构与算法

    2840 WIKIOI——评测

    2840 WIKIOI——评测 时间限制: 1 s 空间限制: 2000 KB 题目等级 : 白银 Silver 题目描述 Description Wikioi上有一题有N个测试点,时限为 3 #include<cstring> 4 using namespace std; 5 int tot; 6 int main() 7 { 8 int n,maxtime; 9

    1.5K80发布于 2018-04-13
  • 来自专栏搜狗测试

    不可缺少的评测方案-主观性能感知评测

    “主观性能感知评测”。 该评测选取主要使用场景,由人工操作与竞品对比,根据执行人员的主观感受来评测应用的流畅度,下面来介绍一下如何制定主观性能评测方案。 APP选取 1. 制定评测标准 由于本评测为主观性能评测,不会有详细数据输出,因此就以是否卡顿制定标准,制定标准如下: 1. 流畅:无任何卡顿感觉,使用顺畅; 2. 一般流畅:没有明显的卡顿感觉,用户难以感知; 3. ,网络环境需要保持一致,最好不要切换网络,如果网络情况不佳,建议更换一个稳定的网络进行评测; 3.每次执行评测时,应用版本不能更换; 4.每次执行评测时,执行人员不能更换; 执行测试 根据测试方案执行表格中的 总结 主观性能感知评测,在评测中是不可缺少的,能直观的反映出应用与竞品在用户使用层面的差距。

    1.7K10发布于 2020-06-04
  • 来自专栏搬砖笔记

    Linux评测Bench脚本

    中文脚本 wget -N --no-check-certificate https://raw.githubusercontent.com/FunctionClub/ZBench/master/ZBench-CN.sh && bash ZBench-CN.sh 英文脚本: wget -N --no-check-certificate https://raw.githubusercontent.com/FunctionClub/ZBench/master/ZBench.sh && bash ZBench.s

    2.6K10编辑于 2021-12-13
  • 来自专栏搜狗测试

    如何设计评测方案

    作为测试,所在项目组上线一个新功能或者评估核心功能品质时,都需要通过评测进行定量评估效果。那么怎样才能更好的评估功能效果,设计出合理的评测方案呢?今天我们以评测功能效果的评测设计方案为例进行讲解。 一、明确评测目的 任何一件事情都是以目标为导向,目标不同,采取的行动方式也会不同。所以,明确评测的目的特别重要。 对要评测功能的实现逻辑掌握程度,决定着思考的评测方案的全面性和合理性。因为只有了解了功能的运行框架逻辑,我们才能分析出哪些因素会影响评估结果,以及评测的维度如何选取。 四、确定评测指标 确定评测维度后,要考虑的就是横向指标。通过评测目的进行指标的演化和拆解,抽取关注的指标。然后通过指标进行二次拆解,分析哪些数据会影响指标的数值。 六、评测执行过程设计 设计评测方案分为两部分:评测执行过程和数据集。 通过前期工作的准备,其实我们已经完成了事情的80%。

    1.7K20发布于 2020-01-02
  • ——2025年9月最新评测与腾讯云CodeBuddy深度解析

    本文梳理 2025 年 9 月最热门的 5 款 AI 编程助手,并用一张表格一次性对比模型、价格、优惠与场景差异;随后深度拆解腾讯云官方新品「腾讯云代码助手 CodeBuddy」的核心能力、定价策略与 9 月限时活动,帮助你在 3 分钟内选出最趁手的 AI 搭档。 免费额度 付费方案(9 月官网) 9 月促销 典型场景 备注 官方页面:https://copilot.tencent.com/(以下信息均来自该页面与 9 月实时抓取) Craft 智能体:一句话生成可运行项目 在 VS Code 侧边栏点「Craft」,输入“ 腾讯云代码助手 CodeBuddy 用 9 月的诚意定价和中文深度优化,给出了一个难以拒绝的答案。

    3.4K10编辑于 2025-09-02
  • ——2025年9月最新评测与腾讯云CodeBuddy深度解析

    免费额度 付费价格(9月官网) 9月促销 亮点 短板 企业团队:CodeBuddy 企业版支持私有化+MCP生态,9月首购7折,折算后每人最低¥24/月,比Copilot便宜近50%。 企业版:按调用量后付费,9月活动送 50 万 token 试用券,且数据全程落在中国境内,满足金融、政企合规要求。 领取9月优惠:登录 https://copilot.tencent.com/ → 点击“限时活动” → 企业用户输入优惠码“FALL2025”立享7折。 结语 如果你追求极致中文体验、企业级合规以及“一句话生成项目”的效率,腾讯云 CodeBuddy 是2025年9月最值得投入的AI编程工具。

    3.5K10编辑于 2025-09-02
  • 来自专栏LuckQI

    小牛币(MVC)评测

    黄埔一期冠军小牛币(MVC) 朋友您好! 先说得分和结论:小牛链64.7分,中上等。 这个项目启动也快一年了,所以我把它看作是一个成长中的项目,在评估它时,主要考虑三方面:所处行业,团队配置,生态建设。 评估过程如下(结果已给,以下内容为选读) 所处行业。权重50%。 ◆主要的目标:22/40分。 小牛链想做的事情略大,简单地说,有点像本体+比原链——一方面为开发者提供便捷的开发界面,另一方面又要想把实体资产代币化,转换成数字资产,个人对小牛这种双线作战的想法

    1.6K50发布于 2018-07-19
  • 来自专栏LuckQI

    cybermiles(CMT)项目评测

    草莓糖已评测完毕。 先说得分和结论:cmt,58.7分,中等。 感觉自己下手似乎有点狠,可能后续需要进行动态跟踪和评估。 具体推理过程如下。

    96630发布于 2018-07-19
  • 来自专栏PHP学习网

    PHP技能评测(二)

    符合c/c++的习惯,效率还高”; 9、对global变量,应该用完就unset()掉; 7、mysql 执行show procedure,发现进程偏多并且80%为sleep状态,请问可能出现的现象和优化方案

    67420编辑于 2022-08-03
  • 来自专栏个性化推荐评测

    TTS系统评测方法介绍--WSRD AI评测实验室

    AI评测实验室针对TTS前端、后端的存在的问题,选取TTS评测指标,制定各指标评测方法,形成了一套系统的TTS评测方案。 二、评测指标介绍 针对上文提到的前后端可能存在的问题,选择如下指标来评测TTS。 [l9coo8tlaj.jpg] 发音准确性 线上语料中频繁出现的多音字、数字、符号、夹杂英文会给TTS前端带来很大的挑战,对这类case的发音错误会给用户带来较差的体验。 [lf3hxj32az.png] 三、评测方法介绍 本章详细介绍评测时重点关注的发音准确性评测和MOS评测。 语料建设 前端的评测通过发音准确、韵律准确等来评测,MOS评测应该专注于整体自然度,因此准备测试语料的时候尽量避开了多音字、符号、数字语料,从各领域和TTS实际应用场景摘选常规文本作为测试语料。

    18.7K115发布于 2018-07-02
  • 来自专栏腾讯移动品质中心TMQ的专栏

    视频负反馈评测

    视频评测 1、获取视频vid 评测的模型训练完成后,就可以用来评测线上的数据了。线上数据的获取,视频这边是从播放记录拿的数据。 2、获取视频评论 将评测的脚本放到公司的 Docker上,评测脚本每天定时执行。执行时从 mdb 获取 vid,然后脚本根据 vid 获取视频的评论。 ? 3、开始评测 将一个视频的所有评论使用模型评测,如果评论结果为问题视频(根据负面视频的占比),还会将该 vid 对应的信息补全(视频标题,封面图等信息)方面后期运营同学处理评测结果。 ? 结果处理 1、人工下线视频 模型评测出的视频,不会是 100% 的问题视频,总会有失误的情况。因此将评测出的视频放到了一个 mdb 的表里面,由运营同学再次人工审核下线,而不是直接下线。 3、模型结果和优化 当前的的评测模型每天能识别出 100 多个问题视频,经过人工确认的视频有 40-80 个,占比 70% 左右。运营同学手工确认的问题视频,后台也会收集用来优化模型。 ?

    2.5K100发布于 2018-05-11
  • 来自专栏搜狗测试

    语音评测之——websocket

    前言 前段时间小编收到一份测试任务要求对搜狗输入法的语音功能进行评测评测任务主要拆分为评测语料的选取和整理,硬件的调研和采购,评测工具的开发以及评测的执行和结果整理。 小编负责评测工具服务端的开发工作,主要使用了websocket的技术,此次与大家做一个简单的分享。 评测过程 语音的评测过程中由web端连接音响实现语音的播放功能,手机客户端接收语音并处理。 在本次评测过程中由于客户端与服务端通信频繁,且对实时性要求较高,开始便考虑使用长连接的方式。 Upgrade: websocket Connection: Upgrade Host: example.com Origin: http://example.com Sec-WebSocket-Key: sN9cRrP /n9NdMgdcy2VJFQ== Sec-WebSocket-Version: 13 服务器回应 HTTP/1.1 101 Switching Protocols Upgrade: websocket

    4.9K10发布于 2020-03-03
领券