搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏嵌入式iot
BeagleBone AI VS Raspberry 4评测
BeagleBone AI VS Raspberry 4评测 1.本文概述 2.主控与外设 2.1 主控 2.2 外设 3.上手把玩与定位 3.1树莓派上手流程 3.2 狗板AI上手方法1 3.3 狗板 AI上手方法2 3.4 狗板AI上手方法3 4.对比总结 1.本文概述最近一直在研究树莓派4和BeagleBone AI。树莓派4的实物图如下： ? 两者的外形设计都比较精致，便携性和可玩性都很高。 2.2 外设树莓派4和狗板AI的外设对比如下：配置树莓派4 狗板AI WIFI+蓝牙 802.11ac(2.4/5GHz)蓝牙5.0 802.11ac(2.4/5GHz)蓝牙5.0 USB USB2.0x2 4.将卡插入树莓派卡槽。
2.4K10发布于 2020-11-17
来自专栏VRPinea
评测：2499元的PICO 4值得入手吗？
空间定位和彩色透视也是此次PICO 4较为明显的升级之处。 PICO 4的分辨率是2160*2160，PPI是1200。色彩明艳度和画面细腻程度较之上代设备，具有显著的提升。值得一提的是，PICO 4的视场角竟然达到了105°。同时，基于骁龙XR2芯片，PICO 4实现了硬解8K视频的能力。在此之前，国内也就仅有一家电视厂商旗下的一体机能够达到同等高度。可以说，PICO 4是第一代能够真正意义上实现沉浸式观影的VR头显。内容生态此次，PICO 4巧妙地将生态建设的重点放在了运动健身版块。况且Meta Quest系列进不了大陆市场，2499元的起步价也使得PICO 4在价格上具备明显优势，这也为PICO 4出海竞争提供了机遇。具体的评测可以看老缪的视频。
1.6K30编辑于 2022-11-17
Grok 4 最新技术评测与发布指南
Grok 4核心性能评测重磅跑分数据曝光根据最新泄露的基准测试结果，Grok 4在多项关键评测中表现惊艳，如果这些泄露的测试结果属实，那么意味着Grok 4通过了AI基准测试中最艰难的一关。核心跑分对比表：评测项目 Grok 4 Grok 4 (推理模式) OpenAI o3 Claude 4 Opus Gemini 2.5 Pro HLE (人类最后考试) 35% 45% ~20% 从评测数据来看，这次确实有点"炸场"的意思——HLE 45%的成绩几乎是竞争对手的两倍，AIME 95%的数学能力更是"吊打"一众对手。核心评测总结：绝对优势领域：数学推理：AIME 95%，远超Claude 4的34% 人文考试：HLE 45%，是Gemini 2.5的两倍编程能力：SWE-Bench 72-75%，与Claude 本文基于最新泄露的评测数据和公开信息整理，实际性能以官方正式发布为准。AI江湖风起云涌，让我们拭目以待Grok 4的正式表现！
8.7K81编辑于 2025-07-11
来自专栏喔家ArchiSelf
如何评测语音技能的智能程度（4）——人格特质
《如何评测语音技能的智能程度》是5篇系列文字，来自一位创业者，也是DuerOS开发者的投稿，老曹尽量不做变动和评价，尽量保持系列文章的原貌，这是第4篇。要从人的思维和感官层面来考虑，他的4册《设计心理学》、《情感化设计》等著作至今都是设计专业必读书目，同时也是我们公司设计师以及产品经理的必修课，为我们打造智能语音助手指引了方向。前三篇文章，依次拆解了【意图理解】、【服务提供】、【交互流畅】三个维度，如果这些维度的各个评测指标全部达标，即是一款水平线以上的智能语音助手，但是距离“令人愉悦和兴奋”还少了一个维度，即——人格化。【人格特质】（4）情商/共情表现情商和共情能力属于高阶能力，根据用户的描述，响应对应内容。 ? “共情”是人们把自己真实的心灵感受，主动投射到自己所看到的事物上的一种心理现象。
4.4K20发布于 2020-06-09
来自专栏搜狗测试
软件品质评测系统-评测体系
2 ● 评测体系的内容 ● 评测体系可大可小，根据评测的内容而有所不同，一个完整的评测体系应包含：评测对象评测属性评测场景评测指标在进行评测体系的设计之前，首先应明确评测对象是什么，可以大到一个系统有了评测对象后，根据产品的需求或者应解决的问题，就可以确认哪些评测属性，比如准确度，覆盖度，再比如多样性，健壮性等。评测属性再向下，确认好评测属性的应用场景及指标项，综合形成评测矩阵。将以上结合，就是一个完整的评测体系。 ? 3 ● 评测体系的设计方法 ● 评测对象相对来说比较明确，接下来就是被测对象的特质进行评测属性的选择，以及确认好评测属性后进行评测矩阵的划分。评测场景的选择确认好了评测属性以后，接下来就是针对评测属性进行评测场景的覆盖及指标项的选择。评测场景一般是根据实际应用场景结合实现细节进行敲定。 4 ● 总结 ● 文章最后要说明的是，评测体系不是设计完后就一成不变的，需要根据产品的战略方向，以及用户的反馈意见不断的迭代更新和完善，要带着审视的眼光不断的反思和总结，这样才能保证全面直观，尽早的发现问题
3.5K20发布于 2020-07-14
来自专栏搜狗测试
软件品质评测系统-评测结果展示
1 ● 为什么要进行数据展示 ● 在前几次的分享中，设计了好的评测体系、具备了数据挖掘分析能力、选择高效稳定的评测执行工具后，我们会拿到第一手的评测数据。在我们之前的实践过程中，拿到原始评测数据后会通过观察数据给出一个评测结论。长此以往发现这样并不利于保存数据记录，并且没法反映出一段时间内评测指标的变化趋势。 2 ● 哪些数据需要展现 ● 评测结果展现对于在评测设计时选定的评测指标，需要准确完整地展现在评测系统中。我们据此设计了一个评测的结果报告，每次评测完成后会通过该报告给出评测结论： ? 4 ● 总结 ● 需要说明的是，对于评测结果的展示并不是一成不变的。本文只是列举了一些通用的原则和方法，权当抛砖引玉。
3.2K20发布于 2020-08-11
来自专栏前行的CVer
LLM评测
使用 GPT-4 作为基准的 AI 系统的正确率有39%。共有2556个query，每个query需要2～4个文档。 3. 中文 Benchmark 通用&数学&code——OpenCompass 司南，会分中文榜单和英文榜单。每个问题是一个多项选择题，有4个选项，只有一个正确答案。 Chinese Evaluation Suite) 是一个综合性的中文评估基准数据集，反映中国特定的知识和文化背景，包含13,948个多项选择题，涵盖中国语言文学、计算机网络、法律等52个不同学科，分为4个难度级别 4.
2.2K10编辑于 2024-08-05
来自专栏音视频技术
MSU发布2020年度4K编码效率评测结果
MSU发布了2020年对4K视频编码效率评测结果，公开发布的数据见这里（http://compression.ru/video/codec_comparison/hevc_2019/#4k_report
1.3K40发布于 2020-05-21
【AGI-Eval评测报告NO.4】多模态开箱评测，五大厂商跨模态 battle 谁更强？
AGI-Eval 团队现在正在做视频通话产品的跨模态交互开箱评测，本次评测带大家解锁五位能睁眼说话、开口就接梗的 AI 头部模型。目录：1. 评测结论2. 能力榜单3. 评测方案4. 评测结论先给现有市面可支持实时视频对话的大模型排个序，讯飞星火位于第一梯队（Average Ranking 1.4）；GPT4o 及智谱清言位于第二梯队（Average Ranking 2.2 vs 2.9 评测量级: 依据日常生活相关的数据构建框架下在每个模型上构建10条数据4. 评测模型界面5个模型对比来看，在输入部分都没有差别，界面上其他模型都可支持语音对话打断，仅理想同学需手动打断；输出上讯飞星火、智谱清言、GPT 4o都支持语音、支持自动转录文本，Qwen2.5-omni 左右滑动查看五大模型评测页面，依次为理想同学、讯飞星火、智谱清言、GPT4o、Qwen2.5-omni05.评测实例我们将这 5 个头部 AI 大模型同框竞技，待测的模型需要在 3 分钟左右的时间内与用户进行实时视频交互
1.7K10编辑于 2025-04-09
【AGI-Eval评测报告 NO.6】o3 o4-mini 文本权威评测：o3 强势登顶
目录： 1. o3 和 o4 mini评测分析 1.1 评测概述 1.2 o3 评测结果 1.3 o4-mini评测结果 2. o3 和 o4 mini 信息回顾 1.o3 和 o4 mini评测分析 1.1 评测概述【评测对象】 OpenAI-o3 与 OpenAI-o4-mini 【评测方式】基于自建的通用能力评测集与公开评测集【评测结论】 ① o3 毫无悬念的登顶，在交互能力接下来我们继续为大家拆解 o3 和 o4-mini 的详细评测内容 1.2 o3 评测结果 o3 核心结论： o3 在综合能力上表现优异，尤其在交互能力、推理能力和指令遵循方面处于领先地位。 1.3 o4-mini 评测结果 o4-mini 核心结论： o4-mini 处于推理模型第一梯队，和 o1 能力相当，但相较 o3 仍有差距；o4-mini 处于小型推理模型 Top1。 * 评测指标是被评测模型相对于标杆模型的五档加权胜率 *标杆模型为 GPT4-turbo-0125 评测方案：可点击阅读原文跳转官网，评测榜单处点击评测方案查看 2.o3 和 o4 mini 实测回顾
54110编辑于 2025-05-08
来自专栏AI科技评论
零一万物 Yi 大模型最新评测，英语能力仅次于 GPT-4
其中，斯坦福大学研发的大语言模型评测 AlpacaEval Leaderboard 备受瞩目。在五花八门的大模型评测中，伯克利LMSYS ORG排行榜采用了一个最为接近用户体感的 “聊天机器人竞技场” 特殊测评模式，让众多大语言模型在评测平台随机进行一对一 battle，通过众筹真实用户来进行线上实时盲测和匿名投票根据11月底发布的《SuperCLUE中文大模型基准评测报告 2023》，11月下旬首度发布的 Yi-34B Chat在多项基准评测中的 “SuperCLUE 大模型对战胜率” 这项关键指标上，Yi-34B-Chat 取得31.82%的胜率，仅次于GPT4-Turbo。中文SuperCLUE排行榜（发布于2023年11月28日） Yi-34B-Chat 微调模型还为开发者提供了 4bit/8bit 量化版模型；Yi-34B-Chat 4bit 量化版模型可以直接在消费级显卡
1.6K10编辑于 2023-12-12
来自专栏低代码平台
Claude Code + DeepSeek V4-Pro 真实评测：除了贵，没别的毛病
ClaudeCode+DeepSeekV4-Pro真实评测：除了贵，没别的毛病JeecgBootAI专题研究|把ClaudeCode接入DeepSeekV4-Pro，跑完Skills——OA审批、大屏、 DeepSeek刚好发布了V4系列预览版，包含V4-Pro（1.6T参数49B激活）和V4-Flash（284B参数13B激活），并且提供了兼容Anthropic协议的API端点——只需改一行配置，就能用 -pro"}逻辑清晰：重量级任务走V4-Pro，轻量任务走V4-Flash。整个过程完全无感，如果不是终端上写着deepseek-v4-pro，我甚至以为自己在用Claude原生模型。改文档这类任务对V4-Pro来说属于"降维打击"，速度快、理解准、输出干净。测试环境：ClaudeCodev2.1.119，DeepSeekV4-Pro（deepseek-v4-pro），2026-04-24本文为JeecgBootAI专题研究系列文章。
8.2K01编辑于 2026-04-24
来自专栏LuckQI
icx项目评测
（注：在评测公链项目时，我把“使用区块链的必要性”调整为了“产品特色与创新”） ◆代币升值逻辑：16/40 这一点看的有点困惑，感觉icon项目代币升值逻辑的不确定性主要体现在两个方面：一是每年增发与否取决于一个名叫
1.7K20发布于 2018-07-19
来自专栏PHP学习网
PHP技能评测
公司出了一些自我评测的PHP题目，其中好多题目在面试的时候都会碰到，大家可以看看学习学习。 1. 魔术函数有哪些,分别在什么时候调用? FALSE 若变量存在且值不为NULL，则返回 TURE 同时检查多个变量时，每个单项都符合上一条要求时才返回 TRUE，否则结果为 FALSE 版本：PHP 3, PHP 4, 则返回 TURE 若变量存在且值不为""、0、"0"、NULL、、FALSE、array()、var $var; 以及没有任何属性的对象，则返回 FALSE 版本：PHP 3, PHP 4, ◆4.DELETE FROM table时，InnoDB不会重新建立表，而是一行一行的删除。　　使用复合索引时遵循最左前缀集合 4、唯一索引或者非唯一索引 5、空间索引：空间索引是对空间数据类型的字段建立的索引，MYSQL中的空间数据类型有4种，分别是GEOMETRY、POINT
1.6K30编辑于 2022-08-03
来自专栏LuckQI
项目评测etherparty
●总得分：51.1/100分想做的目标很好，但是产品特色和目前的团队配置可能还需要进一步的补强，未来也有必要根据后续的推动情况，作进一步的动态评测。
1.7K20发布于 2018-07-19
来自专栏数据结构与算法
2840 WIKIOI——评测
2840 WIKIOI——评测时间限制: 1 s 空间限制: 2000 KB 题目等级 : 白银 Silver 题目描述 Description Wikioi上有一题有N个测试点，时限为分类标签 Tags 点此展开 1 #include<iostream> 2 #include<cstdio> 3 #include<cstring> 4 using namespace
1.6K80发布于 2018-04-13
来自专栏【腾讯云开发者】
Grok4最新评测&群消息已读回执背后的架构技术
01《Grok 4 最新技术评测与发布指南》作者：华医科技CIO蓝葛亮引言：马斯克跳过Grok 3.5直接发布Grok 4，计划在7月4日后上线，专注编程模型优化，这次“极限迭代”能否让马斯克在来看看华医科技CIO蓝葛亮怎么说节选金句： “人类最后考试”的突破 Grok 4在HLE上达到了惊人的45%，几乎是Gemini 2.5 Pro成绩的两倍。点击链接查看原文： Grok 4 最新技术评测与发布指南 02《群消息已读回执，为什么这么难？》
36810编辑于 2025-07-17
来自专栏新智元
Meta评测4个领先视觉模型，LeCun转赞
ConvNet/ViT、supervised/CLIP模型，在ImageNet之外的指标上如何相互比较？
53710编辑于 2024-01-18
来自专栏搜狗测试
不可缺少的评测方案-主观性能感知评测！
“主观性能感知评测”。该评测选取主要使用场景，由人工操作与竞品对比，根据执行人员的主观感受来评测应用的流畅度，下面来介绍一下如何制定主观性能评测方案。 APP选取 1. 有点卡：使用过程中有轻微的卡顿感觉，用户能感知； 4. ，网络环境需要保持一致，最好不要切换网络，如果网络情况不佳，建议更换一个稳定的网络进行评测； 3．每次执行评测时，应用版本不能更换； 4．每次执行评测时，执行人员不能更换；执行测试根据测试方案执行表格中的总结主观性能感知评测，在评测中是不可缺少的，能直观的反映出应用与竞品在用户使用层面的差距。
1.8K10发布于 2020-06-04
来自专栏个性化推荐评测
TTS系统评测方法介绍--WSRD AI评测实验室
AI评测实验室针对TTS前端、后端的存在的问题，选取TTS评测指标，制定各指标评测方法，形成了一套系统的TTS评测方案。二、评测指标介绍针对上文提到的前后端可能存在的问题，选择如下指标来评测TTS。 [lf3hxj32az.png] 三、评测方法介绍本章详细介绍评测时重点关注的发音准确性评测和MOS评测。数字进制：被测系统应该按照汉语习惯对数字的进制正确发音，如宝马4系列的轿车需要896,500元，“896,500”应展开为“八十九万六千五百”。当前TTS得分大都高于4分，因此我们在传统MOS五档分值中加入了4.5分档，打分及描述如下：表格评测方法分别合成被测TTS、对照TTS的语音，并且录制一份声优语音混入一起测试，注意录制时各类语音参数应保持一致
19.1K115发布于 2018-07-02

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

BeagleBone AI VS Raspberry 4评测

评测：2499元的PICO 4值得入手吗？

Grok 4 最新技术评测与发布指南

如何评测语音技能的智能程度（4）——人格特质

软件品质评测系统-评测体系

软件品质评测系统-评测结果展示

LLM评测

MSU发布2020年度4K编码效率评测结果

【AGI-Eval评测报告NO.4】多模态开箱评测，五大厂商跨模态 battle 谁更强？

【AGI-Eval评测报告 NO.6】o3 o4-mini 文本权威评测：o3 强势登顶

零一万物 Yi 大模型最新评测，英语能力仅次于 GPT-4

Claude Code + DeepSeek V4-Pro 真实评测：除了贵，没别的毛病

icx项目评测

PHP技能评测

项目评测etherparty

2840 WIKIOI——评测

Grok4最新评测&群消息已读回执背后的架构技术

Meta评测4个领先视觉模型，LeCun转赞

不可缺少的评测方案-主观性能感知评测！

TTS系统评测方法介绍--WSRD AI评测实验室

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐