首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏嵌入式iot

    BeagleBone AI VS Raspberry 4评测

    BeagleBone AI VS Raspberry 4评测 1.本文概述 2.主控与外设 2.1 主控 2.2 外设 3.上手把玩与定位 3.1树莓派上手流程 3.2 狗板AI上手方法1 3.3 狗板 AI上手方法2 3.4 狗板AI上手方法3 4.对比总结 1.本文概述 最近一直在研究树莓派4和BeagleBone AI。 树莓派4的实物图如下: ? 两者的外形设计都比较精致,便携性和可玩性都很高。 2.2 外设 树莓派4和狗板AI的外设对比如下: 配置 树莓派4 狗板AI WIFI+蓝牙 802.11ac(2.4/5GHz)蓝牙5.0 802.11ac(2.4/5GHz)蓝牙5.0 USB USB2.0x2 4.将卡插入树莓派卡槽。

    2.3K10发布于 2020-11-17
  • Grok 4 最新技术评测与发布指南

    Grok 4核心性能评测 重磅跑分数据曝光 根据最新泄露的基准测试结果,Grok 4在多项关键评测中表现惊艳,如果这些泄露的测试结果属实,那么意味着Grok 4通过了AI基准测试中最艰难的一关。 核心跑分对比表: 评测项目 Grok 4 Grok 4 (推理模式) OpenAI o3 Claude 4 Opus Gemini 2.5 Pro HLE (人类最后考试) 35% 45% ~20% 从评测数据来看,这次确实有点"炸场"的意思——HLE 45%的成绩几乎是竞争对手的两倍,AIME 95%的数学能力更是"吊打"一众对手。 核心评测总结: 绝对优势领域: 数学推理:AIME 95%,远超Claude 4的34% 人文考试:HLE 45%,是Gemini 2.5的两倍 编程能力:SWE-Bench 72-75%,与Claude 本文基于最新泄露的评测数据和公开信息整理,实际性能以官方正式发布为准。AI江湖风起云涌,让我们拭目以待Grok 4的正式表现!

    8.5K81编辑于 2025-07-11
  • 来自专栏VRPinea

    评测:2499元的PICO 4值得入手吗?

    空间定位和彩色透视也是此次PICO 4较为明显的升级之处。 PICO 4的分辨率是2160*2160,PPI是1200。色彩明艳度和画面细腻程度较之上代设备,具有显著的提升。 值得一提的是,PICO 4的视场角竟然达到了105°。 同时,基于骁龙XR2芯片,PICO 4实现了硬解8K视频的能力。在此之前,国内也就仅有一家电视厂商旗下的一体机能够达到同等高度。可以说,PICO 4是第一代能够真正意义上实现沉浸式观影的VR头显。 内容生态 此次,PICO 4巧妙地将生态建设的重点放在了运动健身版块。 况且Meta Quest系列进不了大陆市场,2499元的起步价也使得PICO 4在价格上具备明显优势,这也为PICO 4出海竞争提供了机遇。 具体的评测可以看老缪的视频。

    1.4K30编辑于 2022-11-17
  • 来自专栏喔家ArchiSelf

    如何评测语音技能的智能程度(4)——人格特质

    《如何评测语音技能的智能程度》是5篇系列文字,来自一位创业者,也是DuerOS开发者的投稿,老曹尽量不做变动和评价,尽量保持系列文章的原貌,这是第4篇。 要从人的思维和感官层面来考虑,他的4册《设计心理学》、《情感化设计》等著作至今都是设计专业必读书目,同时也是我们公司设计师以及产品经理的必修课,为我们打造智能语音助手指引了方向。 前三篇文章,依次拆解了【意图理解】、【服务提供】、【交互流畅】三个维度,如果这些维度的各个评测指标全部达标,即是一款水平线以上的智能语音助手,但是距离“令人愉悦和兴奋”还少了一个维度,即——人格化。 【人格特质】(4)情商/共情表现 情商和共情能力属于高阶能力,根据用户的描述,响应对应内容。 ? “共情”是人们把自己真实的心灵感受,主动投射到自己所看到的事物上的一种心理现象。

    3.6K20发布于 2020-06-09
  • 来自专栏搜狗测试

    软件品质评测系统-评测体系

    2 ● 评测体系的内容 ● 评测体系可大可小,根据评测的内容而有所不同,一个完整的评测体系应包含: 评测对象 评测属性 评测场景 评测指标 在进行评测体系的设计之前,首先应明确评测对象是什么,可以大到一个系统 有了评测对象后,根据产品的需求或者应解决的问题,就可以确认哪些评测属性,比如准确度,覆盖度,再比如多样性,健壮性等。 评测属性再向下,确认好评测属性的应用场景及指标项,综合形成评测矩阵。 将以上结合,就是一个完整的评测体系。 ? 3 ● 评测体系的设计方法 ● 评测对象相对来说比较明确,接下来就是被测对象的特质进行评测属性的选择,以及确认好评测属性后进行评测矩阵的划分。 评测场景的选择 确认好了评测属性以后,接下来就是针对评测属性进行评测场景的覆盖及指标项的选择。评测场景一般是根据实际应用场景结合实现细节进行敲定。 4 ● 总结 ● 文章最后要说明的是,评测体系不是设计完后就一成不变的,需要根据产品的战略方向,以及用户的反馈意见不断的迭代更新和完善,要带着审视的眼光不断的反思和总结,这样才能保证全面直观,尽早的发现问题

    3.1K20发布于 2020-07-14
  • 来自专栏搜狗测试

    软件品质评测系统-评测结果展示

    1 ● 为什么要进行数据展示 ● 在前几次的分享中,设计了好的评测体系、具备了数据挖掘分析能力、选择高效稳定的评测执行工具后,我们会拿到第一手的评测数据。 在我们之前的实践过程中,拿到原始评测数据后会通过观察数据给出一个评测结论。长此以往发现这样并不利于保存数据记录,并且没法反映出一段时间内评测指标的变化趋势。 2 ● 哪些数据需要展现 ● 评测结果展现 对于在评测设计时选定的评测指标,需要准确完整地展现在评测系统中。 我们据此设计了一个评测的结果报告,每次评测完成后会通过该报告给出评测结论: ? 4 ● 总结 ● 需要说明的是,对于评测结果的展示并不是一成不变的。本文只是列举了一些通用的原则和方法,权当抛砖引玉。

    2.8K20发布于 2020-08-11
  • 来自专栏前行的CVer

    LLM评测

    使用 GPT-4 作为基准的 AI 系统的正确率有39%。 共有2556个query,每个query需要2~4个文档。 3. 中文 Benchmark 通用&数学&code——OpenCompass 司南,会分中文榜单和英文榜单。 每个问题是一个多项选择题,有4个选项,只有一个正确答案。 Chinese Evaluation Suite) 是一个综合性的中文评估基准数据集,反映中国特定的知识和文化背景,包含13,948个多项选择题,涵盖中国语言文学、计算机网络、法律等52个不同学科,分为4个难度级别 4.

    1.7K10编辑于 2024-08-05
  • 【AGI-Eval评测报告NO.4】多模态开箱评测,五大厂商跨模态 battle 谁更强?

    AGI-Eval 团队现在正在做视频通话产品的跨模态交互开箱评测,本次评测带大家解锁五位能睁眼说话、开口就接梗的 AI 头部模型。目录:1. 评测结论2. 能力榜单3. 评测方案4. 评测结论先给现有市面可支持实时视频对话的大模型排个序,讯飞星火位于第一梯队(Average Ranking 1.4);GPT4o 及智谱清言位于第二梯队(Average Ranking 2.2 vs 2.9 评测量级: 依据日常生活相关的数据构建框架下在每个模型上构建10条数据4. 评测模型界面5个模型对比来看,在输入部分都没有差别,界面上其他模型都可支持语音对话打断,仅理想同学需手动打断;输出上讯飞星火、智谱清言、GPT 4o都支持语音、支持自动转录文本,Qwen2.5-omni 左右滑动查看五大模型评测页面,依次为理想同学、讯飞星火、智谱清言、GPT4o、Qwen2.5-omni05.评测实例我们将这 5 个头部 AI 大模型同框竞技,待测的模型需要在 3 分钟左右的时间内与用户进行实时视频交互

    1.2K10编辑于 2025-04-09
  • 来自专栏音视频技术

    MSU发布2020年度4K编码效率评测结果

    MSU发布了2020年对4K视频编码效率评测结果,公开发布的数据见这里 (http://compression.ru/video/codec_comparison/hevc_2019/#4k_report

    1.3K40发布于 2020-05-21
  • 【AGI-Eval评测报告 NO.6】o3 o4-mini 文本权威评测:o3 强势登顶

    目录: 1. o3 和 o4 mini评测分析    1.1 评测概述    1.2 o3 评测结果    1.3 o4-mini评测结果 2. o3 和 o4 mini 信息回顾 1.o3 和 o4 mini评测分析 1.1 评测概述 【评测对象】 OpenAI-o3 与 OpenAI-o4-mini 【评测方式】 基于自建的通用能力评测集与公开评测集 【评测结论】 ① o3 毫无悬念的登顶,在交互能力 接下来我们继续为大家拆解 o3 和 o4-mini 的详细评测内容 1.2  o3 评测结果 o3 核心结论: o3 在综合能力上表现优异,尤其在交互能力、推理能力和指令遵循方面处于领先地位。 1.3 o4-mini 评测结果 o4-mini 核心结论: o4-mini 处于推理模型第一梯队,和 o1 能力相当,但相较 o3 仍有差距;o4-mini 处于小型推理模型 Top1。 * 评测指标是被评测模型相对于标杆模型的五档加权胜率 *标杆模型为 GPT4-turbo-0125 评测方案:可点击阅读原文跳转官网,评测榜单处点击评测方案查看 2.o3 和 o4 mini 实测回顾

    42710编辑于 2025-05-08
  • 来自专栏AI科技评论

    零一万物 Yi 大模型最新评测,英语能力仅次于 GPT-4

    其中,斯坦福大学研发的大语言模型评测 AlpacaEval Leaderboard 备受瞩目。 在五花八门的大模型评测中,伯克利LMSYS ORG排行榜采用了一个最为接近用户体感的 “聊天机器人竞技场” 特殊测评模式,让众多大语言模型在评测平台随机进行一对一 battle,通过众筹真实用户来进行线上实时盲测和匿名投票 根据11月底发布的《SuperCLUE中文大模型基准评测报告 2023》,11月下旬首度发布的 Yi-34B Chat在多项基准评测中的 “SuperCLUE 大模型对战胜率” 这项关键指标上,Yi-34B-Chat 取得31.82%的胜率,仅次于GPT4-Turbo。 中文SuperCLUE排行榜(发布于2023年11月28日) Yi-34B-Chat 微调模型还为开发者提供了 4bit/8bit 量化版模型;Yi-34B-Chat 4bit 量化版模型可以直接在消费级显卡

    1.4K10编辑于 2023-12-12
  • 来自专栏PHP学习网

    PHP技能评测

    公司出了一些自我评测的PHP题目,其中好多题目在面试的时候都会碰到,大家可以看看学习学习。 1. 魔术函数有哪些,分别在什么时候调用?     FALSE     若变量存在且值不为NULL,则返回 TURE     同时检查多个变量时,每个单项都符合上一条要求时才返回 TRUE,否则结果为 FALSE     版本:PHP 3, PHP 4, 则返回 TURE     若变量存在且值不为""、0、"0"、NULL、、FALSE、array()、var $var; 以及没有任何属性的对象,则返回 FALSE     版本:PHP 3, PHP 4, ◆4.DELETE FROM table时,InnoDB不会重新建立表,而是一行一行的删除。    使用复合索引时遵循最左前缀集合     4、唯一索引或者非唯一索引     5、空间索引:空间索引是对空间数据类型的字段建立的索引,MYSQL中的空间数据类型有4种,分别是GEOMETRY、POINT

    1.4K30编辑于 2022-08-03
  • 来自专栏LuckQI

    项目评测etherparty

    ●总得分:51.1/100分 想做的目标很好,但是产品特色和目前的团队配置可能还需要进一步的补强,未来也有必要根据后续的推动情况,作进一步的动态评测

    1.6K20发布于 2018-07-19
  • 来自专栏LuckQI

    icx项目评测

    (注:在评测公链项目时,我把“使用区块链的必要性”调整为了“产品特色与创新”) ◆代币升值逻辑:16/40 这一点看的有点困惑,感觉icon项目代币升值逻辑的不确定性主要体现在两个方面: 一是每年增发与否取决于一个名叫

    1.6K20发布于 2018-07-19
  • 来自专栏数据结构与算法

    2840 WIKIOI——评测

    2840 WIKIOI——评测 时间限制: 1 s 空间限制: 2000 KB 题目等级 : 白银 Silver 题目描述 Description Wikioi上有一题有N个测试点,时限为 分类标签 Tags 点此展开 1 #include<iostream> 2 #include<cstdio> 3 #include<cstring> 4 using namespace

    1.5K80发布于 2018-04-13
  • 来自专栏【腾讯云开发者】

    Grok4最新评测&群消息已读回执背后的架构技术

    01《Grok 4 最新技术评测与发布指南》 作者:华医科技CIO蓝葛亮 引言: 马斯克跳过Grok 3.5直接发布Grok 4,计划在7月4日后上线,专注编程模型优化,这次“极限迭代”能否让马斯克在 来看看华医科技CIO蓝葛亮怎么说 节选金句: “人类最后考试”的突破 Grok 4在HLE上达到了惊人的45%,几乎是Gemini 2.5 Pro成绩的两倍。 点击链接查看原文: Grok 4 最新技术评测与发布指南 02《群消息已读回执,为什么这么难?》

    27310编辑于 2025-07-17
  • 来自专栏新智元

    Meta评测4个领先视觉模型,LeCun转赞

    ConvNet/ViT、supervised/CLIP模型,在ImageNet之外的指标上如何相互比较?

    42210编辑于 2024-01-18
  • 来自专栏搜狗测试

    不可缺少的评测方案-主观性能感知评测

    “主观性能感知评测”。 该评测选取主要使用场景,由人工操作与竞品对比,根据执行人员的主观感受来评测应用的流畅度,下面来介绍一下如何制定主观性能评测方案。 APP选取 1. 有点卡:使用过程中有轻微的卡顿感觉,用户能感知; 4. ,网络环境需要保持一致,最好不要切换网络,如果网络情况不佳,建议更换一个稳定的网络进行评测; 3.每次执行评测时,应用版本不能更换; 4.每次执行评测时,执行人员不能更换; 执行测试 根据测试方案执行表格中的 总结 主观性能感知评测,在评测中是不可缺少的,能直观的反映出应用与竞品在用户使用层面的差距。

    1.6K10发布于 2020-06-04
  • 来自专栏个性化推荐评测

    TTS系统评测方法介绍--WSRD AI评测实验室

    AI评测实验室针对TTS前端、后端的存在的问题,选取TTS评测指标,制定各指标评测方法,形成了一套系统的TTS评测方案。 二、评测指标介绍 针对上文提到的前后端可能存在的问题,选择如下指标来评测TTS。 [lf3hxj32az.png] 三、评测方法介绍 本章详细介绍评测时重点关注的发音准确性评测和MOS评测。 数字进制:被测系统应该按照汉语习惯对数字的进制正确发音,如宝马4系列的轿车需要896,500元,“896,500”应展开为“八十九万六千五百”。 当前TTS得分大都高于4分,因此我们在传统MOS五档分值中加入了4.5分档,打分及描述如下: 表格 评测方法 分别合成被测TTS、对照TTS的语音,并且录制一份声优语音混入一起测试,注意录制时各类语音参数应保持一致

    18.5K115发布于 2018-07-02
  • 来自专栏技术成长

    如何评测图系统

    可以使用工具来进行性能测试,例如使用Apache JMeter等工具模拟并发请求,测量系统的吞吐量和响应时间。

    92661编辑于 2023-11-03
领券