首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏机器人课程与技术

    4G网速实测与WIFI使用对比

    5G即将普及,4G数据也基本能够满足需要,实测为日常使用地点(两处)和办公室WIFI,如果要求时延低,任何场合都推荐光钎,wifi和4g信号时延都要明显高于有线网络。 在线测网速链接:http://www.speedtest.cn/report_mobile/4G 移动(wifi+4G1+4G2): ~ ? ~ ? ~ ? ~ 联通(wifi+4g1+4g2): ~ ? ~ ? ~ ? ~ 电信(wifi+4g1+4g2): ~ ? ~ ? ~ ?

    1.7K50发布于 2019-01-23
  • 来自专栏程序猿DD

    实测:文心一言 vs GPT-4

    咱们就用百度发布会演示的预录制Demo,对比一下崭新出炉的GPT-4,先凭实力说话。 文心一言 vs GPT-4 和GPT-4一样,文心一言是一个多模态大模型。 老样子,我们也来与GPT-4进行一波对比: 这波你是想看GPT-4续写的《三体》,还是文心一言的? 再来看看《三体》电视剧中扮演史强和汪淼的老搭档,于和伟和张鲁一,有什么共同点? 也没什么问题。 并且这个名字它还不是瞎起的: 再来看看GPT-4起名的效果? 看起来,GPT-4对中文的掌控能力相比之下还是少了一点精髓。 至于写个公司成立的新闻稿? 首先是文心一言的效果展示: 接下来,我们再看看GPT-4怎么说: 诶,看起来反而是GPT-4没有真正理解“藏头诗”的含义。 这波文化理解上,属实是文心一言“小胜一筹”了。 有人调侃,看完之后感觉“提前退休的日子看起来还可以缓一缓”: 离GPT-4还差了20个老胡。

    75020编辑于 2023-04-04
  • 来自专栏算法一只狗

    Llama 4发布即开源 | 实测效果如何?

    Meta 终于发布了一个原生多模态大模型 Llama4。而且一经发布,在大模型LMSYS排行榜上,Llama 4 Maverick冲上第二。仅仅比 Gemini-2.5-pro 模型少 22 分。 比GPT-4o 价格那确实便宜很多图像推理任务:Llama 4 Maverick 在图像推理任务中表现最强。MMMU(复杂图像理解)中,Llama 4 Maverick 得分 73.4,高于其他模型。 MathVista(视觉数学):Llama 4 Maverick 得分 73.7,高于 Gemini 2.0(73.1)和 GPT-4o(63.8)编程任务上:DeepSeek 在编码任务上略胜一筹(DS ,但 Llama 4 Maverick 表现依然优异,远超 GPT-4o。下图展示了模型在“代码任务中的累计平均负对数似然(NLL)”随序列位置变化的趋势曲线。 与 Gemini 系列、GPT-4o、Claude 3、DeepSeek 等主流模型相比,Llama 4 的技术栈呈现出强烈的“工程范”:不走炫技路线,而是注重模型实用性、训练效率与部署成本之间的平衡。

    95320编辑于 2025-04-25
  • 【AGI-Eval 实测速报】OpenAI o3o4-mini视觉推理封神?实测翻车率略高

    我们连夜实测,输出这份硬核报告,下滑阅读!目录:1. 发布信息   1.1 模型简介   1.2 模型性能对比2.图像识别与对比实测   2.1 图像识别   2.2 图像对比3. 图像逻辑与理解实测   3.1 图像逻辑推理   3.2 梗图理解01.发布信息北京时间4月17日凌晨一点,OpenAI 开启了20分钟线上直播,上线了满血版 o3,还有下一代推理模型 o4-mini, 图像识别与对比实测划重点,我们先来看本次主观评测核心结论:对于简单问题,o3 和 o4 mini  能够处理基础的图片推理任务,能够识别图片的基本信息并做内容回答,过程中有细节错误出现。 03.图像逻辑与理解实测3.1 图像逻辑推理既然 o3 和 o4mini 在图片对比识别上未能达到预期,我们继续上一道经典的逻辑推理题,它们分别能答对多少?1. 这个营地中有几名游客?安迪在干嘛? 实测小结通过实测来看,o3 和 o4 mini  能够处理基础的图片推理任务,能够识别图片的基本信息并做内容回答(但还是有错误出现)。

    50310编辑于 2025-05-07
  • 来自专栏SIGAI学习与实践平台

    户外场景4种典型3D相机成像精度实测

    为了让3D视觉学术研究、产品研发人员对这一问题有基本的了解,本文给出以下4种典型3D相机的成像效果实测: 1.国外某知名品牌双目3D相机(以下简称双目相机A),是当前全球范围内知名度最高的双目3D相机, 官方标明可用于室外场景; 2.国外某知名品牌双目3D相机(以下简称双目相机B),是全球范围内知名度仅次于双目相机A的产品,官方标明可用于室外场景; 3.国内某知名品牌结构光相机(以下简称结构光相机A); 4. 本次测试了这4款3D相机在户外较强光照条件下对典型材质物体的成像效果,重点分析精度与成像稳定性。 下表是4种型号相机的部分参数。 在这个场景中,双目相机A对光滑的细金属电线杆有明显的扭曲变形,Z向和XY向的误差都超过了4cm。双目相机B对电线杆的Z向和XY向的误差>1cm,也有明显的变形。 4.Tensor Eye,户外场景精度最高,通常可以稳定地达到毫米级成像误差,成像速度慢,价格高。适用于户外场景对价格不敏感、对速度要求不高的高精度应用,包括机械臂引导、精确测量等。

    1.3K20编辑于 2023-10-23
  • 来自专栏无原型不设计

    4款UI智能标注工具真实测评-有态度的测评

    优点: 1.开发可以直接复制元素代码; 2.标注比较智能,也支持百分比标注和多选标注; 3.在线的,不占内存,一个插件搞定切图和标注; 4.支持 Win/Mac, 支持 PS/Sketch / XD; 4、标你妹呀 体验地址:http://www.biaonimeia.com/ 与前两款软件对比,标注的尺寸有误差(上边距和下边距),图标的宽、高各大1px。 ?

    1.5K20发布于 2019-01-24
  • 实测OpenAI发布的o3和o4-mini模型

    4月16日晚,OpenAI 发布了两款全新推理模型——o3 和 o4‑mini。 o4‑mini / GPT‑4.1 都给了响应较快;其中 o4‑mini 价格最低,GPT‑4.1 智能能力更强。 价格梯度o4‑mini ≪ GPT‑4.1 ≪ o3,输出 token 单价差距最大(4.4→8→40 美元)。 目前o3和o4-mini两个模型相比以前我觉得最大的改变就是可以进行“网页搜索”和“图像输入分析”。 写在最后从 o3 和 o4-mini 的发布可以看出,OpenAI 正在加速推动语言模型向智能体形态转变的进程。

    74010编辑于 2025-04-21
  • 来自专栏低代码平台

    本地跑 Gemma 4 替代 Claude Code?M4 Max 实测告诉你为什么行不通

    关于Gemma4系列:为什么选26BA4BGoogle这次一口气发布了四个版本:E2B、E4B、31B和26BA4B。 实测环境一览开始之前,先交代测试平台的硬件和软件配置:硬件:MacStudioM4Max128GB统一内存16核CPU/40核GPU模型:google/gemma-4-26b-a4b(Q4_K_M量化, 速度对比:差距不是一星半点实测下来,不同上下文长度场景下的生成速度差异非常明显:场景生成速度Prompt处理耗时体验评价短对话(<2KToken)~30-40tok/s1-2秒✅流畅中等对话(~8KToken ClaudeCode用户来说,与其折腾本地部署,不如从"节流"入手:继续使用AnthropicAPI,Sonnet的性价比在同级模型中依然突出安装RTK(RustTokenKiller)压缩命令行输出,实测可省 60-90%的Token消耗本地模型留给聊天场景,跑OpenClaw或其��轻量对话工具善用/compact和/model切换,在Opus和Sonnet之间按需灵活调度写在最后这次实测最大的收获,不是验证了

    1.3K41编辑于 2026-04-08
  • 【AGI-Eval实测】Claude 4 网页生成、游戏开发场景深度实测:发布会宣传与真实效果相差几何?

    AGI-Eval评测社区第一时间做了对比实测,下滑查看!目录:01. Claude4 模型简介02. Claude 4 实测核心结论03. 网页生成案例实测04. 游戏制作案例实测1.Claude 4 模型简介Anthropic 发布了 Claude 4 系列模型,包含 Claude Opus 4 和 Claude Sonnet 4 两个版本,均为混合模型,提供快速响应和用于更深层次推理的扩展思维两种模式 模型体验入口:https://claude.ai/onboarding2.Claude 4 实测核心结论从发布会的亮眼数据到实际应用表现,Claude 4 系列模型究竟能否兑现“AI新标杆”的承诺? 为验证其真实能力,我们选取了网页开发和游戏制作两个典型场景,对  Claude Opus 4 (调用API)和 Claude Sonnet 4 (调用API)进行深度实测,与 DeepSeek-v3 进行横向对比 4. 游戏制作案例实测测试能力:游戏制作类实测通过跳跃游戏、贪吃蛇游戏案例,考察模型的响应速度、代码生成能力、交互与实用性,在游戏制作实测中,代码多需要二次调试。

    74010编辑于 2025-06-11
  • 来自专栏大数据学习笔记

    实测:NLPchinaelasticsearch-sql

    Dio.netty.noKeySetOptimization=true, -Dio.netty.recycler.maxCapacityPerThread=0, -Dio.netty.allocator.numDirectArenas=0, -Dlog4j.shutdownHookEnabled =false, -Dlog4j2.disable.jmx=true, -Djava.locale.providers=SPI,COMPAT, --add-opens=java.base/java.io= -09T16:29:37,712][INFO ][o.e.p.PluginsService ] [TPA-VDI-OA11-17] loaded module [transport-netty4] Xshell6个人版安装与远程操作连接服务器..." , "url": "http://x.co/6nc84" ,"postdate":"2018-12-13"} { "index": {"_id": "4" (4)开打插件 ? (5)执行SQL命令 (首先在右上角填写对应的ES集群地址,此处填写了本地地址:http://127.0.0.1:9200/) ? ?

    1.1K20发布于 2021-08-10
  • 来自专栏机器之心

    GPT-4时代已过?全球网友实测Claude 3,只有震撼

    机器之心报道 机器之心编辑部 性能比 GPT-4 强很多。 大模型的纯文本方向,已经卷到头了? 不过,在定价上,能力最强的 Claude 3 也比 GPT-4 Turbo 要贵得多:GPT-4 Turbo 每百万 token 输入 / 输出收费为 10/30 美元 ;而 Claude 3 Opus 有人说,Claude 3 Sonnet 解出了一道此前只有 GPT-4 才能解开的谜题。 不过,也有人表示,在实际体验方面,Claude 3 并没有彻底击败 GPT-4。 第一手实测Claude3 地址:https://claude.ai/ Claude 3 是否真的像官方所宣称的那样,性能全面超越了 GPT-4?目前大多数人认为,确实有那么点意思。 以下是部分实测效果: 首先来一个脑筋急转弯,哪一个月有二十八天?实际正确答案是每个月都有。看来 Claude 3 还不擅长做这种题。

    62610编辑于 2024-03-07
  • 来自专栏AI进修生

    实测 Google IO 放出来的 Imagen4,不如GPT4o、甚至不如Imagen3。。

    我又把同样的‘考卷’扔给了 Imagen 4,特地让它画了4张,不仅审美感觉‘不在线’,文字表达也像刚学写字的小朋友,歪歪扭扭。 Imagen 4 Uttra 性能比4o差一些,但是快几倍。 来自4o生成的结果: 然后这里:左边是Imagen 4,右边是Imagen 3。 负向提示词:卡通化、塑料质感、CGI 渲染、HDR 过度、完全对称、过度锐化 imagen44o: 对比一下 4、3 和 4o 生成的便签纸,同样是要求‘真实笔触与墨迹颗粒感’、‘边缘折痕与指纹 3、4o。

    62110编辑于 2025-05-22
  • 来自专栏福大大架构师每日一题

    Llama 4 实测拉胯,官方承认“有问题”,DeepSeek 笑到最后?

    在2025年4月8日凌晨1点半,Meta生成式AI团队负责人Ahmad Al-Dahle在社交媒体上发表了一篇长文,对前两天刚刚开源的Llama 4所遭遇的质疑进行了官方回应。 他们坚信Llama 4模型代表了一项重要的技术进步,并期待与社区的合作,以充分发挥其价值。 事实上,Llama 4在开源的当天就受到了一些对其性能的质疑。 Llama 4的表现令人失望,显然在这方面你们的工作做得相当糟糕。与其误导公众,不如坦诚承认错误。 在聊天机器人领域的大语言模型排行榜上,Meta 的 Llama 4 Maverick 在编程能力方面居于首位。 以往,Llama 系列的发布通常安排在美国的周二或周三上午10点左右,发布 Llama 4 的时机显得有些心虚。

    32010编辑于 2025-04-14
  • 来自专栏量子位

    直播实测GPT-4 vs 文心一言,今晚坐等你来提问!

    代问工具人 发自 凹非寺 量子位 | 公众号 QbitAI GPT-4和文心一言这前后脚一上线,我们后台留言都快炸了。 不少小伙伴都想看看这俩选手真刀真枪拼起来,到底是个什么情况。

    33110编辑于 2023-03-21
  • 来自专栏算法一只狗

    实测文心 4.5 模型

    再来看看官方放出的能力测试图来看,在多模态测试上,新的4.5 模型在多个测试集上都已经超过了 GPT-4o 模型。 在平均值对比上,文心大模型4.5 的平均得分为 77.77,高于 GPT-4o 的 73.92,说明它整体表现更好。 在各基准测试的对比上,文心大模型4.5在大多数基准测试上优于 GPT-4o,特别是在 DocVQA 和 MathVista 任务上表现明显更好。说明文心大模型 4.5 更加适用于广泛的多模态任务。 其中,文心 4.5 主要擅长多模态任务,在多个测试集中超越 GPT-4o,尤其在 DocVQA 和 MathVista 任务上表现突出。

    33320编辑于 2025-04-26
  • 来自专栏镁客网

    韩国现代汽车成功实测L4级别自动驾驶汽车 | 热点

    这是韩国现代汽车首次在超过100公里的路程下,行驶速度达到法定最高限速的自动驾驶实测。 据国外媒体消息,近日,韩国现代汽车公司对3辆氢燃料汽车和2辆捷恩斯汽车进行了无人驾驶实测。 本次参与测试的两款车型均符合美国汽车工程师协会(SAE)规定4级标准,即汽车在没有驾驶者干预下自动行驶,驾驶者仅需实时监测路况。 这是韩国现代汽车首次在超过100公里的路程下,行驶速度达到法定最高限速的自动驾驶实测。从实测过程来看,驾驶者坐在车内仅需按下巡航和设定键,汽车便可自行驾驶。 另外据报道,在实测中,韩国总统文在寅作为第一批乘客试乘了现代汽车研发的自动驾驶氢燃料电池汽车“NEXO”,汽车在京釜高速连续自动行驶了10公里,用时15分钟。

    39730发布于 2018-05-29
  • 来自专栏九州牧云

    MySQL timeout调研与实测

    +-------+ 10 rows in set (0.00 sec) Date : 2012-2-24 Fri 22:41:24 #可见我把interactive_timeout改为1秒后经过了4秒的时间没有任何请求

    1.2K30发布于 2019-08-21
  • 来自专栏向全栈出发

    android View事件分发实测

    4种情况 L.onInterceptTouchEvent=true&& L.onTouchEvent=false 输出下面的Log: ? (标签:android、View、事件分发)

    44710发布于 2020-09-10
  • 来自专栏测试开发干货

    实测】playwright 学习笔记 - 0001

    学过不少新的技术框架,总结出一个现象,那就是万事开头难。下载到部署成功到运行第一个脚本的过程是最难的。如果一个人学一个框架半途而废了,那99%是倒在了这第一步。

    42810编辑于 2023-08-14
  • 来自专栏测试开发干货

    实测】关于‘钱学森弹道’应用软件测试的设计与实现(02)【4个具体方案】

    实测系列是纯硬核技术文章,并且是博主亲自演示已经落地取得一定成果的技术和原创教程,无偿进行分享,大家一键三连,支持一下! 此时你就会发现,这其实并非完全随机的概率,并非是等分1/4。所以,用更少的用例来,覆盖最真实的场景,就成了性价比更高的方案。 比如你随机的列表是[评价,主页,下单,返回] ,此时随机就是1/4

    46320编辑于 2023-11-06
领券