从结果上来看:Grok4 以表格+分步总结的形式罗列了各方影响;o3 回答与法律关联度低,缺乏系统性。 Grok4 正确生成可运行的 Go 代码并添加了详尽注释;o3 则要求用户先提供代码示例,无法主动完成翻译。 Grok4 针对两种受众提供了恰当的层次化解释;o3 在简化科普上出现用词不当或过于笼统的问题。 四、其他网友测试 Epic 创始人下场称:Grok4 就是 AGI Epic 创始人 Tim Sweeney 亲自上场,把一篇他自认为模型从未见过的论文“喂”给 Grok4,要它对文中新问题给出见解。 欧拉恒等式的可视化展示 一位网络开发者 Dan 问 Grok4 最喜欢哪个数学公式,模型答出“e^iπ + 1 = 0”。
自从马斯克xAI发布新一代大模型Grok3霸榜各个榜单,超越Open AI o1和DeepSeek r1!发布,至今已过去四个月。这期间,Grok-3 在多个实际应用场景中展现出强大的理解与生成能力。
Grok4 于北京时间 7 月 10 日中午 12 点正式发布!这场发布比预告晚了一个小时,但好饭不怕晚!看完整场直播,我脑海里就一个词:惊艳! 我敢说这是一次史诗级更新,为何这么说呢? Grok4 和现有主流模型都不一样,这是一次从猿到人的进化!是的,进化,Grok 4 会用工具了,主动使用工具,它是使用类似我们之前介绍 Search R1 的思路强化检索、工具调用! 从上图可以看出,当前 SOTA 模型得分仅徘徊在 22 分左右,而 Grok4 横空出世,直接飙至 44.4%,几乎无敌碾压!即使前不久发布的 Kimi-Research 智能体也难以企及。 榜单对比显示,Grok4 即便不调用工具,已完胜 Gemini 2.5 Pro;启用工具后,更是达到 44.4%的无人之境!这不就是动物学会用工具,生产力直接飞跃的震撼时刻吗?
马斯克跳过Grok 3.5直接发布Grok 4,计划在7月4日后上线,专注编程模型优化,这次“极限迭代”能否让马斯克在AI军备竞赛中翻盘?来看看华医科技CIO蓝葛亮怎么说
Grok4.1已经偷跑2周,今天正式放出,并在与上代Grok4的比拼中获得了60.4%胜率。 幻觉降低非常明显,要吐槽的是上一代Grok4幻觉这么大? 不知道xAI哪里找的榜单,Grok4.1上榜的同时,我看到国模也都赫然在列。Kimi2如此亮眼,几个榜单都上了,真的假的?
Grok4 支持约 13 万 tokens 上下文窗口,较许多竞争对手的前沿模型要小,这可能表明 xAI 在优化推理速度和实时可用性,而非追求最大化的长上下文性能。
不过这个你看看就行了,这个榜单吹的Grok4 比claude 4.1, gemini 2.5 pro都要强,实际咋回事大家都知道… 但是限时免费可以白嫖OpenRouter和Vercel AI都可以,
国内用户直接就能体验最新的Grok4、Claude 4 Sonnet、GPT-4o画图、GPT-4.1、GPT-o3、Grok 3、Gemini 2.5 Pro、FLUX画图、DeepSeek R1等等模型
网友氪重金体验Grok4。 昨天,马斯克亮相 Grok 4 发布会,一脸骄傲地表示:Grok 现在所有学科都达到博士后水平,没有例外,甚至可以在今年内实现科学新发现。 让抽象概念可视化 Grok4 在教育领域中的应用潜力也巨大。举个例子,数学公式是抽象的,但如果 AI 能将其可视化,那么将在一定程度上弥补传统教育的不足。 X 博主 @BugNinza 先搞了个手指测试,把张开手掌的表情符号丢给 Grok4,并询问有几根手指,Grok 4 回答五根。
7月16日,AiPy正式发布《大模型适配度测评第二期报告》。本期测评涵盖了国内外9个主流大语言模型,在延续首期评测模型(DeepSeek-V3、豆包、Qwen Max等)的基础上,新增了多个近期发布的重磅模型,包括月之暗面旗下的Kimi K2、Google最新推出的Gemini 2.5 Pro、马斯克团队开发的Grok-4,以及Anthropic的Claude-4系列。
现在,SuperGrok的用户已经可以用上了,普通版月费30刀,Heavy版月费300刀。
OpenAI里有华人科学家,马斯克最近新发布Grok4的核心团队大部分也是华人,好像我们已经站在了牌桌的主位上。 图片 醒醒吧。 Claude被禁,说明了什么?
万token(标准账户)OpenAI 文档Claude 3.7未明确支持20万token输入技术博客从市场份额看,Kimi K2在OpenRouter平台上的token消耗量已达1.5%,超过xAI的Grok4
六合一系统一句话说明:每月90元,同时享受多个AI系统:官方 ChatGPT 4.0 和 Claude Pro 以及 Grok4 账号一模一样的功能,官方账号有的功能都有,以及接入了多个热门模型 DeepSeek
昨天Grok4发布完以后,我随手刷了一下X。 然后看到了一个非常有趣的帖子,来自@lepadphone。 我以为,这就是Grok4的问题,模型能力不太行,把一个恶搞的6根手指,数成了5根。
很多时间都是在上升的,只有暑假之后下滑,可能是因为学术上面的事情减少,因此这个使用的次数和访问的人数下降,其实我自己尝试过这个工具,在笔记,以及播客上面都是非常不错的;其中grok在7月份的时候流量剧增:新的大模型grok4
据马斯克推特介绍,Grok4很快就要发布了。 Grok 4 是 xAI 开发的下一代模型,Grok 4 跳过了3.5版本,直接升级,旨在与GPT-5、Gemini和Claude等竞争对手抗衡。
OpenAI的o3系列、xAI的Grok4、Anthropic的Claude4、Google的Gemini2.5Pro、国内的通义千问、DeepSeek-V3、月之暗面Kimi……这些家伙现在随便拉出来一个
https://deepmind.google/models/gemini/Grok4.1发布,带来更智能的AI助手Grok4.1是由xAI公司发布的最新人工智能模型,在前一代Grok4的基础上进行了显著提升 语音模式与视觉理解:Grok4具备语音模式,能够解释通过摄像头看到的内容。 技术原理Grok4系列模型的核心技术原理包括:强化学习规模化(ScalingUpReinforcementLearning):通过大规模强化学习训练,显著提升模型的性能和推理能力。
有趣的是,在直播演示中,Grok4 甚至重现了由碰撞黑洞产生的引力波。 其中一个演示展示了 Grok 4 在 Handle Labs 的 VendingBench 上表现出色。