首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏白话互联

    【claude code】claude code News | 9月26日速递

    ❤ 阿里巴巴推出Qwen-3 Max模型,瞄准代码和推理任务 中国科技巨头发布万亿参数AI模型 阿里巴巴发布了Qwen系列大型语言模型的最新版本Qwen-3 Max,这是该公司迄今为止最先进的版本,旨在增强推理 Qwen-3 Max是该系列中首个达到*超过一万亿参数*的模型,在36万亿个令牌上进行了训练,其上下文长度达到一百万个令牌。该模型在推理和编码方面与GPT-5、Gemini和Claude相匹配。 阿里巴巴表示,Qwen-3 Max代表了公司在AI领域的重大进步,特别针对代码生成和复杂推理任务进行了优化,有望在开发者和企业市场中获得广泛应用。

    23510编辑于 2025-11-19
  • 来自专栏机器学习与统计学

    大模型写高考作文,状元是DeepSeek,榜眼是Qwen3,探花是Gemini

    Claude-3.7-sonnet 的作文得分差异较大,从 Qwen-3 给的45分到其他模型的52-54分。 Qwen-3 和 豆包 在评分时似乎有更严格的标准,或者说更容易发现并扣分于他们认为的不足之处。 Qwen-3-235B-A22B: 自评分: 54 他人平均分: 56.5 结论: Qwen-3 的自评分 (54) 低于他人平均分 (56.5) 约2.5分。 这可能表明 Qwen-3 对自己的评价相对保守,或者其他模型对其作文更为认可。 豆包: 自评分: 57 他人平均分: 56.0 结论: 豆包的自评分 (57) 略高于他人平均分 (56.0) 1分。

    37410编辑于 2025-06-08
  • 微信出手,元宝反制,微信群失能,荒诞的AI内战

    gemini 3 pro、gpt-5.2 第三排:grok-4、glm-4.7、minimax-m2.1、kimi-k2.5 第四排:deepseek-v4.1, deepseek-r1(永不过时) 角落:qwen

    18810编辑于 2026-03-03
  • 来自专栏AI技术应用

    AI 应用的开发费用

    模型调用与算力成本(持续性开销)不再是一次性买断,而是按需付费或预留算力:API 调用费: 如果使用 GPT-4o、Claude 3.5 或 Qwen-3 等顶级模型,费用取决于 Token 的消耗量。

    30510编辑于 2026-03-13
  • 来自专栏杂谈

    「生成式AI前沿观察」:办公革命、医疗突破与技术伦理的十字路口

    更值得关注的是,LongCat-Flash-Exp解锁了1M上下文窗口,能轻松处理百万字长文档,性能超越同类模型Qwen-3,为律师、研究员等需要处理长文本的人群提供了高效工具。

    20710编辑于 2026-01-22
  • 每周AI论文速递(250908-250912)

    通过对Llama-3.1 8B和Qwen-3 8B进行微调,我们证明SBD能够将生成所需的前向传播次数减少至1/3到1/5,同时达到与等效NTP训练方法相同的性能表现。

    30710编辑于 2025-11-20
  • 来自专栏CreateAMind

    推理模型更容易产生幻觉吗? Are Reasoning Models More Prone to Hallucination?

    或在长篇推理数据上的监督微调(SFT)[37],由此催生了多个显著的大型推理模型(LRMs),例如OpenAI-o1、o3和o4-mini[14, 25],DeepSeek-R1[11],GLM-Z1[13, 9],以及Qwen

    12610编辑于 2026-03-11
领券