搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏翩翩白衣少年
湾大北交大开源 CutClaw，自动踩点音乐的 AI 智能视频剪辑师！
config.MAIN_CHARACTER_NAME "主角名字" \ --config.VIDEO_FPS 2 \ --config.AUDIO_TOTAL_SHOTS 50 CutClaw支持多种模型，官方推荐： • 视频模型：Gemini -3、Qwen3.5、GPT-5.3（用于镜头/场景理解和视觉字幕） • 音频模型：Gemini-3（用于ASR和音乐结构解析） • 智能体模型：MiniMax-2.7、Kimi-2.5、Claude-
65910编辑于 2026-04-10
智谱 GLM-OCR：0.9B 小模型登顶 OCR 榜单，3月起还能一行代码接入 Agent
文档 OCR 领域正在经历一场参数量军备竞赛——Qwen3-VL 用 235B 参数拿到 89 分，Gemini-3 Pro 拿到 90 分。 PaddleOCR-VL-1.5 的竞争非常接近（94.62 vs 94.50），两者参数量相同（0.9B），但各有优劣——PaddleOCR-VL-1.5 在文本和公式上略优，GLM-OCR 在表格上领先相比 Gemini 87.087.490.0多语言69.354.886.2印章识别90.542.291.3票据 KIE94.5—97.3在印章识别上，GLM-OCR（90.5）大幅超越 PaddleOCR-VL-1.5（42.2），与 Gemini
91710编辑于 2026-03-20
来自专栏福大大架构师每日一题
谷歌最新开源的Gemini-3处理器与DeepSeek媲美，同时算力降低十倍。
近期，谷歌的首席执行官Sundar Pichai在两天前的晚间透露了一个重要消息：谷歌将开源其最新的多模态大型模型Gemma-3，该模型以低成本与高性能为特色。Gemma-3提供了四种参数规模供选择，分别是10亿、40亿、120亿和270亿。值得注意的是，即便是参数量最大的270亿版本，也仅需一张H100显卡即可实现高效推理。相比之下，要达到相同效果，同类模型所需的算力至少要高出10倍。这使得Gemma-3成为当前性能卓越且参数规模较小的大模型之一。
2.1K10编辑于 2025-03-14
来自专栏扶墙集
Gemini 3 预热了这么长时间终于发布了
这是的第 549 篇原创 https://afoo.me Gemini 3 的发布可能太重量级了 (https://blog.google/products/gemini/gemini-3) ，
30110编辑于 2025-11-24
来自专栏新智元
视频理解+开放网络搜索=首个视频Deep Research评测基准
强如Gemini-3在Agentic模式下能利用长上下文获得提升，而部分开源模型在长视频下性能反而大幅下降。总结 VideoDR将视频理解的战场从封闭测试集延伸到了无限的开放网络。
24910编辑于 2026-01-26
来自专栏数智转型架构师
扣子编程悄悄上线豆包2.0，这才是OpenClaw省钱的正确方式
，这个系统包括了Pro，Lite，Mini三款通用Agent模型加一个Code模型，来自@赛博禅心的图，Seed2.0 Pro vs GPT-5.2 High· Claude Opus-4.5 ·Gemini
2.2K10编辑于 2026-03-04
来自专栏【腾讯云开发者】
Gemini 3实测：综合最强、代码最强、数学最强、多模态最强的六边形 AI 来了？
初步体验 2.1 常规测试 Q1：总结内容，生成知识卡片网页总结这个网页（https://blog.google/intl/zh-tw/products/explore-get-answers/gemini
9.7K51编辑于 2025-11-20
来自专栏算法一只狗
数学、视频、代码全拉满！Gemini 3是AI界的六边形战士
初步体验1.常规测试Q1：总结内容，生成知识卡片网页总结这个网页（https://blog.google/intl/zh-tw/products/explore-get-answers/gemini-3
78160编辑于 2025-11-25
来自专栏机器学习与统计学
Qwen3.5本地部署终极指南，Qwen3.5-27B
直接上数据旗舰 397B-A17B 对标闭源巨头直接看最硬核的 Benchmark 对比： Benchmark GPT-5.2 Claude 4.5 Opus Gemini-3 Pro Qwen3.5
19.4K43编辑于 2026-03-02
来自专栏AI资讯
Gemini 3 Pro (BananaPro) 深度解析：当绘图模型拥有“逻辑大脑” —— API Key 获取与 Python 实战指南
这一步如果卡在获取权限上，可以考虑使用UIUIAPI.com中转站（支持模型如 Gemini-2.5/Gemini-3 Pro等全系谷歌模型，国内开发者适用，胜在能解决问题）光说不练假把式。
2.8K10编辑于 2025-11-21
5.5K Star，中文首发！仿人类四层记忆网络，让 Agent 不再遗忘
当前最高准确率：Hindsight + Gemini-3 达到 **91.4%**，是公开报告中的最高水平（截至 2026 年 1 月）。
1.4K10编辑于 2026-03-24
来自专栏深度学习与python
刚刚，谷歌发布 Gemini 3：百万上下文 + 全链路 Agent直接封神！Claude 被秒成渣了
参考链接： https://blog.google/products/gemini/gemini-3/ 声明：本文为 InfoQ 整理，不代表平台观点，未经许可禁止转载。
1.3K21编辑于 2025-11-26
来自专栏大模型评测
0设计基础，作出天花板级设计图！从美学、逻辑到实时性，一次讲清Nano Banana Pro的降维打击，Nano Banana Pro大香焦实战测评！
Gemini 3 开发者指南：https://ai.google.dev/gemini-api/docs/gemini-3?hl=zh-cn2.
1.2K20编辑于 2026-01-12
Gemini 3 全维度技术解析：从认知到落地实战指南
指定输出格式安全控制 safety_settings 详见官方文档默认安全规则内容安全过滤 8.2 官方资源汇总官方文档：https://ai.google.dev/gemini-api/docs/gemini
1.4K10编辑于 2026-01-14

湾大北交大开源 CutClaw，自动踩点音乐的 AI 智能视频剪辑师！

智谱 GLM-OCR：0.9B 小模型登顶 OCR 榜单，3月起还能一行代码接入 Agent

谷歌最新开源的Gemini-3处理器与DeepSeek媲美，同时算力降低十倍。

Gemini 3 预热了这么长时间终于发布了

视频理解+开放网络搜索=首个视频Deep Research评测基准

扣子编程悄悄上线豆包2.0，这才是OpenClaw省钱的正确方式

Gemini 3实测：综合最强、代码最强、数学最强、多模态最强的六边形 AI 来了？

数学、视频、代码全拉满！Gemini 3是AI界的六边形战士

Qwen3.5本地部署终极指南，Qwen3.5-27B

Gemini 3 Pro (BananaPro) 深度解析：当绘图模型拥有“逻辑大脑” —— API Key 获取与 Python 实战指南

5.5K Star，中文首发！仿人类四层记忆网络，让 Agent 不再遗忘

刚刚，谷歌发布 Gemini 3：百万上下文 + 全链路 Agent直接封神！Claude 被秒成渣了

0设计基础，作出天花板级设计图！从美学、逻辑到实时性，一次讲清Nano Banana Pro的降维打击，Nano Banana Pro大香焦实战测评！

Gemini 3 全维度技术解析：从认知到落地实战指南

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐