首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏奶奶看了都会

    教你白嫖一年谷歌Gemini Pro会员

    1.效果下面是开通成功的截图,已经可以用上一年的GeminiPro了2.准备工作能访问谷歌的网络一个Google账号一个Visa全币种卡3.网络注意网络节点需要切换美国节点,否则会有不通过的风险4.学生认证登录 :Gemini的域名/students点击GetOffer5.认证这一步因为我的谷歌账号是老号,点击之后提示已经不支持这个学生认证方案了不过不要紧,我们可以从某鱼上去买GeminiPro的学生认证服务,

    3.6K10编辑于 2026-01-18
  • 来自专栏新智元

    谷歌Gemini大逆转?斯坦福Meta华人证明其推理性能强于GPT-3.5

    关于多模态数据集,图2详细介绍了GPT-4V和GeminiPro Vision在不同问题类型上的性能比较。 我们可以看到,在最后一个关于时间类别的问题上,GeminiPro Vision实现了反超。 社交(Social IQa) 在使用Social IQa数据集评估GeminiPro在社会常识推理方面的表现时,出现了一个有趣的场景: 人们一直欺负在Sasha,Sasha报复了回去,接下来人们会做什么

    34110编辑于 2024-01-04
  • 来自专栏开源部署

    介绍一些好玩且实用的开源的AI工具

    GeminiPro-Next-WebGithub:https://github.com/lchh5/GeminiPro-Next-Web中文: https://github.com/lchh5/GeminiPro-Next-Web

    2.6K10编辑于 2025-08-12
  • 来自专栏Java课堂

    AI 画图全家桶来了!这回想自己手绘图都难了

    但在日常写文章时,我发现很多读者更偏爱那种手绘感十足的Excalidraw风格,就是下面这种,逼格高、视觉美,能让文章瞬间显得高级起来:我原本在琢磨,能不能用GeminiPro给自己搓一个AI绘图整合平台

    19910编辑于 2026-02-13
  • 来自专栏OpenMMLab

    谁是最强多模态模型?评测框架 VLMEvalKit 全方位揭秘多模态能力

    丰富的模型与评测集支持: 支持三个主流多模 API 模型:GPT-4v,GeminiPro,QwenVLPlus 支持包括 llava-v1.5,mPLUG-Owl2, XComposer, CogVLM 闭源多模态 API 模型整体性能仍处于领先地位:计算各个模型在不同评测集上的平均排名,可以发现,排名前三的 GeminiPro,GPT-4v,QwenVLPlus 均为闭源 API 模型。 2.

    2.5K10编辑于 2024-01-19
  • 来自专栏开源服务指南

    Serverless Framework:开发无服务器应用的最佳工具 | 开源日报 No.133

    本地演示界面 babaohuang/GeminiProChat[4] Stars: 1.2k License: MIT picture 这个项目是 GeminiProChat 的最小化网络用户界面,用于 GeminiPro

    58410编辑于 2023-12-26
  • 来自专栏开源技术小栈

    如何在PHP中使用谷歌 Gemini 大模型推理识别爬虫验证码

    ; $apiKey = 'AIzaSyAPxxxxxxxxxxxxxxx_uEpw'; $client = \Gemini::client($apiKey); $result = $client->geminiPro

    71510编辑于 2024-03-20
  • 来自专栏AIGC 先锋科技

    细粒度视觉处理,MG-LLaVA 多模态大型语言模型,从3.8B到34B,物体识别能力大幅提升 !

    得益于多粒度视觉特征,MG-LLaVA在感知和视觉理解方面的能力显著提高,优于已建立的同类产品,并在包括MMBench [19]和SEEDBench [20]在内的各种多模态基准测试中显著超过GPT-4V [17]和GeminiPro-V 通过采用从3.8B到34B的各种语言模型,作者的模型表现出清晰的伸缩性,并且在视觉理解方面有明显的能力,超过了已建立的同类模型,特别是在MMBench和SEEDBench上明显超过了GPT-4V和GeminiPro-V 利用从3.8B到34B参数范围的LLM,作者的模型显示出显著的可扩展性和在视觉理解方面的卓越性能,超过了现有模型,并在MMBench和SEEDBench等基准测试中显著超越了GPT-4V和GeminiPro

    1.1K10编辑于 2024-07-08
  • 来自专栏机器学习与统计学

    机器学习周刊 第4期:基于ChatGPT API的Android语音助手

    github.com/jianchang512/clone-voice cloudflare-ai-web 地址:https://github.com/Jazee6/cloudflare-ai-web 支持GeminiPro

    56011编辑于 2024-01-04
  • 突破界限!多模态AI如何重塑人机交互的未来?

    TPUv3LLaVA-1.585.4%320⚠️不支持需微调RTX4090GPT-4o91.8%✅150✅支持中等云端API选型建议:医疗/工业场景:优先Qwen-VL(多图推理+中文医学知识)车载/机器人:GeminiPro

    18010编辑于 2026-02-22
  • 来自专栏AI科技评论

    国产端侧小模型超越 GPT-4V,「多模态」能力飞升

    展开来看: OCR 识别中,在 OCR 综合能⼒权威榜单 OCRBench 上,面壁「多模态小钢炮」超越了Claude 3V Opus、GeminiPro 等标杆模型,也超过了原先排名第一的上海人工智能实验室

    1.4K10编辑于 2024-05-22
领券