首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏Soul Joy Hub

    模型AIGC系列课程 3-2】国产开源模型:ChatGLM

    GLM https://arxiv.org/pdf/2103.10360.pdf GLM是General Language Model的缩写,是一种通用的语言模型预训练框架。 这个图示说明了GLM预训练的过程,具体解释如下: a) 原始文本:给定一个原始文本,例如[x1, x2, x3, x4, x5, x6]。 在这个例子中,我们随机选择了两个连续的词片段[x3]和[x5, x6]作为样本。 b) 替换和洗牌:在Part A中,我们将被选择的词片段替换为[M](表示遮盖)。 在这个例子中,我们将[x3]和[x5, x6]洗牌为[x5, x6]和[x3]。 c) 自回归生成:GLM使用自回归的方式生成Part B。 在生成过程中,模型可以根据之前生成的词片段和Part A中的上下文来预测下一个词片段。 d) 自注意力掩码:为了限制模型的注意力范围,

    83620编辑于 2023-08-28
  • 来自专栏学习

    开源模型与闭源模型

    一、开源模型 开源模型是指开发者将模型的代码和训练数据公开,使得任何人都可以访问、修改和使用这些资源。 3.教育和学习资源: 开源模型为学生和研究人员提供了宝贵的学习资源。他们可以通过实践来理解模型的内部工作原理,进行实验和探索,从而推动教育和研究的发展。 二、闭源模型 闭源模型是指模型的代码和数据不对外公开,通常由商业公司开发和维护。代表性的闭源模型包括OpenAI的GPT-3和Google的BERT。 三、开源模型与闭源模型的对比 1.透明性与可控性: 开源模型的透明性更高,任何人都可以查看和验证其代码和数据,确保模型的行为符合预期。这对于学术研究和技术验证非常重要。 3.资源共享与独占优势: 开源模型在资源共享方面表现突出,任何人都可以利用这些开源资源进行学习和研究,促进技术的普及和应用。

    1.8K10编辑于 2024-10-09
  • 来自专栏睡前机器学习

    开源模型到底开源什么?

    语言模型的“开源”完全不是这么一回事。先别管OpenAI现在名叫钮钴禄氏·CloseAI,就算哪天良心发现,真的要找回自己做一个名副其实的OpenAI,洗心革面把GPT-4给开源了。 那么,现在很多研究者在呼吁的开源,到底是要开源什么呢?开源模型,具体来说,是开源训练好的模型参数。模型参数拿到手,基本上就能完整复现能力了。 前面说过,模型这玩意距离能力复现就一步之遥,有很多人爱开源模型,也有很多人不爱开源模型,原因和上面差不多,还有一种是大公司机构才敢用,官方辞令很多,譬如“出于社会责任考虑”,或者“安全伦理存在巨大风险 这里为咱们的中文开源语言模型打个Call吧,能讲中文还开源语言模型真的不多,清华放出来的ChatGLM-6B应该是佼佼者,而是真·单卡就能运行。这里说的是消费级显卡。 最后就是开源数据集了,这项工作很重要,但也很容易被圈外忽视。现在中文语言模型缺的东西很多,抱怨的也很多,还有一票人天天平替这个平替那个,实在不知道怎么想。

    1.7K20编辑于 2023-09-09
  • 来自专栏AI

    最强开源模型Llama 3发布!

    最强开源模型Llama 3发布!我们看下重点: 今天,我们介绍Meta Llama 3,这是我们最先进的开源大型语言模型的下一代。 我们相信这些是同类中最优秀的开源模型。为了支持我们长期以来的开放式方法,我们将Llama 3交到了社区的手中。 我们对Llama 3的目标 通过Llama 3,我们致力于构建与当今最优秀的专有模型相媲美的最佳开源模型。 我们希望解决开发者的反馈,提高Llama 3的整体实用性,同时继续在负责任使用和部署LLM方面发挥领导作用。我们秉持着开源精神,提前释放模型,让社区在其开发过程中获得访问权。 我们的训练数据集比Llama 2使用的七倍,其中包含四倍的代码。为了准备即将到来的多语言用例,超过5%的Llama 3预训练数据集包含覆盖30多种语言的高质量非英语数据。

    1.3K10编辑于 2024-04-25
  • 来自专栏机器学习入门

    【AI模型】LLM主流开源模型介绍

    学习目标 了解LLM主流开源模型. 掌握ChatGLM、LLaMA、Bloom等基础模型的原理 LLM主流模型类别 随着ChatGPT迅速火爆,引发了模型的时代变革,国内外各大公司也快速跟进生成式AI市场,近百款模型发布及应用 目前,市面上已经开源了各种类型的语言模型,本章节我们主要介绍其中的三类: ChatGLM-6B:衍生的模型(wenda、ChatSQL等) LLaMA:衍生的模型(Alpaca、Vicuna 、BELLE、Phoenix、Chimera等) Bloom:衍生的模型(Bloomz、BELLE、Phoenix等) ChatGLM-6B模型 ChatGLM-6B 是清华大学提出的一个开源 小结 本小节主要介绍了LLM主流的开源模型,对不同模型架构、训练目标、优缺点进行了分析和总结。

    1.3K10编辑于 2024-09-24
  • 来自专栏技术趋势

    google开源模型-gemini

    官网:https://deepmind.google/technologies/gemini/#introduction 简介 Gemini是谷歌公司发布的人工智能模型,能够在从数据中心到移动设备等不同平台上运行 Gemini包括一套三种不同规模的模型:Gemini Ultra是最大、功能最强大的类别,被定位为GPT-4的竞争对手;Gemini Pro是一款中端型号,能够击败GPT-3.5,可扩展多种任务;Gemini “双子座”Ultra版本是首个在“大规模多任务语言理解”(MMLU)领域超越人类专家的模型。---百度百科 https://baike.baidu.com/item/Gemini/63729669? shot 83.1%3-shot(API) DROP 阅读理解力(F1分数) 82.4%Variable shots 80.9%3-shot(reported) HellaSwag 日常情景下的常识推理 随着未来模型的普及我们的工作肯定有一部分会通过AI来提高效率,所以可以提升了解并实践

    2.5K10编辑于 2024-01-15
  • 来自专栏腾讯开源的专栏

    腾讯混元宣布语言模型3D模型正式开源

    腾讯混元模型正在加快开源步伐‍ 11月5日,腾讯混元宣布最新的MoE模型“混元Large“以及混元3D生成大模型“ Hunyuan3D-1.0”正式开源,支持企业及开发者精调、部署等不同场景的使用需求 本次开源是腾讯混元继文生图模型后持续开放的一举措。 其中,腾讯混元Large是目前开源领域参数规模最大、效果最好的MoE模型,而腾讯混元3D生成大模型则是业界首个同时支持文字、图像生成3D的开源模型。 业界首个同时支持文字、图像生成3D的开源模型 腾讯混元3D生成大模型首批开源模型包含轻量版和标准版,轻量版仅需10s即可生成高质量3D资产,目前已在技术社区公开发布,包含模型权重、推理代码、模型算法等完整模型 随着自研模型技术强大的和应用实践经验的丰富,开源已经成为腾讯混元模型的一个战略选择,未来,腾讯混元也将继续带来更多模态、更多尺寸的开源模型,将更多经过腾讯业务场景打磨和检验的模型开源,促进模型技术进步和行业生态繁荣

    1.9K20编辑于 2025-02-05
  • 来自专栏韩曙亮的移动开发专栏

    【AI 模型】Meta Llama 3 模型 ( Llama 3 模型简介 | Ollama 软件下载安装 | Llama3 模型下载 | Llama 3 模型 在线 离线 使用 )

    首先 , 安装 Ollama 软件 , 到 https://ollama.com/ 下载安装 ; 然后 , 运行 ollama run llama3 命令 , 即可开始使用 Llama3 模型 ; 一 、Meta Llama 3 模型安装 1、Llama 3 模型简介 Llama 3 模型 是 Meta 公司 发布的 模型 , Meta 公司 就是 Facebook ; Llama 3 模型 Llama3 模型 ; 下载的模型放在了 C:\Users\用户名.ollama 目录中 , 在我的电脑上的路径是 C:\Users\octop.ollama ; 这个模型很大 , 有 4.7 G 安装完成后的效果 for help) 二、Meta Llama 3 模型使用 1、Llama 3 模型在线使用 在命令行中 , 可以直接进行对话 , 下面是对话内容 : D:\Llama>ollama run llama3 for help) 2、Llama 3 模型离线使用 Llama 3 模型 联网时 , 可以访问云端服务 , 可以生成更加丰富的文本 ; Llama 3 模型 在 断网后也可以使用 , 下面是断开网络后

    1.8K12编辑于 2024-08-09
  • 来自专栏AIGC新知

    浅谈宇宙最强开源模型Llama3如何应用

    北京时间4月19日凌晨,Meta公司通过其官方网站宣布了Llama系列的最新开源模型:Llama-3。 Llama家族图谱 2023年2月,Meta发布Llama-1 系列开源模型,是当时性能非常出色的开源模型之一,有7B、13B、30B和65B四个版本。 02、Llama3技术特性 Llama3模型是Meta公司在2024年发布的最新开源模型,它继承并发展了前代模型的技术优势,同时引入了模型架构、预训练数据、扩展预训练和指令微调: 01、模型架构 03、Llama3模型微调 LlamaFactory支持llama3,发布了自己的Colab微调实战案例: 项目主页: https://github.com/hiyouga/LLaMA-Factory /meta-llama-3-8b 70B 模型:https://replicate.com/meta/meta-llama-3-70b 03、本地部署 Ollama 是一个开源的大型语言模型(LLM)服务工具

    1.2K10编辑于 2024-10-08
  • 来自专栏周末程序猿

    ChatGPT|开源模型Llama3性能匹敌GPT4

    4月18日,Meta正式发布Llama3开源了包括8B和70B,在多个关键的基准测试中性能优于业界先进同类模型,其在代码生成等任务上实现了全面领先,能够进行复杂的推理,可以更遵循指令。 )https://llama3.replicate.dev/ (2)https://build.nvidia.com/explore/discover#llama3-70b,英伟达在这个平台上提供各种模型 ,其中包括现在流行的模型,建议收藏 (3)https://huggingface.co/meta-llama/Meta-Llama-3-8B,huggingface地址 如果有GPU可以尝试自己跑起来: 倍; 带有 Llama Guard 2、Code Shield 和 CyberSec Eval 2 的新版信任和安全工具; 对比各个闭源模型,Llama3在代码生成、文本摘要、对话、代码搜索等任务中均取得了显著的性能提升 : 体验Llama3 用国内可以用的地址:https://llama3.replicate.dev/,体验效果如下: 最后致敬开源社区,如同Llama3生成的诗一样: 开源精神激发创新, 人工智能的民主化

    25910编辑于 2025-02-27
  • 来自专栏AI科技评论

    别再说国产模型技术突破要靠 Llama 3 开源

    作者丨张进 编辑丨陈彩娴 近日,千呼万唤之下,Meta终于发布了开源模型Llama 3的 8B 和 70B 版本,再次震动 AI 圈。 Meta还透露,Llama 3的 400B+ 模型仍在训练中。 Meta 顺利地保住了它在开源模型领域的王座。 开源 Llama 3 的发布对整个大模型行业都是影响很大的事情,再次引发了对“开源与闭源之争”的热烈讨论。 开源本身是一件致力于打破技术垄断、有利于促进整个行业不断进步、带来创新的事情,但每次Meta一开源,从Llama 到 Llama 3,国产模型都要经历一次来自国人的嘲讽和贬低。 SuperBench 团队共选取了如下列表模型,将Llama 3 放置到全球内的模型行列中进行对比,除了国外主流的开源和闭源模型,也将 Llama 3 跟国内的主流模型进行对比。

    83710编辑于 2024-05-06
  • 来自专栏DevOps

    AI模型开源语言模型bloom学习

    作为一名开源爱好者,我非常不喜欢知识付费或者服务收费的理念,所以便有决心写下此系列,让一般大众们可以不付费的玩转当下比较新的开源语言模型bloom及其问答系列模型bloomz。 一、模型介绍 bloom是一个开源的支持最多59种语言和176B参数的语言模型。 bigscience在hugging face上发布的bloom模型包含多个参数多个版本,本文中出于让大家都能动手实践的考虑,选择最小号的bloom-1b1版本,其他模型请自行尝试。 本文的安装方法都是基于pip,如果你不懂pip虚拟环境请运行以下命令(linux如果有python2,请运行pip3): pip install virtualenv -i https://mirror.baidu.com (checkpoint) #下载模型 网速足够快的情况下等一会就下载好了,但通常情况下我们得ctrl+c打断代码运行,手动下载模型存放到对应位置,即.cache\huggingface\hub\models–bigscience–bloom

    1K10编辑于 2024-03-29
  • 来自专栏AI工程落地

    语言模型--开源数据集

    Huggingface排行榜默认数据集 Huggingface开源模型排行榜: Open LLM Leaderboard - a Hugging Face Space by HuggingFaceH4 本文主要介绍Huggingface开源模型排行榜上默认使用的数据集以及如何搭建自己的模型评估工具 搭建模型评估工具 1.下载数据集到本地 from datasets import load_dataset ", "ind": 4, "label": "3", "source_id": "activitynet~v_-1IBHYS3L-Y", "split": "train" 2110.14168.pdf (arxiv.org) 数据集地址:gsm8k · Datasets at Hugging Face 语言:English 介绍:GSM8K是一个包含8.5k的小学数学题,主要用于测试模型的数学和逻辑推理能力 arxiv.org/abs/2107.03374 数据集地址:openai/openai_humaneval · Datasets at Hugging Face 语言:English 介绍:OpenAI发布的测试模型编程能力的数据集

    2.1K20编辑于 2024-09-18
  • 来自专栏科技云报道

    开源才是模型的未来?

    9月,百川智能宣布开源Baichuan-7B、13B两款模型,其下载量目前已经突破500万,200多家企业申请部署开源模型。 有业内人士认为,未来90%的企业会倾向基于开源模型发展。那么,开源是否真的是模型的未来? 开源模型快速赶超 开源模型的核心理念是开放源代码,允许公众访问、使用、修改和分发模型的源代码。 开源模型的商业化挑战 尽管开源已成为现阶段模型发展的一种主流趋势,开源模型的发展速度也远快于封闭生态系统,但并非所有的厂商都选择开源路线,也并不代表厂商会一直开源所有的模型。 比如,以开源切入模型赛道的百川智能,在发布完Baichuan-7B、Baichuan-13B开源模型后,参数更大的Baichuan-53B模型则选择了闭源。 开源与闭源模型 的协同演化 实际上,开源模型和闭源模型各有优劣,且在不同的应用场景和需求下各有其适用性,两者并非绝对的对立面,而是可以在某些方面相互借鉴和融合。

    51710编辑于 2023-12-26
  • 来自专栏机器学习AI算法工程

    开源语言模型LLMs汇总

    语言模型 语言模型(LLM)是指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解语言文本的含义。 2023年3月15日,Open AI发布了多模态预训练模型GPT4.0。 2023年2月,谷歌发布会公布了聊天机器人Bard,它由谷歌的语言模型LaMDA驱动。 开源语言模型 本文列举了截止到 2023 年 6 月 8 日开源语言模型 1、LLaMA 简介 meta 开源的 LLaMA LLaMA完全是在公共开源预训练数据上训练。 并且取得相当不错的效果,LaMA-13B在绝大部分的benchmarks上超越了GPT-3(175 B),并且LLaMA-65B的效果能够和最好的模型,Chinchilla-70B以及PaLM-540B 骆驼(Luotuo)项目是由冷子昂 @ 商汤科技, 陈启源 @ 华中师范大学 以及 李鲁鲁 @ 商汤科技 发起的中文语言模型开源项目,包含了一系列语言模型

    2.9K10编辑于 2023-09-04
  • 来自专栏Python进阶之路

    开源教育对话模型 EduChat

    EduChat 是华东师范大学计算机科学与技术学院的 EduNLP 团队开发的开源教育对话模型。 该项目主要研究以预训练模型为基底的教育对话模型相关技术,融合多样化的教育垂直领域数据,辅以指令微调、价值观对齐等方法,提供教育场景下自动出题、作业批改、情感支持、课程辅导、高考咨询等丰富功能,服务于广大老师 3.《情绪智商》(Daniel Goleman):这本书介绍了情绪智商的概念,并探讨了情绪智商如何影响我们的生活和工作。 4. 在未来,开发者们将持续投入对基础模型的研究,并持续推出更为强大的 EduChat 版本,以丰富全球教育模型生态,加速全球教育信息化进程。 鉴于上述模型的局限性,我们要求开发者仅将开源的代码、数据、模型以及由该项目生成的衍生物仅用于研究目的,禁止用于商业用途,以及其他可能对社会带来危害的用途。

    2K30编辑于 2023-07-10
  • 腾讯混元悄悄开源3D模型2.0,开源社区真的过年了。

    在这个闭门会上,混元直接又为这个AI年味添砖加瓦,开源了他们最新一代的3D模型: Hunyuan3D-2.0 甚至因为知道很多人不会部署,就想快速用一下,还贴心的做了个线上的应用,腾讯的产品体验,那还是拉满的 从他们自己的跑分和盲测来看,基本达到了AI 3D开源模型里面的No.1。 页面:https://huggingface.co/spaces/tencent/Hunyuan3D-2 除了开源之外,他们还贴心的做了一个产品,我们一直说,模型不是产品,模型根本没有任何用户体验,只有把基于模型能力做出来的符合用户需求的产品 不过问题也是有的,比如在人物角色上,肢体已经表现的非常好了,但是AI 3D模型的糊脸通病也还是会有概率存在。 而大脸的时候会正常。 整体模型质量上,强的起飞,而且,这玩意是开源的,这就很牛逼。 各大厂商一波接一波猛料,还没消化完DeepSeek R1的开源,就碰上混元又抛出Hunyuan3D-2.0。 仿佛大家,约定好要在旧年结束前,把所有火药一次性点燃,来一场璀璨的新春秀。

    72400编辑于 2025-04-14
  • 来自专栏开源服务指南

    llama3 发布!语言模型新选择 | 开源日报 No.251

    meta-llama/llama3https://github.com/meta-llama/llama3 Stars: 17.3k License: NOASSERTION llama3 是 Meta 提供了大型语言模型的权重和起始代码,包括参数量从 8B 到 70B 的预训练和指导调整的 Llama 3 语言模型。 可以通过下载脚本获取模型权重和分词器,并在本地运行推理。 github.com/LlamaFamily/Llama-Chinese Stars: 10.5k License: NOASSERTION Llama-Chinese 是一个专注于中文 Llama 模型的优化和应用的社区项目 该项目旨在持续优化 Llama 模型在中文处理方面的性能和适应性,为用户提供丰富的中文处理能力。主要功能和核心优势包括: 提供在线体验,包含 Llama3 和 Llama2 模型。 提供中文预训练模型 Atom-7B 以及官方模型 Llama3 和 Llama 提供多种使用方式,包括 Anaconda、Docker、gradio 等。 支持模型预训练、微调和量化。

    51310编辑于 2024-04-30
  • 腾讯混元3D 2.1模型,全链路开源

    腾讯混元,首次将开源发布会,开到了海外——在CVPR 2025(计算机视觉领域顶会之一)上,腾讯混元3D 2.1模型对外全链路开源——模型权重及架构、训练代码、数据处理流程等等,全部开放。 这也是混元3D模型首次实现全链路开源——开发者不仅可以调用模型,还能了解其训练过程、设计原理,并根据自身需求进行二次训练或微调。 此外,本次开源的混元3D 2.1模型3D生成的纹理质感和光影表现方面大幅提升,让AI 3D建模摆脱“塑料感”,在需要逼真建模的游戏、动画等领域,更加实用。 这也意味着——无论你是开发者还是创作者,都能在本地,无限次生成高品质的3D作品,还可以根据需要定制和精调,把腾讯混元3D 2.1模型,变成你自己的「3D工厂」。 长期以来,腾讯混元坚定拥抱开源,旗下图像、视频、3D、文本等多种模态基础模型已全面开源。混元3D 2.1完全开源,是一个全新起点,混元期待与大家携手,共同打造更加繁荣的3D开源生态。

    2.2K10编辑于 2025-06-17
  • 来自专栏JAVA

    全网最强开源AI模型接入教程:开源模型DeepSeek-V3 API接入全流程详解

    全网最强开源AI模型接入教程:开源模型DeepSeek-V3 API接入全流程详解 (与OpenAI完美兼容) 全网最强开源AI模型接入教程:开源模型DeepSeek-V3 API接入全流程详解 ( 与OpenAI完美兼容) 正文 \DeepSeek-V3 是什么? \ DeepSeek-V3 是最新一代开源 AI 模型, 不仅完全兼容 OpenAI API,还能通过流式输出大幅提升性能和用户体验。 全网最强开源 AI 模型接入教程:开源模型DeepSeek-V3 API全流程详解 (与OpenAI完美兼容) ✨ 提示: API Keys 是你访问 DeepSeek API 的核心凭证,请妥善保存 默认模型) 特别说明: base_url 的 /v1 并不与模型版本绑定,而是 API 接口版本的标识。

    9.5K40编辑于 2025-01-12
领券