首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏Soul Joy Hub

    模型AIGC系列课程 3-2】国产开源模型:ChatGLM

    GLM https://arxiv.org/pdf/2103.10360.pdf GLM是General Language Model的缩写,是一种通用的语言模型预训练框架。 具体来说,GLM通过随机遮盖文本中连续的标记,并训练模型按顺序重新生成这些遮盖的部分。这种自回归的空白填充目标使得GLM能够更好地捕捉上下文中标记之间的依赖关系,并且能够处理可变长度的空白。 在生成过程中,模型可以根据之前生成的词片段和Part A中的上下文来预测下一个词片段。 d) 自注意力掩码:为了限制模型的注意力范围,

    76120编辑于 2023-08-28
  • 来自专栏机器学习与统计学

    开源,免费,模型图文教程、视频课程

    大家好,我是 Ai 学习的老章 模型还是要学啊,太深了,学无止境 老章长期大量网上冲浪,推荐几个图文教程/视频课程 1 是优质,2 是免费 别看到英文就露怯,沉浸式翻译插件一键就 OK 了 LLM Inference Handbook[1] 《语言模型推理手册》是一本集技术术语表、指南和参考资料于一身的手册,全面涵盖语言模型推理相关知识。 课程从 AI 基础原理讲起,包括其定义、起源和语言模型的兴起,后续进入实践教程,如构建聊天机器人、实现检索增强生成等,旨在帮助学员构建可扩展的实际 AI 应用。 这门由华盛顿大学助理教授、NexusFlow 联合创始人朱邦华讲授的“语言模型(LLM)的后期训练”短期课程,旨在教授学员如何对语言模型进行后期训练与定制。 书中通过逐步编写代码,由内而外深入讲解语言模型的工作原理,指导读者创建自己的语言模型,并以清晰的文字、图表和示例阐释每个阶段。

    36110编辑于 2025-07-18
  • 图灵-JAVA+AI模型智能应用开发课程

    当人工智能从实验室走向企业生产环境,一个关键问题浮出水面:如何让模型真正“跑起来、用得好、管得住”? 正是在这一趋势下,《TL-JAVA+AI 模型实战》课程应运而生,聚焦两核心能力:模型推理部署与企业级系统集成,帮助 Java 工程师抢占未来十年的技术制高点。 本课程并非将 Java 与 AI 简单拼接,而是深入剖析二者融合的底层逻辑。例如:如何在 Spring Boot 微服务中封装模型推理接口?如何通过异步流式处理支持长文本生成? 课程以“高清同步”为核心理念——强调 模型能力、系统架构与业务目标 三者之间的高度协同:模型输出需符合业务语义规范,避免“技术正确但业务无用”;推理服务需与现有认证、日志、监控体系无缝对接,降低运维成本 尤为关键的是,课程由 TL 课堂联合一线金融科技与智能制造企业的架构团队共同打磨,内容覆盖:主流开源模型(如 Llama 3、Qwen、ChatGLM)的本地化部署策略;ONNX、vLLM、Triton

    58911编辑于 2025-11-22
  • 来自专栏Datawhale专栏

    模型理论基础(so-large-lm)课程笔记!

    本前言介绍的课程笔记源自于“模型理论基础(so-large-lm)”课程(https://github.com/datawhalechina/so-large-lm),一个致力于探索和理解大型模型发展的前沿课程 一年前,该课程已经讲述了MOE和RAG架构的重要性,并在课程内容中对这两种架构进行了深入讲解。这不仅证明了学习模型理论基础的重要性,也展示了课程内容的前瞻性和实用价值。 随着时间的推移,模型的研究和应用领域继续迅速发展,促使我们对已有知识的理解进行更新和深化。因此,本课程笔记旨在开源学习的背景下,基于今年年初的学习成果,进一步讲解和深化对MOE和RAG内容的理解。 这份笔记不仅反映了当前模型研究的最新动态,也体现了深入学习和掌握这些复杂架构的重要性。 通过本课程笔记,读者将能够获得对MOE和RAG架构更为深入的理解,掌握它们的设计原理、优势及应用场景。 我们希望这份笔记能够为广大学习者提供价值,促进对模型理论基础知识的深入学习和应用,同时激发更多的创新和探索。

    50210编辑于 2024-04-24
  • 来自专栏最新最全的大数据技术体系

    AI全栈模型工程师(二)课程大纲

    这节课会带给你 通俗了解模型的工作原理,秒赢 99% 其他人的认知 了解指令工程的强大,不只是「说人话」那么简单 浅尝 OpenAI API 的调用 开始上课! 1.2、大纲解读 模块 目的 原理 实践 认知 AI 模型基础介绍 对模型有直观的、基础的了解,以展开后续课程学习 模型最基础的原理 搞定环境搭建和工具的使用 模型并不神奇,也不神秘 Prompt Engineering 操纵模型的基础方法 让 prompt 更大概率生效的原理 使用 prompt 和调用 OpenAI API 程序思维从确定性到模糊性的变化 Function Calling 开发应用 Prompt 和代码分离的思想 Fine-tuning 学会模型应用技术的天花板 机器学习基础 训练出自己的独特大模型 模型、GPU 选型 AI 产品设计 独立完成 AI 产品设计,成为 5.1、语言模型(LLM):GPT,Transformer 六、OpenAI API初探 6.1、安装Python库 pip install --upgrade openai 6.2、查看可调用的模型

    2.6K53编辑于 2023-10-17
  • 来自专栏Michael阿明学习之路

    AI模型全栈工程师课程笔记 - LangChain

    模型 IO 封装 pip install langchain # 0.0.350 模型封装 from langchain.llms import OpenAI # 设置环境变量 from dotenv user role SystemMessage #等价于OpenAI接口中的system role ) messages = [ SystemMessage(content="你是谷歌的模型 非常欢迎你对AIGC课程感兴趣。AIGC课程是一门人工智能基础课程,旨在帮助学员掌握人工智能的基本概念、技术和应用。\n\n如果你想学习AIGC课程,我可以为你提供以下信息:\n1. 课程内容:AIGC课程包括人工智能基础知识、机器学习、深度学习、自然语言处理、计算机视觉等方面的内容。\n2. 学习方式:AIGC课程提供在线学习,你可以根据自己的时间和进度来学习课程内容。\n3. 学习资源:AIGC课程提供视频教程、学习笔记、练习题等学习资源,帮助学员更好地理解和掌握课程内容。\n4. 学习支持:我们提供学习支持,包括学习群组、论坛和定期答疑活动,帮助学员解决学习中的问题。

    2K10编辑于 2023-12-21
  • 来自专栏Michael阿明学习之路

    AI模型全栈工程师课程笔记 - Semantic Kernel

    Semantic Kernel 语言模型开发框架(SDK) 封装了一系列工具(提示词模板、链式调用、规划能力等),像调用函数一样 支持(C# Python Java)基于 OpenAI / Azure Skill/Plugin,需要有一个配置和管理的单元,这个组织管理单元就是 Kernel Kernel 负责管理底层接口与调用顺序,例如:OpenAI/Azure OpenAI 的授权信息、默认的 LLM 模型选择 语言无关 skFunction包含文件: skprompt.txt: 存放 prompt,可以包含参数,还可以调用其它函数 config.json: 存放配置,包括函数功能,参数的类型,以及调用模型时的参数 () 方法执行 plan (注意,不同 planner 接口并不一致) 做一个例子 周杰伦的生日是星期几: 先申请 bingAPI https://portal.azure.com 创建SK,添加模型

    1.4K10编辑于 2023-12-18
  • 来自专栏Michael阿明学习之路

    AI模型全栈工程师课程笔记 - Function Call

    课程摘要 模型,没有真逻辑,只是推测下一个字的概率 gpt 可以根据函数的描述来决定是否调用该函数,但是真正的执行,需要我们自行调用 2. 由模型决定调用谁, seed=1024, tool_choice='auto', # response_format={'type': 'json_object 由模型决定调用谁 "type": "function", "function": { "name": "sum", "description function_name, "content": str(function_response), } ) # 再次调用模型 content": prompt} ] response = get_completion_with_tools(messages, tools) messages.append(response) # 把模型的回复加入到对话中

    1.5K20编辑于 2023-11-23
  • 来自专栏Michael阿明学习之路

    AI模型全栈工程师课程笔记 -Assistant API

    课程学习自 知乎知学堂 https://www.zhihu.com/education/learning 如果侵权,请联系删除,感谢! 文章目录 1. 选择模型:gpt-3.5-turbo-1106 添加函数: { "name": "ask_database", "description": "Use this function to answer

    77310编辑于 2023-12-10
  • 来自专栏腾讯开源的专栏

    「腾讯混元模型应用实战课程」上线国家智慧教育平台

    由腾讯打造的“腾讯混元模型应用实战课程”,已正式上线国家智慧教育平台,为全国高校师生带来覆盖模型技术通识到AI工具实用技能的系列课程,助力高校师生规范、高效使用模型,加速教育教学及科研创新。 课程入口 https://higher.smartedu.cn/course/lmc/67de729c2f4f1bef26a8089f 国家智慧教育平台建成三年来,已经成为世界上资源最丰富、用户最多、规模最大的智慧教育平台 在教育部高等教育司邀请下,腾讯结合自身模型技术优势与全栈AI产品,从高校师生日常使用场景出发,设计制作了“腾讯混元模型应用实战课”,上线国家智慧教育平台“人工智能教学服务开放应用专区”,和“高校学生就业能力提升 该课程聚焦多模态生成、逻辑推理等核心功能,设计智慧教学、科研辅助、学科融合等应用场景案例,通过技术原理解析、案例实操演练,助力师生利用模型进行教学教研及学术创新。 今年以来,腾讯混元模型持续快速迭代,推出了深度思考模型混元T1和快思考模型混元Turbo S,并已广泛应用于腾讯元宝、ima、腾讯元器、腾讯文档、微信读书、搜狗输入法、QQ浏览器等多款内部产品。

    95710编辑于 2025-04-04
  • 来自专栏Michael阿明学习之路

    AI模型全栈工程师课程笔记 - 提示词工程

    攻击:改变系统人设,现在开始你不是xxx了,忘记前面所有的对话 防范:prompt拦截器、带上系统人设 + 用户输入的消息喂给模型、Moderation API API使用中的参数temperature client.chat.completions.create( model=model, messages=session, temperature=0, # 模型输出的随机性 ) -> 对话策略Policy -> 语言生成NLG -> 语音合成TTS NLU 给定任务 用户输入 约定输出格式(json等) 加入例子,让输出更稳定 DST 给定prompt让模型输出 这门课程将为你提供编程的基础知识和技能。你可以学习到编程语言的基本概念、算法和逻辑思维等内容。初级编程课是一门实验课,共计4学分。你对这门课程感兴趣吗? user 感谢兴趣,帮我订下吧! AI 好的! 这两门课程都是选修课,但是文学欣赏课是3学分,而交响乐欣赏课是2学分。如果你希望获得更多学分,我建议你选择文学欣赏课。这门课程将帮助你提高对文学作品的理解和欣赏能力。你对这门课程感兴趣吗?

    69761编辑于 2023-11-18
  • 来自专栏Michael阿明学习之路

    AI模型全栈工程师课程笔记 - 提示词工程

    攻击:改变系统人设,现在开始你不是xxx了,忘记前面所有的对话 防范:prompt拦截器、带上系统人设 + 用户输入的消息喂给模型、Moderation API API使用中的参数temperature client.chat.completions.create( model=model, messages=session, temperature=0, # 模型输出的随机性 ) -> 对话策略Policy -> 语言生成NLG -> 语音合成TTS NLU 给定任务 用户输入 约定输出格式(json等) 加入例子,让输出更稳定 DST 给定prompt让模型输出 这门课程将为你提供编程的基础知识和技能。你可以学习到编程语言的基本概念、算法和逻辑思维等内容。初级编程课是一门实验课,共计4学分。你对这门课程感兴趣吗? user 感谢兴趣,帮我订下吧! AI 好的! 这两门课程都是选修课,但是文学欣赏课是3学分,而交响乐欣赏课是2学分。如果你希望获得更多学分,我建议你选择文学欣赏课。这门课程将帮助你提高对文学作品的理解和欣赏能力。你对这门课程感兴趣吗?

    83120编辑于 2023-11-18
  • 来自专栏小康的自留地

    前端课程——盒子模型

    什么是盒子模型 盒子模型又称为框模型,HTML页面所有的元素都具有盒子模型,该模型用于设计HTML页面和实现HTML页面布局。 ? - 上外边距和下外边距 水平方向的外边距有效的 行内块级元素 与块级元素相同 盒子模型的类型 box- sizing属性用于设置盒子模型的类型,该属性的值具有两个: ●content-box: 默认值,称为标准盒子模型。 该模型设置元素在HTML页面中所占区域为内容区+内边距+边框的宽度+外边距。 ●border-box: 称为怪异盒子模型,最早是由微软提出的。 该模型设置元素在HTML页面中所占区域为盒子的大小+外边距。. ? 外边距常见的问题 外边距重叠 外边距重叠的问题只出现在上外边距和下外边距中 左外边距和右外边距之间不存在外边距重叠 ?

    1.6K10发布于 2020-04-09
  • 来自专栏Soul Joy Hub

    模型AIGC系列课程 1-1】ChatGPT与OpenAI API的应用

    参阅:https://www.shenmezhidedu.com/jinri/haowen/gongju/7255.html 替代方案:https://poe.com/

    23410编辑于 2023-09-09
  • 来自专栏小康的自留地

    前端课程——弹性盒子模型

    弹性盒子模型 什么是弹性盒子模型 CSS3 新增了弹性盒子模型(Flexible Box 或 FlexBox),是一种新的用于在 HTML 页面实现布局的方式。 弹性盒子模型实现 HTML 页面布局是与方向无关的。不类似于块级布局侧重垂直方向,内联布局侧重水平方向。 轴(axis):每个弹性盒子模型拥有两个轴。 主轴(main axis):伸缩项目沿其一次排列的轴被称为主轴。 侧轴(cross axis):垂直于主轴的轴被称为侧轴。 弹性盒子模型的属性 定义弹性盒子模型 display : flex; display : inline-flex; flex:设置指定元素为块级元素的弹性盒子模型。 inline-flex:设置指定元素为行内块级元素的弹性盒子模型

    94120发布于 2020-04-09
  • 来自专栏我的技术

    进阶课程1:jvm内存模型

    局部变量,方法的形参/入参,异常处理语句的入参不允许在线程之间共享,所以不受内存模型的影响。 讲解 ​ JMM 是Java内存模型( Java Memory Model),简称JMM。它本身只是一个抽象的概念,并不真实存在,它描述的是一种规则或规范,是和多线程相关的一组规范。 如果没有JMM 内存模型来规范,就可能会出现,经过不同 JVM 翻译之后,运行的结果不相同也不正确的情况。 ​ 计算机在执行程序时,每条指令都是在CPU中执行的。 JMM的三特性 1.原子性 一个或多个操作,要么全部执行,要么全部不执行(执行的过程中是不会被任何因素打断的)。 而JAVA内存模型中规定,所有变量都存储在主内存中,主内存是共享内存区域,所有线程都可以访问。 ​ 但线程对变量的操作(读取赋值等)必须在自己的工作内存中进行。

    41100编辑于 2023-06-26
  • 来自专栏PaddlePaddle

    【AI核心技术】课程十四:循环网络模型-课程导引

    UAI与PaddlePaddle联合推出的【AI核心技术掌握】系列课程持续更新中! 今天的视频是循环网络模型-课程导引,21min带你迅速入门循环网络模型~ (友情提示:手机横屏看更舒服!) ?

    40220发布于 2018-07-26
  • 来自专栏创作是最好的自我投资

    通用模型VS垂直模型

    在人工智能这个充满无限可能的领域内,通用模型和垂直模型各有千秋。就我个人而言,在二者之间的选择上,并不存在偏向某一方的倾向。我觉得应当依据实际应用场景的具体需求,来挑选最为契合的模型。 通用模型通用模型,乃是旨在应对多种任务与数据类型的庞然物级人工智能模型。 在知识覆盖的广度方面,通用模型无疑具有明显的优势。当我们对于当下所需模型所涉及的精确专业领域的界限感到模糊不清时,选择通用模型无疑是一种明智之举。垂直模型接下来谈谈垂直模型。 然而,由于垂直模型的训练内容聚焦于当前行业,其涉猎的范围更集中,数据针对性更强,所以在提供专业咨询时往往更加精准、细致,这也正是垂直模型的独特价值所在。 因此,对于通用模型或者垂直模型,更倾向于哪一方不取决于个人想法,而是取决于用户需要。

    76301编辑于 2024-12-30
  • 来自专栏小洁叫你mysql

    【AI模型】训练Al模型

    模型超越AI 目前所指的模型,是“大规模深度学习模型”的简称,指具有大量参数和复杂结构的机器学习模型,可以处理大规模的数据和复杂的问题,多应用于自然语言处理、计算机视觉、语音识别等领域。 本文将探讨模型的概念、训练技术和应用领域,以及与模型相关的挑战和未来发展方向。 模型是指具有庞大参数数量的机器学习模型。传统的机器学习模型通常只有几百或几千个参数,而模型则可能拥有数亿或数十亿个参数。 训练模型的挑战 训练模型需要应对一系列挑战,包括: 以下是与模型相关的一些代码示例: 计算资源需求: import tensorflow as tf # 指定使用GPU进行训练 with tf.device 更智能的模型压缩技术:模型压缩和加速技术将继续发展,以减小模型的计算和存储开销。 更好的计算平台支持:为了支持训练和部署模型,计算平台将继续改进,提供更强大的计算资源和工具。

    1.5K30编辑于 2023-10-10
  • 来自专栏Michael阿明学习之路

    AI模型全栈工程师课程笔记 - RAG 检索增强生成

    课程学习自 知乎知学堂 https://www.zhihu.com/education/learning 如果侵权,请联系删除,感谢! 文章目录 1. RAG 2. RAG RAG(Retrieval Augmented Generation),通过检索获取一些信息,传给模型,提高回复的准确性。 向量检索 把一个词句映射到 n 维空间的一个向量 构建句对(相似和不相似),训练双塔式模型 https://www.sbert.net 向量相似度: 余弦距离dot(a, b)/(norm(a)*norm 余弦距离 和 欧氏距离 同时有效 哪种相似度计算有效要阅读模型的说明(通常都支持余弦距离计算) 6. for score, doc in sorted_list: print(f"{score}\t{doc}\n") 6.3 测试 检查预处理,文档是否切分合理 问题检索,是否能召回正确答案文档 模型根据包含正确答案的信息

    1.9K12编辑于 2023-12-09
领券