首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏NLP/KG

    模型应用模型AI Agent在企业应用中的6种基础类型,企业智慧升级必备

    模型应用模型AI Agent在企业应用中的6种基础类型,企业智慧升级必备 AI Agent 智能体在企业应用中落地的价值、场景、成熟度做了分析,并且探讨了未来企业 IT 基础设施与架构如何为未来 简单地将模型的生成能力通过 API 集成到其他应用与业务流程中,替代或简化原来由人工完成的部分工作。 通俗地说,就是在企业应用中,通过 “外挂” 私有知识库来扩充模型的知识储备,以提供基于自然语言的、对话式的企业私有知识访问(对应到 AI Agent 的基本能力之一:持久化记忆),以解决通用模型在面向企业应用时领域知识不足导致的幻觉问题 6.自定义流程助手 最后一种 AI Agent 严格来说是上面的几种基础 Agent 能力的组合。 但是在企业应用中,由于企业知识、应用、业务需求的千差万别,以及模型自身的不确定性,如果这么做,那么结果很可能是 “开盲盒” 一样的不可控。

    3.1K33编辑于 2024-05-07
  • 分享6类10种政务AI模型应用场景

    模型是指具有大规模参数和复杂计算结构的机器学习模型。这些模型通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数。模型的设计目的是提高模型的表达能力和预测性能,能够处理更加复杂的任务和数据。 模型在各种领域都有广泛的应用,包括自然语言处理、计算机视觉、语音识别和推荐系统等。模型通过训练海量数据来学习复杂的模式和特征,具有更强大的泛化能力,可以对未见过的数据做出准确的预测。 6类政务AI模型应用场景:政务咨询领域:通过构建具备深厚专业知识的智能助手,针对财务、环保等专业领域,提供精确的咨询和解答服务。这有助于提升企业和公众的办事体验,同时增强政府机构的工作效率。 城市治理领域:模型专注于快速响应民意诉求、智能分类问题、高效处理事件工单等城市治理需求,开发特色应用,提高城市事件处理的效率,提升城市治理的智能化水平。 专业工具开发:应用模型技术,在业务统计分析、报告报表生成、法律法规咨询等专业领域,开发一系列通用工具,帮助公务人员高效开展工作,同时协助企业和公众理解专业知识。

    2.6K10编辑于 2024-08-06
  • 来自专栏大模型&AIGC

    6模型微调技术

    我们将前缀微调应用于GPT-2进行表格到文本的生成,以及应用于BART进行文本摘要。 input和target,则使用原始的input embedding(5) 使用方式离散和连续template token混合时,显示地插入一下anchor(离散的token)有助于template的优化(6) ,无需verbalizer(4) 特点在小、模型上,效果均优于P-tuning。 当参数量达10B,效果相当于FT6.LoRA(2021)(1) 论文信息来自论文:《LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS》(2)摘要自然语言处理的一个重要范式包括在通用领域数据上进行大规模预训练 Model),学习目标为而加入LoRA后,学习目标为:(6) 配置在多个部位$(Q/K/V/Output)$同时添加$\bigtriangleup W$ ,会比只在单一部分上添加权重$\bigtriangleup

    2.6K00编辑于 2025-05-08
  • 来自专栏大模型应用

    模型应用:情感分析模型微调深度分析:从基础预测到性能优化.6

    在实际应用中,我们经常会遇到这样的问题:模型在测试集上准确率很高,但在真实场景中表现不佳;或者模型对某些类型的文本始终无法正确分类。这些问题都需要通过深入的模型分析来解决。 模型初始化:加载预训练的中文BERT模型和分词器2. 数据处理:将中文文本转换为模型可接受的输入格式3. 监控验证集性能:确保在验证集上评估模型,并根据验证集性能调整超参数。尝试不同的模型:如果当前模型表现不佳,可以尝试使用不同的预训练模型,例如在中文情感分析任务上表现较好的模型。 注意:在实际应用中,我们需要权衡覆盖率和准确率。如果应用场景要求高准确率,可以设置较高的阈值;如果要求覆盖尽可能多的样本,则设置较低的阈值。 、概率分布等指标,形成系统性方法确保效果:建立完整的分析-诊断-改进循环,确保持续优化,并针对不同应用场景,调整分析重点和优化策略。

    35233编辑于 2026-02-03
  • 来自专栏xiaosen

    LangChain模型应用开发

    LangChain作为一个新兴的框架,旨在简化模型应用的开发过程。它提供了一套工具和接口,帮助开发者将模型无缝集成到各种应用场景中。 prompt) print(response.content) 这时我们的langSmith后台: 构建语义搜索引擎  我们使用LangChain的文档加载器、嵌入、向量库来从其他来源检索数据,与模型工作集成 ,这对于获取数据作为模型推理的一部分进行推理的应用程序非常重要,例如检索增强生成或RAG。 1️⃣根据与字符串查询的相似性返回文档: # 接受一个文本字符串作为输入,并返回与该文本最相似的向量 results = vector_store.similarity_search( "模型的发展和繁荣既是当前 ("模型的发展是顶峰") # 接受一个嵌入向量作为输入,并返回与该向量最相似的向量 results = vector_store.similarity_search_by_vector(embedding

    57021编辑于 2024-12-04
  • 模型应用开发实战

    模型下载 目前国内外的通用模型可以用密密麻麻来形容,gitee上面已经收录了1万多个了:https://ai.gitee.com/models 。 Net有WebAPI + IIS,java有spring boot+tomcat,模型有FastAPI+Uvicorn:FastAPI 用于构建应用的业务逻辑,Uvicorn 是运行这些应用的服务器。 (图5) 我们用postman等客户端工具测试一下: (图6) 编写客户端 服务端有了,当然要做个漂亮的客户端,总不能一直用postman。不得不吐槽下,模型也搞前后端分离这套!. 怎么着也得个应用程序APP之类,再不济也得有个Web吧!好吧,安排!为了搞模型的人能安心研究模型,不用花精力在界面上。 最后 经过无数的蹂躏,我开发了个小应用【i歌词】,无任何条件免费提供全部源码。它基于chatglm4-9b模型,从部署到训练,通用对话功能,核心根据歌名查歌词并创作歌词!

    1.2K36编辑于 2024-09-01
  • 来自专栏深度学习与python

    LangChain:简化模型应用

    作者 | Guy Nesher 译者 | 平川 策划 | Tina LangChain 框架提供了常见用例的抽象,简化了大型语言模型(LLM)(如 OpenAI GPT4 或 Google PaLM)的应用。 通常,比较复杂的应用程序会使用多个组件来生成所需的结果。 我们将用 SimpleSequentialChain 做个演示,它会按顺序运行多个提示。 今日好文推荐 爱奇艺VR公司业务停滞,员工或被欠薪;阿里云开源通义千问 70 亿参数模型,免费可商用;华为正式发布鸿蒙 4,接入模型|Q资讯 年薪超 600 万,比技术总监还高:电影行业 AI 产品经理的崛起 模型竞争突然升级!亚马逊 CEO 亲自监督、组建新的核心技术团队,集中优势资源打造“最具野心”的语言模型

    43230编辑于 2023-09-08
  • 来自专栏xiaosen

    模型应用框架-LangChain

    LangChain自身并不开发LLMs,它的核心理念是为各种LLMs实现通用的接口,把LLMs相关的组件“链接”在一起,简化LLMs应用的开发难度,方便开发者快速地开发复杂的LLMs应用。 ,LangChain主要支持6种组件: Models:模型,各种类型的模型模型集成,比如GPT-4 Prompts:提示,包括提示管理、提示优化和提示序列化 Memory:记忆,用来保存和模型交互时的上下文状态 LLMs: 语言模型接收文本字符作为输入,返回的也是文本字符. 聊天模型: 基于LLMs, 不同的是它接收聊天消(一种特定格式的数据)作为输入,返回的也是聊天消息. 2.1.1 LLMs (语言模型) LLMs使用场景最多,常用模型的下载库:https://huggingface.co/models: 接下来我们以「文心一言」模型为例, 使用该类模型的组件: 第一步 因为模型虽然非常强大,但是也具备一定的局限性,比如不能回答实时信息、处理数学逻辑问题仍然非常的初级等等。因此,可以借助第三方工具来辅助模型应用

    1.1K10编辑于 2024-06-04
  • 来自专栏6G

    6G,AI , 与模型?

    6G与AI融合的未来方向 6G 网络的内生 AI 设计将赋能网络的AI模型,同时使网络能够支持 AI 模型的训练和服务。 另外,从小模型模型,生产效率跨越式提升基础通用模型具有泛化性,网络智能化将从用例驱动转变为能力驱动,迅速降低应用开发门槛,加速 AI 工程化、规模化落地。 6G 网络将承担数据采集、预处理等数据服务,为云AI训练提供更好的支持。此外,6G 网络的分布式部署将使得 AI 模型更靠近用户侧,从而在时延方面具有潜在优势。 在数据获取和处理方面,与 ChatGPT 不同,网络中存在大量结构化数据,且网络不同问题间的共性不清晰,网络 AI 模型面临较大挑战。6G 网络面临如何有效采集适合AI模型训练的数据的挑战。 而在构建 AI 模型的路径上,需要分阶段探索,从离线小规模模型开始,逐步过渡到实时大规模模型,最终实现统一的网络 AI 模型。 本文摘自于中国移动的“6G内生AI架构及AI模”汇报材料。

    40810编辑于 2024-04-24
  • 来自专栏后台技术汇

    模型应用之(4):Langchain架构与模型接入

    背景 LangChain 是一个用于开发由大型语言模型(Large Language Model,LLM)驱动的应用程序的框架。 旨在简化使用大型语言模型应用程序。 Langchain架构 LangChain工具 组件:模型包装器、聊天模型包装器、数据增强工具和接口链: 提供了标准接口,和数据平台和实际应用工具紧密集成 LangChain六模块 模块 核心作用 v=9qq6HTr7Ocw 小结: 各模块采用松耦合设计,可通过标准化接口组合使用 实际应用中通常以链为核心组织工作流(如检索QA链=数据增强+模型I/O+记忆) 回调系统提供贯穿所有模块的可观测性能力 Agent作为高级模块,可调用其他所有模块功能 模型接入 接入示例 云服务和私有化模型优劣对比 维度 开发成本 算力成本 运维成本 数据安全 云厂商模型 较低,开箱即用 算力资源充足,模型性能好 &吞吐量较高 较低,提供云平台监控 安全性低 私有化模型 较高,自建模型网关、服务鉴权、可用性等 算力硬件投入成本高,模型性能较差低&吞吐量较低 较高,需要专业运维团队介入 安全性高,保密性强

    70810编辑于 2025-08-04
  • 来自专栏澜舟科技 NLP

    模型落地实践:同花顺模型技术应用及优化

    文内从业务角度介绍了模型技术在同花顺业务上的应用以及未来探索的方向。众所周知,模型参数量大,通用能力强,综合性能好。 这个问句量和用户量在问答系统中应该算非常的。图片问财对话系统在模型应用上有几个难点。首先,它偏重金融业务知识,并且对于时效性要求很高。 这里特别说明一下“时效性”的问题。 确实在我们的业务模型里,规则占比非常,也是因为涉及用户财产问题,技术上会比较保守。下面具体介绍问答系统里模型应用的经验和取得的成果。 模型的参数增加会带来效果的提升,但是在实际应用的经济角度考虑,宁可损失一些效果,尽量减少对资源的占用,所以我们投入了很大的精力做“模型轻量化”工作。 总结模型技术在同花顺业务中的应用基本都有比较好的通用性,并且带来了比较好的性能提升,我们也希望在医疗、法律、教育等领域的子公司业务中推广,同时和澜舟科技以及学术界的老师们合作,把模型用得更好,谢谢大家

    3K20编辑于 2022-08-11
  • 基于语言模型应用

    在AI领域,语言模型已成为备受瞩目的焦点,尤其在自然语言处理(NLP)领域,其应用愈发广泛。BLM作为一种多任务语言建模方法,旨在构建一个具备多功能的强大模型。 NLP中的文本生成任务通常需要使用大规模预训练模型进行训练,例如 BERT、GPT-2等。在预训练阶段,这些模型将使用大量语料库对其进行训练。 悦数图数据库凭借其前沿的图技术,为语言模型注入了万亿级的丰富上下文,显著提升了模型的回答准确度,为企业级应用提供了强大的支持。 通过引入悦数图数据库,企业能够以更低的费用成本和更短的时间成本,实现模型落地应用。这不仅优化了企业的运营效率,还提高了决策的准确性,为企业在激烈的市场竞争中赢得了宝贵的时间和资源。 未来,随着技术的不断进步和应用的深入拓展,悦数图数据库将继续为语言模型领域注入新的活力,推动企业级应用走向更加智能、有效的新时代。

    43010编辑于 2024-04-30
  • 图解模型与实战应用

    而如果你想真正理解这些改变背后的技术逻辑,亲手构建属于自己的 LLM 应用,那么这本 《图解模型》 将是一本不可错过的实战之书。 图片 生成式搜索在搜索流程的末端生成答案和摘要,同时引用其来源(由搜索系统的前序步骤返回) 6. 模型在搜索引擎中的应用 第 8 章还探讨了语义搜索在 Google、Bing 等搜索引擎中的应用,讲解了 reranking(重排序)优化搜索结果的工程机制,内容很硬核。 图片 微调后的 BERT 模型能够识别人名和地点等命名实体 10. 模型训练与微调 这一部分是我最期待的内容之一——将模型(LLM)适配到特定的应用场景,展现了它们的灵活性和广泛的适用性。 图片 专门用于特定任务的适配器可以被替换到相同的架构中,前提是它们共享原始模型架构和权重---- 300 幅全彩插图,以极致视觉化的方式呈现模型的核心原理与工程实现,覆盖从底层机制、应用开发到性能优化的完整链条

    18110编辑于 2026-03-13
  • 来自专栏喔家ArchiSelf

    模型应用的能力分级

    模型应用的能力分级就像给学生打分一样,能让我们更清楚它的本事有多大。能力分级能帮我们设定目标,知道AI现在能干什么,未来还要学什么。 模型应用主要有两种常见模式:RAG 和 Agent。选哪种 RAG 架构,得看具体要解决什么问题,确保它适合任务需求。 关于RAG 的更多资料,可以参考《模型系列——解读RAG》、《RAG的10篇论文-2024Q1》、《Chunking:基于模型RAG系统中的文档分块》、《解读GraphRAG》和《在模型RAG系统中应用知识图谱 》、《基于模型(LLM)的Agent 应用开发》和《当你问代理机制的时候? 小结 将模型应用的能力进行分级,不仅有助于推动技术发展,还能更好地匹配实际应用场景,同时也让公众更容易理解其价值。

    1.8K20编辑于 2025-03-31
  • 来自专栏AI技术应用

    AI教育模型及其应用

    人工智能在教育领域的应用日益深入,涌现出许多AI教育模型,它们致力于提升教学效率、优化学习体验、推动教育公平。 以下是一些国内外知名的AI教育模型及其应用:国内AI教育模型:科大讯飞星火语伴: 基于科大讯飞星火认知模型,主要应用于语言学习领域。 好未来MathGPT: 好未来(学而思)自研的数学学习模型,专注于数学学科的学习。网易有道子曰教育模型: 国内首个教育模型,已率先推出六应用,并在词典笔等学习硬件上实现全科辅导。 天工大模型(昆仑万维): 国内首个对标ChatGPT的双千亿级语言模型,也是AI搜索引擎和对话式AI助手。EmoGPT(华东师范大学): 自研模型,主要应用于心理疏导。 国外AI教育模型:Khanmigo(可汗学院): 基于ChatGPT-4,应用于多学科学习,为学生提供个性化问答和深度思考支持。

    94110编辑于 2025-06-19
  • 来自专栏muller的测试分享

    语言模型应用框架介绍

    语言模型应用框架针对上述限制,直接调用语言模型似乎并不是最佳选择,因此出现了基于语言模型应用框架,旨在解决这些问题。 语言模型应用框架通常指的是使用已有的模型进行各种自然语言处理任务时所采用的软件架构或工具集,这些应用框架提供了一种便捷的方式,使得开发者能够利用语言模型的强大能力解决特定的问题。 开放文档 丰富的示例代码和教程可能存在不完善或难以理解的情况社区活跃 活跃的社区支持和交流社区活跃度较低 更新维护频率持续的更新和改进 更新维护频率不稳定 目前有多种语言模型应用框架 包括 LangChain 的设计理念,兼具易用性(LCEL)与很强的拓展性,都成为学习语言模型应用框架的首选如何学习语言模型应用框架学习语言模型应用框架应当循序渐进,所以本课程主要分为 5 个模块 总结了解什么是语言模型应用框架。了解语言模型应用框架的应用场景。了解常见的语言模型应用框架。了解语言模型的学习路线。

    50710编辑于 2024-09-04
  • 来自专栏AI

    AI语音模型应用

    AI语音模型应用已渗透到日常生活、行业服务及社会发展的多个领域,凭借“自然交互、智能理解、多场景适配”的核心优势,重构了人机交互方式并推动效率革新。以下从典型场景出发,梳理其核心应用价值。 这类应用显著提升了弱势群体的数字生活参与度。2. 公共服务政府与公共机构利用语音模型优化服务体验:政务热线通过语音交互快速解答政策咨询(如“异地就医如何备案?”) 四、技术融合趋势:从单一功能到生态协同当前,AI语音模型正与视觉(图像识别)、触觉(传感器数据)等多模态技术融合,进一步拓展应用边界。 未来,随着声纹识别(身份验证)、情感计算(情绪感知)等技术的成熟,语音模型将更懂“人”的需求,成为连接物理世界与数字世界的核心入口。 总结AI语音模型应用本质是通过“自然语言交互”降低技术使用门槛,同时以强大的智能理解能力解决实际问题。

    69011编辑于 2025-09-29
  • 模型的2025:6个关键洞察

    Cursor与语言模型应用的新层级Cursor最引人关注的点(除了其2025年的爆发式增长),在于它清晰揭示了语言模型应用的一个全新层级,人们开始普遍讨论“某领域的Cursor模式”。 正如我在今年Y Combinator演讲中强调的,像Cursor这样的语言模型应用,核心价值在于为特定垂直领域整合并编排语言模型调用逻辑,具体体现在以下方面:-处理“上下文工程”,优化提示词设计与上下文管理 2025 年,行业内围绕这一新应用层的“厚度”展开了大量讨论:语言模型实验室是否会通吃所有应用场景?还是说垂直领域的语言模型应用仍有广阔蓝海? 我个人的观点是,语言模型实验室更倾向于培育“通识能力极强的大学生”式模型,而语言模型应用则通过整合私有数据、传感器、执行器及反馈闭环,对这些“大学生”进行针对性组织、微调,最终驱动它们成为特定垂直领域的 同理,语言模型也应采用人类偏好的格式进行交互——通过图像、信息图、幻灯片、白板、动画/视频、网页应用等可视化形态。

    58110编辑于 2025-12-24
  • 来自专栏AIGC新知

    应用洞察 | 从模型数据,看模型的前瞻应用场景在哪里?

    对比海外AI独角兽Anthropic旗下claude和国内字节旗下的豆包模型使用数据,可以找出相关规律。 很大一部分对话 (近 6%) 涉及业务战略和运营 (包括起草专业通信和分析业务数据等任务)。 Claude 的用法因不同国家的语言而异,反映了不同的文化背景和需求。 从上面这张图,可以看到,不同语言的人,对AI应用的方面也大相径庭。 豆包家族模型语言模型之后,字节将视觉理解模型价格降低,视觉理解模型也迎来“厘时代”。 更低的价格,仍有合理的毛利,对于用户来说,不仅仅实惠,而且更加好用,真正的普惠于民。 这些数据,力证豆包模型能力之强。 B端,豆包已经与国内汽车、手机、PC终端厂商进行合作,已经覆盖了3亿设备,这些智能终端的模型调用量半年时间增长100倍!!

    60710编辑于 2024-12-24
  • 来自专栏大模型应用

    模型应用:多卡集群跑满14B模型模型推理算力应用实践.66

    算力核心概念TFLOPS/PFLOPS:算力基础单位:1 TFLOPS=10¹² 次 / 秒浮点运算,1 PFLOPS=1000 TFLOPS;模型推理算力需求 = 模型参数量 ×Token 数 × 请求分配与推理: 将调整后的批大小应用到GPU批池执行批推理计算更新GPU利用率指标6. 多卡自动分片:使用device_map="auto"自动将模型分配到多个GPU5. 推理优化:禁用梯度计算,减少内存占用,提升推理速度6. 是真真正正能落地的企业级模型推理算力优化方案! 整套流程把监控、部署、调度全流程都做了工程化封装,拿来就可以调整应用,不用自己从头造轮子。

    20632编辑于 2026-04-04
领券