首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 生成人工智能语言模型)上线备案表

    相信看了我前几期文章的朋友们对模型备案的材料都已经有一个比较初步的了解了。近期收到有几个朋友反馈说,拿到了备案申请表,但不知道怎么填写。 以广东省为例,模型需要经过网信部门评估且满足两项条件:面向境内公众提供信息服务和具有舆论属性和社会动员能力的模型,方可领取备案申请表。二、上线备案申请表怎么填? 模型上线备案申请表一共涵盖六个部分,其内容主要是了解模型的一个基础信息、安全防范措施及安全评估的一个结果是否符合模型上线标准。 其中发并发服务能力也是一个比较难填写的部分,网信办会根据你填写的数据实际测试你的模型,若填写偏高或偏低,网信办会质疑你的实力和模型生成内容的安全性,一般我们都是根据客户模型的实际情况,给出一个合理的范围让客户填写 每月需定期对模型进行安全测试,定期更新拦截关键词库,确保模型服务始终处于安全、合规的运行状态。以上就是本篇文章的全部内容,有其他备案问题或者备案疑问的小伙伴可以后台交流。

    90801编辑于 2025-03-28
  • 生成人工智能语言模型)安全评估要点

    模型的评估维度涵盖了模型的多方面,数据安全它关系到我们每个人的隐私和权益不容忽视,在此,我整理了一些关于模型“安全评估”的一些要点,希望能够帮助到正在备案的友友们! #生成人工智能##模型##安全评估##aigc##备案##模型备案#一、语料安全评估(一)评估内容1.文本训练语料规模2.各类型语料规模3.训练语料来源4.语料标注数量5.标注人员情况6.标注规则 7.标注内容准确性核验8.语料合法性二、模型安全评估1.语料内容评估2.生成内容评估3.涉知识产权、商业秘密的评估4.涉民族、信仰、性别等评估5.涉透明性、准确性、可靠性等的评估三、安全措施评估1.模型适用人群 服务过程中收集保存个人信息3.收集个人信息征得个人同意情况4.受理处理使用者查阅、复制、更正、补充、删除个人信息请求的情况5.图片、视频标识情况6.接受公众或使用者投诉举报情况7.服务协议情况8.非法内容拦截措施9. 拒答率10.模型更新、升级

    60410编辑于 2025-08-19
  • 生成人工智能语言模型)上线备案表”填写指南

    随着生成人工智能技术的快速发展,相关要求企业对AI系统进行备案的政策也纷纷出台。而“生成人工智能语言模型)上线备案表”是进行模型备案流程里至关重要的一个步骤。 在这里我对“模型上线备案表”所需要撰写的信息进行了一个总结,希望可以帮到需要的友友们。 一、备案表的基本信息- 模型名称:可简洁明了反映AI功能- 单位全称:需与营业执照完全一致- 联系人电话:建议填写技术负责人或法务负责人- 主要功能:主要分为六类:人机对话、文字生成、图片生成、声音合成 、视频合成、代码生成或优化(根据自己模型的基本情况按需勾选)- 限定领域:未限定领域(通用领域)、限定领域(针对于医疗、金融、教育等行业的垂类模型)二、技模型研制1.模型备案情况- 是否采用已备案模型 六:填写生成AI备案表是企业合规经营的重要环节,建议:- 提前准备所需材料- 技术、法务团队协同完成- 如实填写,避免虚假陈述- 关注政策动态,及时调整通过规范填写备案表,不仅能满足监管要求,更能帮助企业系统梳理

    1K10编辑于 2025-08-11
  • 生成人工智能模型概述

    随着生成人工智能语言模型技术的快速发展,传统方法在面对非结构化数据(如自然语言文本、语音、图像等)和复杂场景时的处理能力已难以满足日益增长的分析需求。 1.2生成人工智能语言模型架构生成人工智能(GenerativeArtificialIntelligence,AIGC)是人工智能技术的重要分支,指基于深度学习、生成对抗网络(GAN)、变分自编码器 其本质是通过模型对数据的高维表示进行建模与泛化,从而实现条件驱动下的创意内容生成,典型GPT模型生成人工智能的有效解释,如图1.3所示。 关键内容包括:生成(Generative)预训练(Pre-trained)转换器(Transformer)图1.3GPT模型引导生成人工智能生成人工智能的发展可追溯至2014年IanGoodfellow 图1.4生成人工智能应用场景语言模型(LargeLanguageModel,LLM)是当前生成人工智能发展的核心技术,指在大规模文本语料上预训练的深度神经网络模型,具备自然语言理解、生成与推理能力

    61410编辑于 2025-12-07
  • 生成人工智能模型备案材料

    截止至今全国已累计通过了有538款生成人工智能服务完成备案,263款生成人工智能应用或功能完成登记。一、什么情况下要做大模型备案? 根据《生成人工智能服务管理暂行办法》第十七条,提供具有舆论属性或者社会动员能力的生成人工智能服务的,应当按照国家有关规定开展安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续 二、备案范围根据《生成人工智能服务管理暂行办法》,以下情况需要进行模型备案:①自主研发模型、有语料具备舆论属性与社会动员能力的需要备案②调用第三方基座、有舆论属性与社会动员能力、并进行微调、有语料的需要备案 ③第三方基座、无微调、训练、无语料只需要进行模型登记三、备案材料●模型上线备案表●安全评估报告●模型服务协议●语料标注规则●拦截关键词列表●评估测试题四、备案流程①首先要预约属地网信办预约进行线下领表 ,要带上自己的产品,网信办会当场对产品进行测试,测试提供后会下发模型上线备案表②认真撰写材料,材料分别有五部分,分别有:安全评估报告、模型服务协议、语料标注规则、拦截关键词列表、评估测试题等③网信办要求提供测试账号

    66610编辑于 2025-09-23
  • 来自专栏众森企服

    生成人工智能模型备案办理指南

    同年8月15日实施了《生成人工智能服务管理暂行办法》,主要是针对提供生成人工智能服务需要做大模型备案。 这样就形成了由算法备案制度和生成人工智能备案(下称“模型备案”)构成的“双备案制”的实践机制。 而模型备案自《《生成人工智能服务管理暂行办法》施行之日起仅有半年多,对于模型备案的流程、规则以及安全评估相关的具体事项,企业相关的经验也相对较少。 下面,众森企服小编就来给大家详细讲解下生成人工智能模型备案办理指南。一、什么是模型模型,即Foundation Models,通常是指具有大量参数和复杂结构的深度学习模型。 (6)评估测试题集:该测试题集需要包括生成内容测试题库、拒答内容测试题库、非拒答测试题库。测试题分类满足《生成人工智能服务安全基本要求》中相关的风险类型,并有最小的数量要求。

    7K41编辑于 2024-04-11
  • 生成人工智能模型备案”需要什么材料?

    一、需要撰写的材料1.模型上线备案表相当于模型的“身份证’包含模型名称、所属企业、调用方式、使用范围、适用人群、使用场景等基础信息。 重点要从以下几个维度说明:模型能力是否可控,是否支持拒答是否容易被诱导输出违法违规内容是否对图片/文本内容进行安全拦截训练语料来源是否合规,个人隐私保护3.模型服务协议就是用户使用你模型时必须同意的协议 (如用户协议、隐私政策)内容要涵盖用户使用范围、禁止事项模型生成内容的免责声明数据采集及使用声明用户信息处理规则 4.语料标注规则模型训练用的数据是怎么处理的? 5.拦截关键词列表在模型输入输出层设置敏感词拦截,如果触发,模型应该拒答。 ,拿到纸质备案表;2.撰写备案资料,开展安全自评估填写备案表、安全评估报告、语料标准规则等;3.准备模型测试账号准备给网信办老师的测试账号;4.全部材料提交属地网信办,审核约45个工作日全套材料和测试账号给到网信办审核

    60610编辑于 2025-09-08
  • 来自专栏存储知识

    深度解析内容生成AI背后的语言模型

    几个月前以ChatGPT为首的内容生成AI就已经火得不能再火了,然而,随着本周GPT-4和文心一言的发布,AI在国内外又“火上加火”了一次。 文心语言模型的基础层分为NLP模型、CV模型、跨模态模型、生物计算模型。但可惜的是,发布会上并没有现场演示环节,大众也不能直接使用该产品。 因此,想看清AI爆火背后的机会,真正形成自己的洞见和判断,最好的方法就是先牢牢抓住本次AI浪潮的核心:语言模型语言模型领域内的名词术语很多,看分析文字时,各概念间的逻辑关系也容易混淆。 随着ChatGPT这种语言模型的训练数据和参数量呈指数增长,这些操作需要更多的计算资源和存储资源,这是导致语言模型成本增加在原因。 以iPhone作类比,以GPT为首的语言模型是调用算力和数据的终极方式,AGI(通用人工智能,也是OpenAI的终极愿景)允许AI从有限任务变成几乎能取代或协助人类的所有思考任务。

    1.5K30编辑于 2023-03-16
  • 生成人工智能服务上线备案(模型备案)材料清单详解

    截止2025年6月31日,全国累计已有439款生成人工智能服务完成备案,233款生成人工智能应用或功能完成登记。 一、什么情况下需要做大模型备案? 根据《生成人工智能服务管理暂行办法》规定:提供具有舆论属性或者社会动员能力的生成人工智能服务的,应当按照国家有关规定开展安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续 自研模型 企业自主研发的模型,面向境内公众提供生成人工智能服务,且具备舆论属性或社会动员能力的模型就需要进行模型备案和算法备案。 3.调用第三方模型基座未经过二次开发及微调训练的 通过API接口或其他方式直接调用已备案模型能力的生成人工智能应用或功能,未经过二次开发及微调训练的,需要做大模型登记和算法备案。 三、模型备案材料清单 (1)生成人工智能服务上线备案表 核心内容: 基本信息:模型名称、版本号、应用领域、开发单位等。 服务范围:明确面向的用户群体、具体服务内容及服务方式。

    1.2K00编辑于 2025-07-31
  • 生成人工智能模型备案已通过企业一览

    4月8日国家网信办发布了最新一批生成人工智能通过备案的名单公告。截止25年3月底,全国共有346款模型在国家网信办完成备案,159款模型在地方网信办完成大模型登记。 为推动人工智能发展,各地方相继推出“地方补贴政策”,模型备案更是进入了白热化阶段。 北京在2024年11月发布了地区政策,明确表示“对新增获得国家互联网信息办公室生成人工智能模型备案的企业,给予一次性100万元支持。 具有较好市场应用效果的人工智能行业大模型,经评审认定,给予最高100万元支持。” 从2023年8月通过的第一批模型到2025年3月通过的最新一批模型公示来看,历经两年时间,全国总共通过备案的模型仅346款,可见模型备案的难度之高。

    1K10编辑于 2025-04-11
  • 来自专栏云云众生s

    使用语言模型生成SQL Schema

    我们发现将一个领域(出版)映射到另一个领域(SQL 的特定领域语言)非常符合 LLM 的优势。 我已查看了使用 LLM 生成的 regex 和 JSON 持久性,但许多人认为 AI 可以很好地处理结构化查询语言 (SQL)。 Schema 描述了一组表,这些表相互作用以允许 SQL 查询回答有关真实世界系统模型的问题。我们使用各种 约束 来控制表如何相互关联。 我们不使用一个表,而是使用三个表并在需要时引用它们。一个用于作者,一个用于出版商,一个用于书籍。我们在 Authors 表中编写作者的详细信息,然后使用 外键 在 Books 表中引用它们。 总结一下我们希望如何指导 LLM: 当用英语询问模式时,我们希望它生成三个表的 DDL,包括索引和约束。 如果需要,我们还可以暗示需要约束(主键、外键等)。 我们可以要求查看。

    56110编辑于 2024-05-06
  • 来自专栏众森企服

    模型备案指导|最新生成人工智能服务安全要求

    近日《生成人工智能服务安全基本要求》正式发布,文件包括遵守法律法规、尊重社会公德、保护个人信息和隐私等,为人工智能开发者们设立明确的合规标准,也给与AI生成产品进行模型备案做出了指导。 下面,众森企服小编给大家整理出来:一、相关名词1、生成人工智能服务generative artificial intelligence service利用生成人工智能技术向中华人民共和国境内公众提供生成文本 2、服务提供者 service provider以交互界面、可编程接口等形式提供生成人工智能服务的组织或个人。 1、模型适用人群、场合、用途方面:①应充分论证在服务范围内各领域应用生成人工智能的必要性、适用性以及安全性;②服务用于关键信息基础设施,以及如自动控制、医疗信息服务、心理咨询、金融信息服务等重要场合的 5、无法满足特定服务类型的安全需求该方面主要安全风险是指,将生成人工智能用于安全需求较高的特定服务类型,例如自动控制、医疗信息服务、心理咨询、关键信息基础设施等,存在的:①内容不准确,严重不符合科学常识或主流认知

    1.4K10编辑于 2024-08-20
  • 来自专栏AI科技评论

    直播 | “生成语言模型技术分享”系列之《Transformer 基础技术》

    随着语言模型的快速崛起,人们对自然语言处理技术的关注度也在不断提升。近年来,BERT、GPT等语言模型各显神通,其模型结构均可溯源至Transformer。 自2017年提出以来,Transformer已经迅速占据了整个自然语言处理领域,甚至在图像处理领域也开始发挥作用。 2023年4月27日(周四晚)18:30,来自东北大学自然语言处理实验室的李北将为大家带来《生成语言模型技术分享系列的首期报告——Transformer基础技术》,本次报告将带领您系统地学习Transformer 基础架构,了解其关键技术,并探讨它因何成为大型语言模型的基石。 诚邀所有关注自然语言处理与模型技术发展的朋友走进直播间,2023年4月27日(周四晚)18:30,我们期待与您的相遇! 更多内容,点击下方关注:

    37730编辑于 2023-04-26
  • 来自专栏新智元

    一文看尽SOTA生成模型9类别21个模型全回顾!

    生成模型种类繁多,发布速度也非常快,稍不留神就有可能错过了sota 最近,来自西班牙科米利亚斯主教大学的研究人员全面回顾了各个领域内AI的最新进展,将生成模型按照任务模态、领域分为了九类,并总结了 2022年发布的21个生成模型,一次看明白生成模型的发展脉络! 论文链接:https://arxiv.org/abs/2301.04655 生成AI分类 模型可以按照输入和输出的数据类型进行分类,目前主要包括9类。 因此,也只有这些公司,在收购的初创公司和与学术界合作的帮助下,能够成功部署生成人工智能模型。 目前GATO大约有1.2B个参数,可以实时控制现实世界机器人的模型规模。 其他已发表的生成人工智能模型包括生成human motion等。

    84930编辑于 2023-02-24
  • 来自专栏数据派THU

    一文看尽SOTA生成模型9类别21个模型全回顾!

    来源:新智元 极市平台本文约3800字,建议阅读5分钟本文总结了2022年发布的21个生成模型,一次看明白生成模型的发展脉络! 最近,来自西班牙科米利亚斯主教大学的研究人员全面回顾了各个领域内AI的最新进展,将生成模型按照任务模态、领域分为了九类,并总结了2022年发布的21个生成模型,一次看明白生成模型的发展脉络! 论文链接:https://arxiv.org/abs/2301.04655 生成AI分类 模型可以按照输入和输出的数据类型进行分类,目前主要包括9类。 因此,也只有这些公司,在收购的初创公司和与学术界合作的帮助下,能够成功部署生成人工智能模型。 目前GATO大约有1.2B个参数,可以实时控制现实世界机器人的模型规模。 其他已发表的生成人工智能模型包括生成human motion等。

    1.8K30编辑于 2023-03-29
  • 来自专栏量子位

    AI模型加持,生成搜索来了!

    百度发布“文心百中”,用AI模型技术驱动的产业级搜索系统。构建企业内部搜索引擎的人力成本减少90%以上,同时只需要极低数据。 先看跨模态模型知一,AI技术在搜索场景落地的代表。 简单来说,知一模型可以从全网形态各异的资源中持续学习,无论是文本、图片、视频还是结构化信息都可以融会贯通。 从技术层面讲,知一使用了百度文心模型技术。大规模预训练技术提升模型性能,蒸馏压缩率高达99%的模型小型化技术以降低成本,得以在搜索场景全面应用。 比如虚拟人技术加持下,可以实现交互对话,单纯的搜索之外又有了聊天、陪伴需求。 正如百度研究院在年初的十科技趋势中所预测的,AIGC(AI Generated Content,人工智能生成内容)在今年大放异彩。

    73910编辑于 2023-02-28
  • 生成人工智能模型)服务上线备案常见问题解答

    最近收到部分小伙伴反馈,在信息爆炸的时代,长篇论没有耐心看完,想要直接一点的攻略信息。针对大家的问题直接给大家整理了一份简洁问答的攻略,纯干货,建议收藏!part1:整个备案流程是怎样的? 答:模型备案是由属地网信办初审,各省市的要求不太一样,以下是大概笼统流程:企业与属地网信办沟通并演示模型,领取备案申请表企业内部准备备案材料和模型安全评估上交属地网信办属地网信办审核材料并测试模型属地网信办通过后 part2:模型上线备案申请表有没有具体的填写规范和要求? 如有疑问,可提前与属地网信办沟通确认part5:备案成功后,在使用和宣传模型时,还有哪些需要注意的合规事项? 答:备案是企业合规运营的起点,备案成功后企业仍要确保模型生成内容合法合规,不传播违法违规、虚假有害信息。需在官网公示备案编号及安全声明,开放用户投诉渠道,并在 48 小时内响应用户投诉。

    55210编辑于 2025-06-11
  • 来自专栏红蓝对抗

    面向模型生成-利用越狱攻击

    文章首发在:奇安信攻防社区https://forum.butian.net/share/4242目前做安全模型或者说做大模型安全,基本都会有必要的两步,分别是对齐以及红队。 开放源码的语言模型尤其令人担忧,因为其代码和训练数据是公开的,任何人都可以访问、修改甚至恶意利用对齐与红队目前做安全模型或者说做大模型安全,基本都会有必要的两步,分别是对齐以及红队。 近期发在人工智能顶级会议ICLR 2024上的一个工作就提出了相关的方案,见参考4,这也是我们本文要分析与复现的基础。在这种方案中,只操纵文本生成配置就可以。如下图所示。 这提示语会影响生成语言模型的响应风格和内容。这段代码的整体作用是为加载和使用生成语言模型(如 GPT 类模型)提供基本的环境和配置。这段代码定义了两个函数,分别用于处理系统提示语和获取句子嵌入。 日志记录:logging.info(f"Model size: {model.get_memory_footprint()/1e9}") 记录模型的内存占用大小(以GB为单位)。

    78320编辑于 2025-04-22
  • 来自专栏人工智能之语言领域

    人工智能语言领域 自然语言处理 第十六章 生成预训练模型

    人工智能语言领域第十六章生成预训练模型@TOC前言生成预训练模型生成预训练模型(GenerativePre-trainedModels)是自然语言处理(NLP)迈向通用人工智能的关键一步。 与仅能“理解”语言的判别模型(如BERT)不同,生成模型能够主动创造连贯、合理、多样化的文本,广泛应用于对话系统、内容创作、代码生成等领域。 16.1生成预训练模型概述16.1.1生成与判别模型的区别特性判别模型(Discriminative)生成模型(Generative)目标学习$P(y|x)$:给定输入,预测标签学习P(x)P 掩码预测)CLM(自回归)或Seq2Seq(降噪)输出形式固定标签或span可变长度序列通俗比喻:判别模型像“阅卷老师”:判断句子是否正确生成模型像“作家”:从零开始创作新句子展开代码语言:TXTAI 、扩散模型和多模态模型》《从零构建语言模型(中文版)》《实战AI模型》《AI3.0》

    21910编辑于 2026-03-19
  • 来自专栏857-Bigdata

    入门生成语言模型(Generative Language Models)

    了解生成语言模型的基本概念 了解生成语言模型是一种能够生成文本或其他类型数据的模型,通常基于神经网络等技术,能够学习语言的结构和规律,从而生成类似人类写作风格的文本。 2. 学习如何评估生成语言模型的性能,例如使用困惑度(Perplexity)等指标。 5. 实践项目和案例 参与生成语言模型相关的项目和竞赛,如文本生成、对话生成等。 独创PEFT结合低比特和分布并行策略,大幅降低模型精调硬件门槛。 模型无损量化。 生成语言模型的验证数据集 生成语言模型的验证数据集是评估这些模型在特定任务或语言理解能力方面性能的重要工具。 )SuperCLUE是一个综合性模型评测基准,本次评测主要聚焦于模型的四个能力象限,包括语言理解与生成、专业技能与知识、Agent智能体和安全性,进而细化为12项基础能力。

    1.7K11编辑于 2024-05-20
领券