首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏AINLP

    【Github】GPT2-Chinese:中文的GPT2训练代码

    推荐一个Github项目:Morizeyao/GPT2-Chinese Chinese version of GPT2 training code, using BERT tokenizer. 推荐Star,项目链接,点击阅读原文可以直达: https://github.com/Morizeyao/GPT2-Chinese 以下来在该项目主页描述。 ---- GPT2-Chinese Description Chinese version of GPT2 training code, using BERT tokenizer. 使用方法 在项目根目录建立data文件夹。将训练语料以train.json为名放入data目录中。train.json里是一个json列表,列表的每个元素都分别是一篇要训练的文章。 {GPT2-Chinese: Tools for training GPT2 model in Chinese language}, year = {2019}, publisher = {GitHub

    10.6K50发布于 2019-08-28
  • 来自专栏相约机器人

    【Github】GPT2-Chinese:中文的GPT2训练代码

    推荐一个Github项目:Morizeyao/GPT2-Chinese Chinese version of GPT2 training code, using BERT tokenizer. 推荐Star,项目链接,点击阅读原文可以直达: https://github.com/Morizeyao/GPT2-Chinese 以下来在该项目主页描述。 ---- GPT2-Chinese Description Chinese version of GPT2 training code, using BERT tokenizer. 使用方法 在项目根目录建立data文件夹。将训练语料以train.json为名放入data目录中。train.json里是一个json列表,列表的每个元素都分别是一篇要训练的文章。 {GPT2-Chinese: Tools for training GPT2 model in Chinese language}, year = {2019}, publisher = {GitHub

    4.3K20发布于 2019-09-02
  • 来自专栏全栈程序员必看

    tinyxml2使用方法

    最近项目中使用到xml,最终选用了tinyxml2,学习后写个总结。 TinyXml2 主要类型: XMLNode: XMLNode is a base class for every object that is in the XMLDocument Object Model > TinyXML-2will happily read or write files without a declaration,however. child element nodes, for example: <root>Thisis bold</root> Atext node can have 2 XMLUnknown: Any tag that TinyXML-2doesn’t recognize is saved as an unknown.

    1.7K20编辑于 2022-06-28
  • 来自专栏Linux知识

    Hex2Bin使用方法

    下面简单举例介绍 HEX2BIN的使用:(最简单的方法是直接将Hex文件拖拽到hex2bin.exe) 确保Hex文件和hex2bin在同一目录下(也可以添加hex2bin的路径到系统环境变量,那样就不需要在同一目录下 ) 1.在当前文件夹下打开DOS命令窗口(win7下 在当前文件夹下按下shift 然后单击鼠标右键,选择在此处打开命令窗口) 2.直接输入hex2bin IIC.hex 回车 3.在当前目录下即生成了 Bin文件 64位Win7可用的Hex2Bin版本: https://download.csdn.net/download/qq_24835087/10675313

    87300编辑于 2025-02-19
  • 来自专栏新智元

    奥特曼本人确认:神秘gpt2不是GPT-4.5!

    编辑:桃子 LRS 【新智元导读】Altman本人确认,神秘gpt2-chatbot不是GPT-4.5。OpenAI下一代LLM还未确认何时发布,但搜索引擎似乎已经准备上线了。 「神秘gpt2-chatbot不是GPT-4.5」。 最近,Sam Altman在哈佛大学演讲中,向所有人确认了这不是OpenAI下一代的模型。 网友们纷纷猜测,可能是一个GPT-4.5/GPT-5级别的模型。 就连Altman本人发推表示,自己对gpt2-chatbot情有独钟。 不过,现在已经真相大白。 也就是说,gpt2-chatbot并非是GPT-4.5。 虽然GPT-4之后的下一代模型何时到来,仍旧未知,但OpenAI或许最近真的要憋个大的。 而且,还是要赶在谷歌I/O大会之前,截胡谷歌。 除了gpt2-chatbot不是GPT-4.5,Altman最近在斯坦福和哈佛还发表了什么观点?

    28010编辑于 2024-05-06
  • 来自专栏全栈测试技术

    HTMLReport使用2 | HTMLReport使用方法详解

    logging.info("测试") logging.debug("测试") logging.warning("测试") logging.error("测试") logging.critical("测试") 2 ") @ddt.data(*range(3)) def test_a(self, n): self.assertEqual(n, random.randint(0, 2) no_retry @ddt.data(*range(3)) def test_a(self, n): self.assertEqual(n, random.randint(0, 2) retry @ddt.data(*range(3)) def test_a(self, n): self.assertEqual(n, random.randint(0, 2) __class__.n += 1 logging.info(f"运行修改:{self.n}") def test_2(self): self.

    48230编辑于 2023-03-07
  • 来自专栏开源部署

    Oracle sqluldr2工具使用方法

    简介:Oracle数据导出工具sqluldr2可以将数据以csv、txt等格式导出,适用于大批量数据的导出,导出速度非常快。导出后可以使用Oracle loader工具将数据导入。 安装:下载:http://www.onexsoft.com/software/sqluldr2linux64.zip 解压zip包,复制sqluldr2_linux64_10204.bin到$ORACLE_HOME 的bin目录,重命名为sqluldr2 增加环境变量export LD_LIBRARY_PATH=$ORACLE_HOME/bin:$ORACLE_HOME/lib:/lib:/usr/lib 执行source 使用:sqluldr2 --help查看帮助 参数如下: user = username/password@tnsname sql = SQL file name query = select statement ="select * from test_table2" file=testtable2%B.txt batch=yes rows=500000

    1.5K10编辑于 2022-08-16
  • 来自专栏旅途散记

    GPT 讲Deno源代码(2)

    dimension: 描述数据的维度,包括2D、3D、Cubemap等。 size: 描述数据的尺寸,例如纹理的宽度、高度、深度等。 row_pitch: 描述数据的行字节数,即每行占用的字节数。

    29910编辑于 2024-05-10
  • 来自专栏Datawhale专栏

    图解GPT-2(完整版)!

    从这个意义上讲,GPT-2 基本上就是键盘应用程序中预测下一个词的功能,但 GPT-2 比你手机上的键盘 app 更大更复杂。 对 GPT-2 进行实验的一个很好的方法是使用 AllenAI GPT-2 Explorer(https://gpt2.apps.allenai.org/?text=Joel is)。 OpenAI 的 GPT-2 使用了这些 Decoder 模块。 1.5 语言模型入门:了解 GPT2 让我们拆解一个训练好的 GPT-2,看看它是如何工作的。 ? 1.7 GPT2 总结 现在我们基本知道了 GPT-2 是如何工作的。 2.3 GPT2 的 Self-Attention 让我们更详细地了解 GPT-2 的 masked attention。

    4.5K31发布于 2020-11-16
  • 来自专栏AI资讯

    全面解读:OpenAI GPT-4o模型及其获取与使用方法

    2.GPT-4o 最初将在 ChatGPT 和 API 中作为文本和视觉模型提供(ChatGPT 将继续通过预先存在的语音模式功能支持语音)。 在 OpenAI API 中访问 GPT-4、GPT-4 Turbo 和 GPT-4oGPT-4 Turbo 与 GPT-4oGPT-4o 具有相同的高智能性,但比 GPT-4 Turbo 更快、更便宜 2.速率限制:GPT-4o 的速率限制比 GPT-4 Turbo 高 5 倍——每分钟最多 1000 万个代币。3.速度:GPT-4o 的速度是 GPT-4 Turbo 的 2 倍。 2.同时,GPT-4o 还拥有 3D 视觉内容生成的能力,能够从 6 个生成的图像进行 3D 重建:3.这是一首诗,GPT-4o 可以将其排版为手写样式:4.更复杂的排版样式也能搞定:5.与 GPT-4o 付费可以2.普号的GPT-4o限制10条/3小时3.ChatGPT Plus限制GPT-4o消息80条/3小时,GPT-4仍然是40条,GPT-4用完后可以用GPT-4o,但是GPT-4o的80条用完后不能用

    1.8K00编辑于 2024-07-01
  • 来自专栏新智元

    Transformer结构及其应用详解——GPT、BERT、MT-DNN、GPT-2

    整个结构如下图所示: GitHub链接:https://github.com/namisan/mt-dnn 单向通用模型——GPT-2 GPT-2继续沿用了原来在GPT种使用的单向Transformer 严格来说GPT-2可能不算是一个多任务模型,但是它确实使用相同的模型、相同的参数完成了不同的任务。那么GPT-2是怎么使用语言模型完成多种任务的呢? GitHub链接:https://github.com/openai/gpt-2 Post Scriptum GPT-2其实最惊人的是其极强的生成能力,而如此强大的生成能力主要还是要归功于其数据质量以及惊人参数量和数据规模 GPT-2的参数量大到用于实验的模型都还处于欠拟合状态,如果接着训练,效果还能进一步提升。 对数据的规模和质量要求提高 GPT、BERT、MT-DNN、GPT-2虽然先后刷榜,但是我认为成绩的提升中,数据规模的提升占有比结构调整更大的比重。

    1.1K21编辑于 2023-08-05
  • 来自专栏全栈程序员必看

    简述py2exe的使用方法

    py2exe是一个将python脚本转换成windows上的可独立执行的可执行程序(*.exe)的工具,这样,你就可以不用装python而在windows系统上运行这个可执行程序。 py2exe已经被用于创建wxPython,Tkinter,Pmw,PyGTK,pygame,win32com client和server,和其它的独立程序。py2exe是发布在开源许可证下的。 下载py2exe 下载地址:http://sourceforge.net/projects/py2exe/files/py2exe/0.6.9/点击打开链接 2. 编写mysetup.py脚本 # mysetup.py from distutils.core import setup import py2exe setup(console=["****.py"] ) console后是需要转成2进制的python代码的路径地址 3.

    99230编辑于 2022-10-01
  • 来自专栏旅途散记

    GPT 讲Rust源代码--compiler(2)

    Rust的文档注释是以///开头的行,通常用于描述函数、结构体、模块等的用途和使用方法。该文件会解析这些注释,并生成HTML文档以便在rustdoc工具中显示。

    32010编辑于 2024-03-07
  • 来自专栏旅途散记

    GPT 讲Rust源代码--srctools(2)

    rust-analyzer 是一个 Rust 语言的语法分析器和语义分析器,用于提供代码补全、导航、重构等开发工具。而 rust-analyzer 的代码实现存储在 rust/src/tools/rust-analyzer 这个文件夹中。

    60910编辑于 2023-11-25
  • 来自专栏旅途散记

    GPT 讲Rust Cargo源代码(2)

    check 函数会逐个检查每个依赖项,首先判断该依赖项是否是一个 Git 仓库,如果是,则会使用 git2 库来获取其最新的版本号,并与 Cargo.toml 文件中指定的版本号进行对比。

    49810编辑于 2024-04-26
  • 来自专栏旅途散记

    GPT 讲Rust源代码--librarystd(2)

    例如,该文件包含了数学运算方法,如加法、减法、乘法、除法等;还包含了取整、取绝对值、求平方根、取反数等函数;以及用于比较2个f32值的方法,如相等、大于、小于等。 [1, 2, 3]会生成一个包含1、2、3三个元素的Vec对象。 println!宏:提供了一个类似于C语言中的printf函数的功能,可以在控制台上打印格式化的输出。 assert!

    37510编辑于 2023-10-25
  • 来自专栏旅途散记

    GPT 讲Istio源代码--pilot(2)

    在Istio项目中,watcher.go文件位于istio/pilot/pkg/keycertbundle目录下,它的主要作用是管理密钥和证书的观察者(watcher)。

    49520编辑于 2023-09-23
  • 来自专栏机器学习初学者精选文章

    【NLP】图解GPT-2(完整版)

    从这个意义上讲,GPT-2 基本上就是键盘应用程序中预测下一个词的功能,但 GPT-2 比你手机上的键盘 app 更大更复杂。 对 GPT-2 进行实验的一个很好的方法是使用 AllenAI GPT-2 Explorer(https://gpt2.apps.allenai.org/?text=Joel is)。 OpenAI 的 GPT-2 使用了这些 Decoder 模块。 1.5 语言模型入门:了解 GPT2 让我们拆解一个训练好的 GPT-2,看看它是如何工作的。 ? 1.7 GPT2 总结 现在我们基本知道了 GPT-2 是如何工作的。 2.3 GPT2 的 Self-Attention 让我们更详细地了解 GPT-2 的 masked attention。

    86820发布于 2020-11-17
  • 来自专栏旅途散记

    GPT 讲Rust源代码--srclibrustdoc(2)

    这个功能在生成Rust代码文档中的代码示例时非常重要,可以帮助用户更好地理解代码的使用方法和特性。

    65710编辑于 2023-11-23
  • 来自专栏数据科学(冷冻工厂)

    从头构建和训练 GPT-2 |实战

    引言 该项目[1]将引导您完成构建简单 GPT-2 模型的所有步骤,并使用 Taylor Swift 和 Ed Sheeran 的一堆歌曲进行训练。 构建 GPT-2 架构 我们将逐步推进这个项目,不断优化一个基础的模型框架,并在其基础上增加新的层次,这些层次都是基于 GPT-2 的原始设计。 我们将按照以下步骤进行: 制作一个定制的分词工具 开发一个数据加载程序 培养一个基础的语言处理能力 完成 GPT-2 架构的实现(第二部分) 该项目分为两个部分,第一个部分介绍语言建模的基础知识,第二部分直接跳到 GPT-2 实现。 我建议您按照本文进行操作并自己构建它,这将使学习 GPT-2 变得更加有趣和有趣。 最终模型: 1. 构建自定义分词器 语言模型不像我们一样看到文本。相反,它们将数字序列识别为特定文本的标记。

    34810编辑于 2024-07-16
领券