首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏悠扬前奏的博客

    Pandas-11. 文本操作

    Pandas-11. 文本操作 以如下代码作为例子: s = pd.Series(['Tom ', ' William Rick', 'John', 'Alber@t']) lower() 将Series/Index中的字符串转换为小写

    52930发布于 2019-05-29
  • 来自专栏AI SPPECH

    11_文本总结实战:用LLM浓缩长文章

    本文将带您深入了解文本摘要的核心概念、技术原理以及实战应用,重点介绍BART模型在文本摘要任务中的应用,并通过丰富的代码示例展示如何实现高效的文本摘要系统。 一、文本摘要基础 1.1 文本摘要的定义与类型 文本摘要是指将一篇或多篇文档转换为简短、连贯且包含原文档主要信息的摘要文本的过程。 Transformer,能够捕获输入文本的完整上下文信息 自回归解码器:解码器部分采用自回归方式生成文本,确保输出的连贯性 文本损坏预训练:在预训练阶段,模型通过多种方式损坏输入文本(如掩码 3.4 批量处理文本摘要 在实际项目中,我们经常需要处理大量文本。 四、长文本处理技术 4.1 长文本处理的挑战与解决方案 在实际应用中,我们经常需要处理超出模型上下文窗口长度的长文本

    72211编辑于 2025-11-13
  • 来自专栏一“技”之长

    iOS MachineLearning 系列(11)—— 自然语言识别与文本分析

    iOS MachineLearning 系列(11)—— 自然语言识别与单词分析 在上一篇文章中,我们介绍了使用NaturalLanguage框架来进行自然语言的拆解,可以将一段文本按照单词,句子或段落的模式进行拆解 其实,NaturalLanguage框架本身也提供了语言识别的能力,其可以分析一段文本所对应的语言,同样对于包含多种语言的文本,其可以分析出各种语言的占比。 语言识别是其他高级自然语言处理任务的基础,本篇文章还将介绍NaturalLanguage关于文本分析的能力,其能够对文本中的人名,地名和组织名进行识别,也可以对词性进行分析,如动词,名词。 甚至我们还可以分析文本的积极或消极程度来推测内容的取向,从而帮助开发者开发出更加智能的应用。 文本分析支持对单词进行分析,也支持对句子和段落进行分析。

    1.2K10编辑于 2023-05-07
  • 来自专栏终身学习者

    【网页特效】11文本输入和 6 个按钮操作 特效库

    文本输入特效 1.power-mode-input PowerModeInput 可以让你的文本输入框更引人注目。 地址:https://github.com/lindelof/power-mode-input image.png 2.TextInputEffects 简单的样式和效果,可增强文本输入交互。 该插件在鼠标滑过指定的文本时,文字会不停的逐个进行翻转,类似洗牌效果,非常炫酷。 地址: https://github.com/ics-ikeda/shuffle-text ? 无相关性,超轻量,仅 1.5 缩小,或者 0.8 KB缩小和压缩 9.tinytyper TinyTyper 一个微小的库用于在一段指定的文本元素上创建打字效果。 11. Phaser-typewriter Phaser.io Javascript库的打字机效果包装器。

    3.4K40发布于 2020-09-03
  • 来自专栏机器学习技术分享

    11. HanLP实现朴素贝叶斯SVM--文本分类

    笔记转载于GitHub项目:https://github.com/NLP-LOVE/Introduction-NLP 11. 文本分类 上一章我们学习了 文本聚类,体验了无须标注语料库的便利性。 load_text_classification_corpus.py https://github.com/NLP-LOVE/Introduction-NLP/tree/master/code/ch11 有关支持向量机(SVM)的原理详见我的博客,这里不加详细介绍: http://mantchs.com/2019/07/11/ML/SVM/ 线性支持向量机文本分类器实现 实现代码详见: svm_text_classification.py : text_classification_evaluation.py https://github.com/NLP-LOVE/Introduction-NLP/tree/master/code/ch1111 章:文本分类 第 12 章:依存句法分析 第 13 章:深度学习与自然语言处理

    1.9K10发布于 2020-02-21
  • 来自专栏猫头虎博客专区

    2013年11月26日 Go生态洞察:Go中的文本规范化

    2013年11月26日 Go生态洞察:Go中的文本规范化 摘要 嗨,我是猫头虎!今天我们来探索Go语言中一个重要但经常被忽视的主题:文本规范化。在处理多语言文本时,理解和实现文本规范化是至关重要的。 引言 在Go的多语言文本处理中,文本规范化占据了核心地位。本文将重点介绍Go文本库中的go.text/unicode/norm包,它处理的正是文本规范化这一主题。 正文内容 什么是文本规范化? 正确的文本修改 当需要修改文本时,norm包可以帮助保持正确的字符边界。例如,在添加或替换文本时,考虑到字符可能跨越多个符文。 使用unicode/norm包可以在与外界通信时规范化文本 外观相似字符 兼容性规范形式有助于映射视觉上相似的字符 文本修改 | norm包帮助维护正确的字符边界 | | 迭代和转换 | 提供工具处理字符边界和进行文本转换 然而,为了确保在与外部通信或进行高级文本操作时文本是规范化的,这个包仍然非常有用。本文已被猫头虎的Go生态洞察专栏收录,详情点击这里。

    28510编辑于 2024-04-09
  • 来自专栏河湾欢儿的专栏

    文本

    font-family; font:font-size font-family(必须要写) color 文字颜色 text-indent 首行缩进 (1em=1个文字大小) text-align 文本对齐方式 (left/center/right) text-decoration 文本修饰(underline下划线/line-through 删除/overline 上划线/none) letter-spacing

    68730发布于 2018-09-06
  • 来自专栏HTML&css读书笔记

    文本

    第二章:文本(book) 知识点: 1. \\:(HTML)==下划线==,用来显示已经插入文档中的内容。 <! \

    \
    :元素中的文本通常呈现为==斜体==。大多数浏览器会在 address 元素前后添加折行。

    </body> </html> 11. \\:斜体 二、示例文本(看着玩吧) <!

    66200发布于 2021-10-30
  • 来自专栏csico

    文本

    文本值表示的Unicode字符序列。 text-literal-characters opt text-literal-character:       单文本字符       字符转义序列       双引号转义序列 单文本字符:        y 合并 文本值的本机类型是固有类型text。 二进制 甲二进制值表示字节序列。没有文字格式。提供了几个标准库函数来构造二进制值。 的表达 以下是一个示例列表表达式定义与三个文本值的列表:"A","B",和"C"。 复制 {"A", "B", "C"} 值"A"是列表中的第一项,值是列表"C"中的最后一项。 要在列表中包含整数序列,a..b可以使用以下形式: 复制 { 1, 5..9, 11 } // { 1, 5, 6, 7, 8, 9, 11 } 列表中的项目数,称为列表计数,可以使用该List.Count

    55920编辑于 2022-01-05
  • 来自专栏HTML5学堂

    文本类样式 — 背景、文本、字体

    本文内容概要: 1 文本类样式解析 2 文本样式——字体 3 文本样式——文本 4 文本样式——背景 5 文本样式案例展示 6 作业安排 如下图是网页的设计图 ? 而今天我们所讲的这个文本类样式又是怎么一个存在呢?一起往后看吧~~~ 一、文本类样式解析 所谓的文本类样式,相信大家通过“文本”这两个字应该能够明白,就是我们页面中的所有内容,包括文字、图片等。 处理文本类样式就是对文字和图片设置相应的大小、形态,这就是我们在一个页面中对具体模块里面的内容做详细的样式设置了。本文中给大家总结的文本样式主要分三个方面来做讲解,分别是:字体类、文本类、背景类。 二、文本样式——字体 文本类样式的字体类是我们在页面制作中一定会用到的属性,每个页面都会有不同的字体要求,比如字体大小、形态、格式等等。 三、文本样式——文本 文本类样式的文本类主要是为了我们在设置文章文字或段落时可以实现水平居中、下划线、首行缩进、颜色、字符间距、换行等一系列操作。

    3.1K80发布于 2018-03-13
  • 来自专栏菜鸟学数据分析之R语言

    文本挖掘| 到底什么是文本挖掘?

    其实,以上问题的答案均离不开一个词:“文本挖掘”。现在这个世界,文本数据已经泛滥成灾。大概80-90%的数据都是文本形式的。想从海量的文本数据中获得有价值的信息,必须具备分析文本数据的能力。 01 文本挖掘简介 文本挖掘可以说是NLP自然语言处理所研究问题的一个分支,是多学科的融合,涉及计算机、数据挖掘、机器学习、统计学等。 文本的挖掘的应用广泛,比如运用于信息检索、产品推荐、网页浏览、文本分类、文本聚类、音频/图像/视频识别等领域。 02 文本挖掘流程 文本挖掘的流程可以分为六个环节,即(文本源)文本数据获取、预处理、 特征提取、(学习与知识模式的提取)建模、模式评价、可视化。 03 R语言与文本挖掘 R 语言文本数据这类非结构化数据,需要用到很多工具包,使得R能够处理文本数据。 数据获取:RCurl、XML,用于实现爬虫与网页解析。

    2.5K40发布于 2020-08-05
  • 来自专栏iSharkFly

    VUE 前端文本输出为超文本

    VUE 的前端文本输出为超文本。但是我们希望的是页面能够自动将超文本进行转换。

    66740编辑于 2022-12-28
  • 来自专栏iSharkFly

    VUE 前端文本输出为超文本

    VUE 的前端文本输出为超文本。但是我们希望的是页面能够自动将超文本进行转换。

    67310编辑于 2022-12-23
  • 来自专栏新智元

    超CLIP准确率11%!伯克利港大阐明「LLM文本-视觉」对齐深层机制

    最新趋势是用冻结的大语言模型替换自训文本编码器,从而在长文本与大数据场景中降低算力成本。 现有研究已发现,LLM文本编码器在处理此类长文本时不仅效率更高,还能带来性能提升。 团队发现,合成文本通常遵循固定句法模板,这会扭曲原始文本分布,并分散从零训练的文本编码器对核心语义的关注。 相比之下,LIFT采用海量文本预训练的LLM文本编码器能有效抵抗句法干扰,更精准地聚焦语义内容,赋予这些生成文本对更合理的相似度评分。 关键组件的贡献 对比微调至关重要 在LLM文本编码器逐渐超越传统文本编码器的过程中,文本嵌入提取方式、对比微调等策略是最为关键的设计要素。

    28910编辑于 2025-07-03
  • 来自专栏IT技术分享社区

    科技资讯:Windows 11记事本迎来实用更新,表格制作与AI文本流正式可用

    微软2026年1月16日宣布,Windows 11记事本应用程序的“创建表格”功能已正式面向所有用户推出。此前该功能已在Windows Insider计划中完成测试,现全面开放。 同时,拥有Copilot+ PC的用户将首次体验到AI文本流功能,实现类似ChatGPT的实时响应效果。1、表格功能:轻量级实用工具“创建表格”功能操作简单直观。 2、AI文本流:实时响应体验Copilot+ PC用户将率先体验AI文本流功能。当右键点击记事本内容,选择“写”生成文本时,系统会实时显示AI的响应过程,类似ChatGPT的逐字输出。 微软表示,AI文本流功能将逐步推广至所有Windows PC设备,非AI设备用户可在未来数周内通过系统更新获得该功能。 目前,Windows 11用户通过Windows Update更新至最新版本后,即可直接使用上述功能。系统更新后打开记事本,工具栏将自动显示“表格”按钮,操作界面简洁清晰。

    24310编辑于 2026-01-17
  • 来自专栏Czy‘s Blog

    初探富文本之富文本概述

    初探富文本之富文本概述 富文本编辑器通常指的是可以对文字、图片等进行编辑的产品,具有所见即所得的能力。 对于Input、Textarea之类标签,他们是支持内容编辑的,但并不支持带格式的文本或者是图片的插入等功能,所以对于这类的需求就需要富文本编辑器来实现。 当然在这里没有好不好,只有适合不适合,通常来说L1的编辑器已经满足于绝大部分富文本编辑场景了,另外还有很多开箱即用的富文本编辑器可选择,具体的选型还是因需求而异。 此时我们离富文本编辑器就差一个document.execCommand的执行了,可以通过完成一个工具栏来执行命令,将选中文本的格式转换为另一种格式。 L1阶段的富文本编辑器,通过抽离数据模型,解决了富文本中脏数据、复杂功能难以实现的问题。通过数据驱动,可以更好的满足定制功能、跨端解析、在线协作等需求。

    2.5K10编辑于 2022-11-28
  • 来自专栏三流程序员的挣扎

    2022-11-11-工作

    昨天的控件点击时通过外面,加个 listener。然后如果外部设定当前选中位置,也要刷新一下页面,所以刷新逻辑放到设置 textSelectedIndex 中去。

    26730编辑于 2022-11-13
  • 来自专栏贾志刚-OpenCV学堂

    超CLIP准确率11%!伯克利港大阐明「LLM文本-视觉」对齐深层机制

    最新趋势是用冻结的大语言模型替换自训文本编码器,从而在长文本与大数据场景中降低算力成本。 现有研究已发现,LLM文本编码器在处理此类长文本时不仅效率更高,还能带来性能提升。 团队发现,合成文本通常遵循固定句法模板,这会扭曲原始文本分布,并分散从零训练的文本编码器对核心语义的关注。 相比之下,LIFT采用海量文本预训练的LLM文本编码器能有效抵抗句法干扰,更精准地聚焦语义内容,赋予这些生成文本对更合理的相似度评分。 关键组件的贡献 对比微调至关重要 在LLM文本编码器逐渐超越传统文本编码器的过程中,文本嵌入提取方式、对比微调等策略是最为关键的设计要素。

    10110编辑于 2026-04-02
  • 来自专栏全栈程序员必看

    文本

    <textarea>元素用来创建多行文本框。与其他input元素不同,<textarea>元素并非空元素,因此它包含起始标签和结束标签。 <!DOCTYPE html> <!

    1K10编辑于 2022-09-20
  • 来自专栏一路向前端

    javaScript识别网址文本并转为链接文本

    最近项目有个需求:用户之间发送消息时,如果发送者输入的信息中含有网址文本,要在接受者界面中显示网址链接,点击该链接直接跳转到网页。 这个功能和 QQ 发送网址文本的效果非常像,可以说是一模一样的。 思路:首先,要判断文本中是否含有网址文本,其次,将网址文本转换为可点击的链接文本,即将网址文本通过a标签括起来。 否则只能匹配到文本中的第一个网址文本。 网址转换为链接文本: 在网址转换中涉及字符串的操作,那么自然要使用 String 对象的方法,先复习下 String 对象能与正则表达式一起使用的方法有哪些? 请注意,如果该值是一个字符串,则将它作为要检索的直接量文本模式,而不是首先被转换为 RegExp 对象。 newvalue:必需。一个字符串值。规定了替换文本或生成替换文本的函数。 注意:第二个参数支持使用函数来制定文本替换的规则。

    5.3K20发布于 2019-09-04
领券