搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏python3
pandas文本处理
A 13 1 b 14 2 c 15 3 bbhello 16 4 123 17 5 NaN 18 6 s.str.count('b')) 32 ''' 33 0 0.0 34 1 1.0 35 2 0.0 36 3 2.0 37 4 0.0 38 5 NaN 39 6 : object 88 长度，len() 0 1.0 89 1 1.0 90 2 1.0 91 3 7.0 92 4 3.0 93 5 NaN 94 6 startswith() 0 False 97 1 True 98 2 False 99 3 True 100 4 False 101 5 NaN 102 6 endswith() 0 False 105 1 False 106 2 False 107 3 True 108 4 False 109 5 NaN 110 6
93220发布于 2020-01-16
来自专栏搜狗测试
文本处理小记
【前言】在平时的测试过程中，经常会遇到各种文本处理的问题，于是把遇到的常用的文本处理命令和方法进行了总结和整理。 ---- 【常用文本处理命令】 awk 1. awk脚本结构awk ' BEGIN{statements } statements2 END{ statements } '2. 处理文本在测试中，遇到了类似下面的文本处理情形： ? 在多行类似这样的结构文本中，需要把文字提取出来，然后计算所有文本的time总和，于是便想到了用前面的文本处理过程。以上就是一些文本处理命令的简单介绍，在平时的工作中遇到文本处理的问题，会比较方便快捷的解决。
1.1K10发布于 2020-03-23
来自专栏用户7552167的专栏
Linux文本处理
cat 命令可以用来显示文本文件的内容（类似于 DOS 下的 type 命令），也可以把几个文件内容附加到另一个文件中，即连接合并文件。
2.7K20发布于 2021-03-16
来自专栏sktj
bootstrap 文本处理
<meta name="viewport" content="width=device-width, initial-scale=1" charset="utf-8">
1.6K30编辑于 2022-01-10
来自专栏若尘的技术专栏
wk文本处理
接着，我们可以使用awk模仿cut的操作（结果与cut -f2,3 example.bed一致）：
1.5K45编辑于 2021-12-05
来自专栏歪歪梯Club
Linux文本处理
sed适合用于对大文件进行正则替换输出其处理是实时显示（从文件读取一行匹配一行，结果输出）不会修改原文件（添加g标记为全部替换，不添加为每行替换首个匹配项）
1.8K20发布于 2021-03-15
来自专栏TalkPython
Python 文本处理介绍
文本处理，在Python中有很多方法，最常见的有正则表达式，标准库的字符串处理方法。当然除了常用的方法外，还可以使用NLTK自然语言工具包处理字符串、使用机器学习机器技术等。 have': 5, 'good': 4, 'day': 3, 'all': 0, 'how': 7, 'are': 2,'you': 10, 'and': 1, #'nice': 8} # (0, 6) 1 # (0, 9) 1 # (1, 3) 1 # (1, 4) 1 # (1, 5) 1 # (2, 0) 1 # (2, 6) 1 3, 2) 1 # (3, 7) 1 # (3, 10) 1 # (4, 1) 1 # (4, 3) 1 # (4, 5) 1 # (4, 6) 1 # (4, 8) 1 从结果中我们可以看到，在列表的第一个元素中有单词6、9并且数量都是一个，在列表第二个元素中有单词3、4、5并且数量都是一个等等。
1.3K30发布于 2019-05-24
Linux 文本处理命令
最近在使用 BASH 进行处理文本文件的时候，对于文本处理真的是力不从心，今天进行搜集一下linux 中文本处理相关的命令，这样你在进行书写shell 脚本的时候，就能写出更好的方案。
1.1K00发布于 2020-12-30
来自专栏嵌入式视觉
Linux 基础-文本处理
封面来源 SegmentFault 技术周刊 Vol.19 – Linux 文本处理三利器概述 Linux 下使用 Shell 处理文本时最常用的工具有： find、grep、xargs、sort、uniq
84310编辑于 2022-09-05
来自专栏生信技能树-R
Linux -文本处理 grep
c1006Mar402 10:25:36 ~$ wc -l Data/example.fq 4000 Data/example.fq #一共有4000行，一个基因四行通过^@抓取的应有1000个，但多出来了6个 CEEDEB:E8ED>:EBD=@D6=5=<AA>A1CC>E###############################6.Mar402 10:38:04 ~$ grep 'TATA[AT]A[
1.3K20编辑于 2023-03-29
来自专栏Linux学习日志
Shell 文本处理命令
对文件内容进行去重如果文件内容有很多重复的，需要进行去重。sort也是支持的，可以通过-u参数使用
1K10发布于 2020-08-26
来自专栏xiaosen
文本处理基本方法
jieba库考虑到了性能问题，支持并行分词，提高大规模文本处理的效率。这使得它成为当前Python语言中优秀的中文分词组件之一。
50610编辑于 2024-03-24
来自专栏coding
Linux文本处理命令
-d DELIMITER: 指明切割的分隔符 -f FILEDS: 指明字段 #: 第#个字段 #,#[,#]：离散的多个字段，例如1,3,6 #-#：连续的多个字段, 例如1-6 混合使用：1-3,7 sort | uniq -d [root@senlong tmp]# history | cut -d' ' -f5 | sort | uniq -u 练习以冒号分隔，取出/etc/passwd文件的第6至第 10行，并将这些信息按第3个字段的数值大小进行排序；最后仅显示的各自的第1个字段 [root@senlong tmp]# cut -d: -f6-10 /etc/passwd | sort -t: -k3
1.8K20发布于 2018-06-27
来自专栏数据云团
Python进阶-文本处理
import warn as printf DATA = ((4, "Python进阶-Web 服务", "数据云团"), (5, "Python进阶-GUI-Tk接口", "小团子"), (6,
1K10发布于 2019-07-18
来自专栏生信技能树-R
Linux -文本处理 sed
ab4410a432cc18c1b9f10f93634e5310 SRR1039509_1.fastq.gz;SRR1039509_2.fastq.gz d2c2d92c67c943648fdde6c70bc0d920 008ba2b3b589d553e3e9f8890d5481c2 SRR1039517_1.fastq.gz;SRR1039517_2.fastq.gz 64d1444ad727f48066aeb6ad314d9190 ;9283f111ef774248f6f666e4bf2b1f81;9bcb6c9675631b1dcb8b07f6916d546c SRR1039519.fastq.gz;SRR1039519 fastq.gz 789e86036c81a85d2c1f014f79822d64;54c572cead4074b126f0b81b344af1be;c461a163b72a71efb4027045e6b4d2f6 SRR1039522.fastq.gz;SRR1039522_1.fastq.gz;SRR1039522_2.fastq.gz ae33f7f6d536d020a2562b8be6e9cc33
1.5K20编辑于 2023-03-29
来自专栏Python数据科学
pandas 文本处理大全
本次来介绍关于文本处理的几个常用方法。文本的主要两个类型是string和object。如果不特殊指定类型为string，文本类型一般为object。 # str.cat多级连接实现多列拼接 df.name.str.cat(['*']*6).str.cat(df.level) ---------------- 0 jordon*high 1 sohu 1 vMike NaN 2 KelvinChai gmail 3 xiaoli 163 4 NaN NaN 5 amei qq 6、
64120编辑于 2023-08-29
来自专栏sktj
python核心编程(文本处理)
seq = ("a", "b", "c"); # 字符串序列 print str.join( seq ); 3、zip用法 a = [1,2,3] #此处可迭代对象为列表 b = [4,5,6] c = [4,5,6,7,8] zipped = zip(a,b) zipped <zip object at 0x02B01B48> #返回的是一个对象 list(zipped) [(1 , 4), (2, 5), (3, 6)] #使用list()函数转换为列表 list(zip(a,c)) [(1, 4), (2, 5), (3, 6)] zipped = zip(a,b) list(zip(*zipped)) #解压也使用list进行转换 [(1, 2, 3), (4, 5, 6)] 4、python字典转json：json.dumps(xx,indent=xx) ! //title'): print(book.text) 6、xml-rpc通信：服务端： * coding:utf-8 * from xmlrpc.server import SimpleXMLRPCServer
1.3K30编辑于 2022-05-14
来自专栏用代码征服天下
Linux文本处理详细教程
文本处理 本节将介绍Linux下使用Shell处理文本时最常用的工具： find、grep、xargs、sort、uniq、tr、cut、paste、wc、sed、awk；提供的例子和参数都是常用的； grep "WHERE" > b 查找中文示例：工程目录中utf-8格式和gb2312格式两种文件，要查找字的是中文；查找到它的utf-8编码和gb2312编码分别是E4B8ADE69687和D6D0CEC4 查询: grep：grep -rnP "\xE4\xB8\xAD\xE6\x96\x87|\xD6\xD0\xCE\xC4" *即可汉字编码查询：http://bm.kdd.cc/ 1.3 $0;} END{for(i=0;i<11;i++){ \ print buffer[i %10]} } ' filename 打印指定列 awk方式实现 ls -lrt | awk '{print $6} ' cut方式实现 ls -lrt | cut -f6 打印指定文本区域确定行号 seq 100| awk 'NR==4,NR==6{print}' 确定文本打印处于start_pattern 和end_pattern
5K20发布于 2020-08-10
来自专栏python3
assign之python文本处理
='') as w: line_data = line.strip().split(',') if len(line_data) == 6: = 6: if len(line_data) ! = 6: pass else: w.write('Line '+ = 6: pass elif len(line_data[0]) ! = 6: pass else: remain_data.append(line_data)
72320发布于 2020-01-06
来自专栏用户1337634的专栏
jq命令 - json文本处理
jq可以对json数据进行分片、过滤、映射和转换安装 #CentOS yum install jq #MacOS brew install jq 提取信息 cat json.txt [{"genre":"deep house"}, {"genre": "progressive house"}, {"genre": "dubstep"}] 格式化展示原文 cat json.txt | jq '.' [ { "genre": "deep house" }, { "genr
93620发布于 2021-11-24

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

pandas文本处理

文本处理小记

Linux文本处理

bootstrap 文本处理

wk文本处理

Linux文本处理

Python 文本处理介绍

Linux 文本处理命令

Linux 基础-文本处理

Linux -文本处理 grep

Shell 文本处理命令

文本处理基本方法

Linux文本处理命令

Python进阶-文本处理

Linux -文本处理 sed

pandas 文本处理大全

python核心编程(文本处理)

Linux文本处理详细教程

assign之python文本处理

jq命令 - json文本处理

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐