首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏python3

    pandas文本处理

    pd 2 import numpy as np 3 4 s = pd.Series(['A', 'b', 'c', 'bbhello', '123', np.nan, 'hj']) 5 8) 11 ''' 12 0 A 13 1 b 14 2 c 15 3 bbhello 16 4 123 17 5 key1 key2 22 0 a hee 23 1 b fv 24 2 c w 25 3 d hija 26 4 e 123 27 5 print(s.str.count('b')) 32 ''' 33 0 0.0 34 1 1.0 35 2 0.0 36 3 2.0 37 4 0.0 38 5 KEY1 KEY2 57 0 a hee 58 1 b fv 59 2 c w 60 3 d hija 61 4 e 123 62 5

    93220发布于 2020-01-16
  • 来自专栏搜狗测试

    文本处理小记

    【前言】 在平时的测试过程中,经常会遇到各种文本处理的问题,于是把遇到的常用的文本处理命令和方法进行了总结和整理。 ---- 【常用文本处理命令】 awk 1. awk脚本结构awk ' BEGIN{statements } statements2 END{ statements } '2. 处理文本 在测试中,遇到了类似下面的文本处理情形: ? 在多行类似这样的结构文本中,需要把文字提取出来,然后计算所有文本的time总和,于是便想到了用前面的文本处理过程。 以上就是一些文本处理命令的简单介绍,在平时的工作中遇到文本处理的问题,会比较方便快捷的解决。

    1.1K10发布于 2020-03-23
  • 来自专栏用户7552167的专栏

    Linux文本处理

    cat 命令可以用来显示文本文件的内容(类似于 DOS 下的 type 命令),也可以把几个文件内容附加到另一个文件中,即连接合并文件。

    2.7K20发布于 2021-03-16
  • 来自专栏sktj

    bootstrap 文本处理

    <meta name="viewport" content="width=device-width, initial-scale=1" charset="utf-8">

    1.6K30编辑于 2022-01-10
  • 来自专栏若尘的技术专栏

    wk文本处理

    feature[k]\ }' Mus_musculus.GRCm38.75_chr1.gtf exon 69 CDS 56 UTR 24 gene 1 start_codon 5 stop_codon 5 transcript 9 上面操作与下面的Unix命令操作得到的结果一致,不过使用awk可以方便地进行更加复杂的逻辑操作(例如通过&&添加),这是Unix命令无法比拟的

    1.5K45编辑于 2021-12-05
  • 来自专栏歪歪梯Club

    Linux文本处理

    sed适合用于对大文件进行正则替换输出 其处理是实时显示(从文件读取一行匹配一行,结果输出) 不会修改原文件(添加g标记为全部替换,不添加为每行替换首个匹配项)

    1.8K20发布于 2021-03-15
  • 来自专栏TalkPython

    Python 文本处理介绍

    文本处理,在Python中有很多方法,最常见的有正则表达式,标准库的字符串处理方法。当然除了常用的方法外,还可以使用NLTK自然语言工具包处理字符串、使用机器学习机器技术等。 ) print(trans.vocabulary_) tr=trans.transform(data) print (tr) # {'hello': 6, 'world': 9, 'have': 5, : 10, 'and': 1, #'nice': 8} # (0, 6) 1 # (0, 9) 1 # (1, 3) 1 # (1, 4) 1 # (1, 5) 2, 6) 1 # (3, 2) 1 # (3, 7) 1 # (3, 10) 1 # (4, 1) 1 # (4, 3) 1 # (4, 5) 1 # (4, 6) 1 # (4, 8) 1 从结果中我们可以看到,在列表的第一个元素中有单词6、9并且数量都是一个,在列表第二个元素中有单词3、4、5并且数量都是一个等等

    1.3K30发布于 2019-05-24
  • Linux 文本处理命令

    最近在使用 BASH 进行处理 文本文件的时候,对于文本处理真的是力不从心,今天进行搜集一下linux 中文本处理相关的命令,这样你在进行书写shell 脚本的时候,就能写出更好的方案。

    1.1K00发布于 2020-12-30
  • 来自专栏嵌入式视觉

    Linux 基础-文本处理

    封面来源 SegmentFault 技术周刊 Vol.19 – Linux 文本处理三利器 概述 Linux 下使用 Shell 处理文本时最常用的工具有: find、grep、xargs、sort、uniq 为一个存在的文件,列出比 file 还要新的文件名 $ find /etc -newer /etc/passwd # 寻找 /etc 底下的文件,如果文件日期比 /etc/passwd 新就列出 5

    84310编辑于 2022-09-05
  • 来自专栏生信技能树-R

    Linux -文本处理 grep

    .$ cat Data/example.fq | grep '@' -c1502Mar402 10:25:30 ~5.$ cat Data/example.fq | grep '^@' -c1006Mar402 CEEDEB:E8ED>:EBD=@D6=5=<AA>A1CC>E###############################6.Mar402 10:38:04 ~$ grep 'TATA[AT]A[

    1.3K20编辑于 2023-03-29
  • 来自专栏Linux学习日志

    Shell 文本处理命令

    命令参数: wc -l file #统计行数 wc -w file #统计单词数 wc -c file #统计字符数 例子: [root@linux /]# cat xxx.txt|wc -l 5

    1K10发布于 2020-08-26
  • 来自专栏xiaosen

    文本处理基本方法

    jieba库考虑到了性能问题,支持并行分词,提高大规模文本处理的效率。这使得它成为当前Python语言中优秀的中文分词组件之一。

    50610编辑于 2024-03-24
  • 来自专栏coding

    Linux文本处理命令

    仅显示不曾重复的行; Note: 连续且完全相同方为重复 uniq 与 sort -u 的区别:uniq能显示每行重复的次数 [root@senlong tmp]# history | cut -d' ' -f5 | sort | uniq -c [root@senlong tmp]# history | cut -d' ' -f5 | sort | uniq -d [root@senlong tmp]# history | cut -d' ' -f5 | sort | uniq -u 练习 以冒号分隔,取出/etc/passwd文件的第6至第10行,并将这些信息按第3个字段的数值大小进行排序;最后仅显示的各自的第1个字段

    1.8K20发布于 2018-06-27
  • 来自专栏数据云团

    Python进阶-文本处理

    import csv from distutils.log import warn as printf DATA = ((4, "Python进阶-Web 服务", "数据云团"), (5, "Python

    1K10发布于 2019-07-18
  • 来自专栏生信技能树-R

    Linux -文本处理 sed

    CTGCCCTGAGCGGCGGCGGGTCGGCCCCAAGGGCGACCGCGTTAACTTTTGAAAGCAGCTAGTCCTTAAA 4.Mar402 13:26:03 ~ $ cat Data/md5. 5640a85f2c181d4886e905e74a32f041 SRR1039515.fastq.gz;SRR1039515_1.fastq.gz;SRR1039515_2.fastq.gz 8f97b3dc8170ecd6fffb39101c3e5bf5 ;2c4d2ba3b812f14bce25966c98b5b5df;8599c02799338b9514e8d0077a8409e4 SRR1039516.fastq.gz;SRR1039516 SRR1039517_1.fastq.gz;SRR1039517_2.fastq.gz 64d1444ad727f48066aeb6ad314d9190;a24eea863bdca0284591fcd5eb076a93 fastq.gz;SRR1039520_2.fastq.gz 637e08d030778c6581731647f3c3d8cc;4be82ad33d7d4990bed3c4bc701dc070;435aa5e48ba77e4c42218930a0be0de1

    1.5K20编辑于 2023-03-29
  • 来自专栏Python数据科学

    pandas 文本处理大全

    本次来介绍关于文本处理的几个常用方法。 文本的主要两个类型是string和object。如果不特殊指定类型为string,文本类型一般为object。 M KelvinChai@gmail.com 3 xiaoLi 23 L xiaoli@163.com 4 qiqi 45 middle NaN 5 , fillchar='*') ------------- 0 *jordon* 1 **MIKE** 2 *Kelvin* 3 *xiaoLi* 4 **qiqi** 5 Mike 126 cn 2 KelvinChai gmail com 3 xiaoli 163 com 4 NaN NaN NaN 5 Amei*amei@qq.com 将一个序列与多个对象拼接为一个新的序列 5、文本提取 文本提取主要通过extract来实现的。

    64120编辑于 2023-08-29
  • 来自专栏sktj

    python核心编程(文本处理)

    seq = ("a", "b", "c"); # 字符串序列 print str.join( seq ); 3、zip用法 a = [1,2,3] #此处可迭代对象为列表 b = [4,5,6 ] c = [4,5,6,7,8] zipped = zip(a,b) zipped <zip object at 0x02B01B48> #返回的是一个对象 list(zipped) [( 1, 4), (2, 5), (3, 6)] #使用list()函数转换为列表 list(zip(a,c)) [(1, 4), (2, 5), (3, 6)] zipped = zip(a,b) list(zip(*zipped)) #解压也使用list进行转换 [(1, 2, 3), (4, 5, 6)] 4、python字典转json:json.dumps(xx,indent=xx) ! ***') printf(dumps(BOOKs)) printf('\n*** PRETTY_PRINTED JSON ***') printf(dumps(BOOKs, indent=4)) 5

    1.3K30编辑于 2022-05-14
  • 来自专栏用代码征服天下

    Linux文本处理详细教程

    文本处理 本节将介绍Linux下使用Shell处理文本时最常用的工具: find、grep、xargs、sort、uniq、tr、cut、paste、wc、sed、awk; 提供的例子和参数都是常用的; 取的范围 N- 第N个字段到结尾-M 第1个字段为MN-M N到M个字段 cut 取的单位 -b 以字节为单位-c 以字符为单位-f 以字段为单位(使用定界符) 示例: cut -c1-5 file //打印第一到5个字符 cut -c-2 file //打印前2个字符 截取文本的第5到第7列 $echo string | cut -c5-7 1.8. paste 按列拼接文本 将两个文本按列拼接到一起 vara}' vara=$var # 输入来自stdin awk '{print vara}' vara=$var file # 输入来自文件 用样式对awk处理的行进行过滤 awk 'NR < 5' #行号小于5 awk 'NR==1,NR==4 {print}' file #行号等于1和4的打印出来 awk '/linux/' #包含linux文本的行(可以用正则表达式来指定,超级强大) awk

    5K20发布于 2020-08-10
  • 来自专栏python3

    assign之python文本处理

    1.python在处理文本时,在遇到列表中的两数相加时,需要先将其转化为float类型;若转换失败,多半是因为float在转换int与string或str时,字符串中不允许存在空格或者引号

    72320发布于 2020-01-06
  • 来自专栏用户1337634的专栏

    jq命令 - json文本处理

    jq可以对json数据进行分片、过滤、映射和转换 安装 #CentOS yum install jq #MacOS brew install jq 提取信息 cat json.txt [{"genre":"deep house"}, {"genre": "progressive house"}, {"genre": "dubstep"}] 格式化展示原文 cat json.txt | jq '.' [ { "genre": "deep house" }, { "genr

    93620发布于 2021-11-24
领券