数据是熊猫系列:我正在使用df.B=df.A.str.extract(r'')创建B列,其中提取的单词df:
A
HI my lines are
so super WHERE1 my car
car go anywhere
next line like this
HI my lines are
so super WHERE2 my car
one WHERE HI like me以上数据是测试数据,HI单词之间有时有40行空格。我需要从HI开始的前两条线开始,这是第一条。从第一行,得到WHERE1和WHERE2单词
到现在为止我的王国:
^(HI(.*\n){2}) #to select first two lines我不知道该在哪里加上我要找的单词( where 1,where 2)
预期产出:
WHERE1
WHERE2发布于 2019-09-25 15:30:27
您可以在MULTILINE模式下使用此正则表达式:
^HI\s.*(?:\n.*)?\b(WHERE1|WHERE2)\bRegEx详细信息:
^HI\s:匹配以HI和空格开头的一行.*:匹配0或更多的任何字符(?:\n.*)?:可选组,用于匹配换行符和0或0以上的任意字符\b(WHERE1|WHERE2)\b:将WHERE1或WHERE2与单词边界匹配https://stackoverflow.com/questions/58101676
复制相似问题