文章/答案/技术大牛

发布

社区首页 >问答首页 >只包含r中的关键字的段落摘录

问只包含r中的关键字的段落摘录
EN

Stack Overflow用户

提问于 2017-07-31 16:01:44

回答 2查看 1.6K关注 0票数 3

因此，在R中的文本文件中，我需要扫描许多文档，查找其中提到的带有“贴现率”的段落。然后，我想提取整个段落，它是在其中，只有这一点。在每一段前后都有一个空行，写成"“在文本文件中。我提供了一些我尝试过的不起作用的示例代码和txt文件的几段，其中包括关键字“贴现率”。

 t <- c(grep(" discount rate ",txt,ignore.case = T),grep(" discounted cash flow",txt,ignore.case = T))

  temp <- unlist(str_extract_all(txt,"\r\r. discount rate .\r\r"))

因此，我的方法是尝试提取"“和"”之间的所有行，允许它们包含“贴现率”，但显然在这段代码中没有成功。

"“

“(9)出售或处置任何财产或设备

已损坏、磨损、过时或其他无用或无效

与装甲业务有关的装甲控股公司使用时间更长

“控股或其受限制的子公司”

"“

“可归属债项”与售卖及租回交易有关“

在确定时，指的是

租赁期剩余期间租金净额的承租人

在该等买卖及租回交易中，包括在任何期间内

租赁已延期，或可根据出租人的选择予以延长。

现值应按折现率计算，折现率等于

这种交易中隐含的利息，按照公认会计原则确定。

"“

“”实益拥有人“具有规则13d-3中该词的含义”

和“外汇法”第13d-5条规则，但在计算实益时除外

“对任何特定”人“的所有权\\(因为该术语在第13(D)(3)条中使用)”

“根据”外汇法“)，这种\”人“应被视为拥有实益所有权”

“在所有此类证券中，”person“有权通过转换或”

其他证券的行使，不论该权利目前是否可行使或是否

只有在随后的条件发生时才能行使。

“有权拥有”和“实益拥有的”应具有相应的含义。

“董事会”是指：“

"“

(1)就法团而言，其董事局

“法团”

"“

“(2)就合伙而言，董事会

合伙的一般合伙人；及

"“

“(3)关于任何其他人、董事会或委员会”

“担任类似职务的人。”

"“

string

text-extraction

回答 2

Stack Overflow用户

回答已采纳

发布于 2017-07-31 16:16:40

将您的文件保存为text.txt，此操作适用于我：

data <- readLines("text.txt")
data[nchar(data)==0]="\n"
data = strsplit(paste(data,collapse=""),"\n")[[1]]
data[grepl("discount rate",data,ignore.case = T)]

我添加了\n作为新行的虚拟代码，因此我可以在str拆分参数中对其进行拆分。函数只返回第二段。希望这能有所帮助！

票数 3

Stack Overflow用户

发布于 2017-07-31 16:40:22

如果不想更改文本中的换行符，可以这样做(txt是问题中的字符串向量)

# generate a variable for paragraph number
df <- data.frame(txt, paragraph = cumsum(txt == "")) 
# find  paragraphs with the search term
keep_paragraph <- df[grep("discount rate", df[, "txt"]), "paragraph"] 
# subset the data.frame
df <- df[df$paragraph %in% keep_paragraph,]

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/45420519

复制

相似问题

问只包含r中的关键字的段落摘录
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问只包含r中的关键字的段落摘录EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问只包含r中的关键字的段落摘录
EN