首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >只包含r中的关键字的段落摘录

只包含r中的关键字的段落摘录
EN

Stack Overflow用户
提问于 2017-07-31 16:01:44
回答 2查看 1.6K关注 0票数 3

因此,在R中的文本文件中,我需要扫描许多文档,查找其中提到的带有“贴现率”的段落。然后,我想提取整个段落,它是在其中,只有这一点。在每一段前后都有一个空行,写成"“在文本文件中。我提供了一些我尝试过的不起作用的示例代码和txt文件的几段,其中包括关键字“贴现率”。

代码语言:javascript
复制
 t <- c(grep(" discount rate ",txt,ignore.case = T),grep(" discounted cash flow",txt,ignore.case = T))

  temp <- unlist(str_extract_all(txt,"\r\r. discount rate .\r\r"))

因此,我的方法是尝试提取"“和"”之间的所有行,允许它们包含“贴现率”,但显然在这段代码中没有成功。

"“

“(9)出售或处置任何财产或设备

已损坏、磨损、过时或其他无用或无效

与装甲业务有关的装甲控股公司使用时间更长

“控股或其受限制的子公司”

"“

“可归属债项”与售卖及租回交易有关“

在确定时,指的是

租赁期剩余期间租金净额的承租人

在该等买卖及租回交易中,包括在任何期间内

租赁已延期,或可根据出租人的选择予以延长。

现值应按折现率计算,折现率等于

这种交易中隐含的利息,按照公认会计原则确定。

"“

“”实益拥有人“具有规则13d-3中该词的含义”

和“外汇法”第13d-5条规则,但在计算实益时除外

“对任何特定”人“的所有权\\(因为该术语在第13(D)(3)条中使用)”

“根据”外汇法“),这种\”人“应被视为拥有实益所有权”

“在所有此类证券中,”person“有权通过转换或”

其他证券的行使,不论该权利目前是否可行使或是否

只有在随后的条件发生时才能行使。

“有权拥有”和“实益拥有的”应具有相应的含义。

“董事会”是指:“

"“

(1)就法团而言,其董事局

“法团”

"“

“(2)就合伙而言,董事会

合伙的一般合伙人;及

"“

“(3)关于任何其他人、董事会或委员会”

“担任类似职务的人。”

"“

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2017-07-31 16:16:40

将您的文件保存为text.txt,此操作适用于我:

代码语言:javascript
复制
data <- readLines("text.txt")
data[nchar(data)==0]="\n"
data = strsplit(paste(data,collapse=""),"\n")[[1]]
data[grepl("discount rate",data,ignore.case = T)]

我添加了\n作为新行的虚拟代码,因此我可以在str拆分参数中对其进行拆分。函数只返回第二段。希望这能有所帮助!

票数 3
EN

Stack Overflow用户

发布于 2017-07-31 16:40:22

如果不想更改文本中的换行符,可以这样做(txt是问题中的字符串向量)

代码语言:javascript
复制
# generate a variable for paragraph number
df <- data.frame(txt, paragraph = cumsum(txt == "")) 
# find  paragraphs with the search term
keep_paragraph <- df[grep("discount rate", df[, "txt"]), "paragraph"] 
# subset the data.frame
df <- df[df$paragraph %in% keep_paragraph,] 
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/45420519

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档