因此,在R中的文本文件中,我需要扫描许多文档,查找其中提到的带有“贴现率”的段落。然后,我想提取整个段落,它是在其中,只有这一点。在每一段前后都有一个空行,写成"“在文本文件中。我提供了一些我尝试过的不起作用的示例代码和txt文件的几段,其中包括关键字“贴现率”。
t <- c(grep(" discount rate ",txt,ignore.case = T),grep(" discounted cash flow",txt,ignore.case = T))
temp <- unlist(str_extract_all(txt,"\r\r. discount rate .\r\r"))因此,我的方法是尝试提取"“和"”之间的所有行,允许它们包含“贴现率”,但显然在这段代码中没有成功。
"“
“(9)出售或处置任何财产或设备
已损坏、磨损、过时或其他无用或无效
与装甲业务有关的装甲控股公司使用时间更长
“控股或其受限制的子公司”
"“
“可归属债项”与售卖及租回交易有关“
在确定时,指的是
租赁期剩余期间租金净额的承租人
在该等买卖及租回交易中,包括在任何期间内
租赁已延期,或可根据出租人的选择予以延长。
现值应按折现率计算,折现率等于
这种交易中隐含的利息,按照公认会计原则确定。
"“
“”实益拥有人“具有规则13d-3中该词的含义”
和“外汇法”第13d-5条规则,但在计算实益时除外
“对任何特定”人“的所有权\\(因为该术语在第13(D)(3)条中使用)”
“根据”外汇法“),这种\”人“应被视为拥有实益所有权”
“在所有此类证券中,”person“有权通过转换或”
其他证券的行使,不论该权利目前是否可行使或是否
只有在随后的条件发生时才能行使。
“有权拥有”和“实益拥有的”应具有相应的含义。
“董事会”是指:“
"“
(1)就法团而言,其董事局
“法团”
"“
“(2)就合伙而言,董事会
合伙的一般合伙人;及
"“
“(3)关于任何其他人、董事会或委员会”
“担任类似职务的人。”
"“
发布于 2017-07-31 16:16:40
将您的文件保存为text.txt,此操作适用于我:
data <- readLines("text.txt")
data[nchar(data)==0]="\n"
data = strsplit(paste(data,collapse=""),"\n")[[1]]
data[grepl("discount rate",data,ignore.case = T)]我添加了\n作为新行的虚拟代码,因此我可以在str拆分参数中对其进行拆分。函数只返回第二段。希望这能有所帮助!
发布于 2017-07-31 16:40:22
如果不想更改文本中的换行符,可以这样做(txt是问题中的字符串向量)
# generate a variable for paragraph number
df <- data.frame(txt, paragraph = cumsum(txt == ""))
# find paragraphs with the search term
keep_paragraph <- df[grep("discount rate", df[, "txt"]), "paragraph"]
# subset the data.frame
df <- df[df$paragraph %in% keep_paragraph,] https://stackoverflow.com/questions/45420519
复制相似问题