首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >提取句子中有特定的单词/句型

提取句子中有特定的单词/句型
EN

Stack Overflow用户
提问于 2022-05-02 09:54:49
回答 2查看 25关注 0票数 0

我试着用“隐私隐私”这个词来提取句子。这些句子可以在我的数据里面的文本中找到。文本被安全地作为多个chr的列表。字符串,因为我正在处理一堆不同的文件。我无法设法使它与grep一起工作,但使用gsub使它工作。我现在遇到的问题是,它只提取正文的第一句,而不包括下一句。csv_edgar$privacy_1A <- gsub(".*?([^\\.]*(privacy|Privacy[^\\.]*).*","\\1", csv_edgar$item_1A, ignore.case=TRUE)。这就是我使用自动取款机的代码。文本:

公司使用信息技术系统来支持其业务,包括在未来几年内在全球范围内分阶段实施企业资源规划系统,作为业务转型的一部分。安全漏洞和对公司信息技术基础设施的其他干扰可能干扰公司的运作,损害属于公司及其客户、供应商和雇员的信息,使公司承担可能对公司的业务和声誉产生不利影响的责任。在正常的业务过程中,公司依靠信息技术网络和系统,其中一些由第三方管理,处理、传输和存储电子信息,并管理或支持各种业务流程和活动。此外,公司还收集和存储某些数据,包括专有商业信息,并可能在我们的某些业务中访问受隐私和安全法律、法规和客户强制控制的机密或个人信息。尽管我们采取了不断审查和升级的网络安全措施(包括员工和第三方培训、网络和系统监控以及备份和保护系统的维护),但该公司的信息技术网络和基础设施仍然很容易受到黑客攻击或入侵、员工错误或渎职、停电、计算机病毒、电信或公用事业故障、系统故障、服务提供商(包括云服务)、自然灾害或其他灾难性事件的破坏、干扰或关闭。这类漏洞有可能在一段较长的时间内不被发现,直至并包括几年。虽然我们已经并期望继续经历这些对公司信息技术网络和基础设施的威胁,但迄今为止,这些威胁都没有对公司产生实质性影响。随着公司在全球范围内对其ERP系统进行升级和标准化,可能还存在其他挑战和风险。任何此类事件都可能导致法律索赔或诉讼程序、根据隐私法的责任或处罚、运营中断和对公司声誉的损害,这些都可能对公司的业务产生不利影响。虽然该公司为各种网络安全风险提供保险,但无法保证所发生的所有费用或损失都将得到充分保险。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2022-05-02 10:05:13

您可以使用str_extract_all进行交替操作:

代码语言:javascript
复制
regex <- "[A-Z][^.]+\\b(?:Privacy|privacy)\\b[^.]+\\."
sentences <- str_extract_all(input, regex)[[1]]

[1] "Additionally, the Company collects and stores certain data, including proprietary business information, and may have access to confidential or personal information in certain of our businesses that is subject to privacy and security laws, regulations and customer-imposed controls."
[2] "Any such events could result in legal claims or proceedings, liability or penalties under privacy laws, disruption in operations, and damage to the Company<U+2019>s reputation, which could adversely affect the Company<U+2019>s business."

在上面的片段中,input是您在问题中提供的示例文本。

票数 0
EN

Stack Overflow用户

发布于 2022-05-02 10:16:42

建议使用awk命令:

代码语言:javascript
复制
awk '/[pP]rivacy/{print}' RS="." input.txt

提供样本的结果

代码语言:javascript
复制
 Additionally, the Company collects and stores certain data, including proprietary business information, and may have access to confidential or personal information in certain of our businesses that is subject to privacy and security laws, regulations and customer-imposed controls
 Any such events could result in legal claims or proceedings, liability or penalties under privacy laws, disruption in operations, and damage to the Company’s reputation, which could adversely affect the Company’s business      
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/72085071

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档