首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >深度学习与文本分析/抽取

深度学习与文本分析/抽取
EN

Stack Overflow用户
提问于 2016-08-24 11:01:55
回答 1查看 628关注 0票数 0

我试图在深入学习的基础上建立一个模型,从长句中提取特定的文本。

让我们假设一个200个单词的文本和一个表,其中我有我的客户名称和姓氏。我正试图建立一个模型,从这200个单词中提取特定的客户名称/姓氏,使用深度学习。

我读过关于CNN和RNTN模型、语义解析和word2vec模型的文章,但显然我不是该领域的专家。

我的想法是:

  • 步骤1:创建第一个模型,其中输入=客户端姓,输出=类姓
  • 步骤2:创建第二个模型,其中输入=客户端名称,输出=类名
  • 步骤3:创建第三个模型,其中输入=客户端名称+姓氏和姓氏+名称,输出=类客户端
  • 步骤4:创建第四个模型,在输入中发送大量单词,并找到在输出中查找客户端类的方法。

用同样的方法我们可以找到名词/副词/动词/。我们应该能够创造一种新的“语义排序”作为客户端,地址,.

有人能给我一些关于我的思维方式的建议吗?或者告诉我我应该改变/改进什么部分?

非常感谢。

EN

回答 1

Stack Overflow用户

发布于 2016-08-29 22:21:48

在建立模型之后,您可以使用命名实体识别(NER),这将很难建立/非常耗时;但是,如果您知道客户名称和姓氏,那么在句子中识别它们的方法要快得多。只需使用带有表参数的简单SQL查询来定位客户端名称和姓氏。我在Server 2012中使用了类似的内容。在本例中,您可以将X个客户机数作为表值参数传递,以隔离句子。在我正在进行的项目中,我也遇到了同样的问题,这就是solution...There始终是另一种选择,在这种情况下,您可以在几分钟内而不是几周内设置它:

代码语言:javascript
复制
ALTER Procedure [dbo].[Get_Sentences_Token_Table_Value_Parameter] 
@id_file int,
@sentiment nvarchar(50),
@client_list [dbo].[client_list] READONLY
AS
SELECT        TOP (1000) sentence_id, pos_remaining_token, sentiment AS Sentiment, sentence AS Sentence, id_file, pos_token
FROM            chat_Facets
GROUP BY sentence_id, pos_remaining_token, sentiment, sentence, id_file, pos_token
HAVING        (id_file = @id_file) AND (sentiment = @sentiment) AND chat_Facets.pos_remaining_token IN (SELECT pos_remaining_token FROM @client_list)
ORDER BY pos_remaining_token, Sentence
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/39121511

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档