文章/答案/技术大牛

发布

社区首页 >问答首页 >深度学习与文本分析/抽取

问深度学习与文本分析/抽取
EN

Stack Overflow用户

提问于 2016-08-24 11:01:55

回答 1查看 628关注 0票数 0

我试图在深入学习的基础上建立一个模型，从长句中提取特定的文本。

让我们假设一个200个单词的文本和一个表，其中我有我的客户名称和姓氏。我正试图建立一个模型，从这200个单词中提取特定的客户名称/姓氏，使用深度学习。

我读过关于CNN和RNTN模型、语义解析和word2vec模型的文章，但显然我不是该领域的专家。

我的想法是：

步骤1：创建第一个模型，其中输入=客户端姓，输出=类姓
步骤2：创建第二个模型，其中输入=客户端名称，输出=类名
步骤3：创建第三个模型，其中输入=客户端名称+姓氏和姓氏+名称，输出=类客户端
步骤4：创建第四个模型，在输入中发送大量单词，并找到在输出中查找客户端类的方法。

用同样的方法我们可以找到名词/副词/动词/。我们应该能够创造一种新的“语义排序”作为客户端，地址，.

有人能给我一些关于我的思维方式的建议吗？或者告诉我我应该改变/改进什么部分？

非常感谢。

deep-learning

text-mining

text-classification

word2vec

text-analysis

回答 1

Stack Overflow用户

发布于 2016-08-29 22:21:48

在建立模型之后，您可以使用命名实体识别(NER)，这将很难建立/非常耗时；但是，如果您知道客户名称和姓氏，那么在句子中识别它们的方法要快得多。只需使用带有表参数的简单SQL查询来定位客户端名称和姓氏。我在Server 2012中使用了类似的内容。在本例中，您可以将X个客户机数作为表值参数传递，以隔离句子。在我正在进行的项目中，我也遇到了同样的问题，这就是solution...There始终是另一种选择，在这种情况下，您可以在几分钟内而不是几周内设置它：

ALTER Procedure [dbo].[Get_Sentences_Token_Table_Value_Parameter] 
@id_file int,
@sentiment nvarchar(50),
@client_list [dbo].[client_list] READONLY
AS
SELECT        TOP (1000) sentence_id, pos_remaining_token, sentiment AS Sentiment, sentence AS Sentence, id_file, pos_token
FROM            chat_Facets
GROUP BY sentence_id, pos_remaining_token, sentiment, sentence, id_file, pos_token
HAVING        (id_file = @id_file) AND (sentiment = @sentiment) AND chat_Facets.pos_remaining_token IN (SELECT pos_remaining_token FROM @client_list)
ORDER BY pos_remaining_token, Sentence

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/39121511

复制

相似问题

问深度学习与文本分析/抽取
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问深度学习与文本分析/抽取EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问深度学习与文本分析/抽取
EN