我试图在深入学习的基础上建立一个模型,从长句中提取特定的文本。
让我们假设一个200个单词的文本和一个表,其中我有我的客户名称和姓氏。我正试图建立一个模型,从这200个单词中提取特定的客户名称/姓氏,使用深度学习。
我读过关于CNN和RNTN模型、语义解析和word2vec模型的文章,但显然我不是该领域的专家。
我的想法是:
用同样的方法我们可以找到名词/副词/动词/。我们应该能够创造一种新的“语义排序”作为客户端,地址,.
有人能给我一些关于我的思维方式的建议吗?或者告诉我我应该改变/改进什么部分?
非常感谢。
发布于 2016-08-29 22:21:48
在建立模型之后,您可以使用命名实体识别(NER),这将很难建立/非常耗时;但是,如果您知道客户名称和姓氏,那么在句子中识别它们的方法要快得多。只需使用带有表参数的简单SQL查询来定位客户端名称和姓氏。我在Server 2012中使用了类似的内容。在本例中,您可以将X个客户机数作为表值参数传递,以隔离句子。在我正在进行的项目中,我也遇到了同样的问题,这就是solution...There始终是另一种选择,在这种情况下,您可以在几分钟内而不是几周内设置它:
ALTER Procedure [dbo].[Get_Sentences_Token_Table_Value_Parameter]
@id_file int,
@sentiment nvarchar(50),
@client_list [dbo].[client_list] READONLY
AS
SELECT TOP (1000) sentence_id, pos_remaining_token, sentiment AS Sentiment, sentence AS Sentence, id_file, pos_token
FROM chat_Facets
GROUP BY sentence_id, pos_remaining_token, sentiment, sentence, id_file, pos_token
HAVING (id_file = @id_file) AND (sentiment = @sentiment) AND chat_Facets.pos_remaining_token IN (SELECT pos_remaining_token FROM @client_list)
ORDER BY pos_remaining_token, Sentencehttps://stackoverflow.com/questions/39121511
复制相似问题