首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >收入保护中的人的行为推荐模型

收入保护中的人的行为推荐模型
EN

Data Science用户
提问于 2020-10-16 11:28:28
回答 1查看 77关注 0票数 3

问题领域,我正在做一个项目,其中包括建立一个模型,为人类管理者处理收入保护索赔提供下一个最佳步骤的建议。

收入保护是一个保险领域,如果被保险人生病或无法工作,则向其提供一定比例的收入。这是一个安全网,旨在帮助你,如果你曾经生病或陷入困境。我们的许多客户都患有癌症、抑郁症、骨折等疾病,而保险服务通常是由他们的公司提供的。

在我们这边,我们有一些人力监督员来管理正在进行的索赔。这意味着安排医生的预约,更新医疗记录和评估/诊断,安排康复,与客户交谈等(所有这些费用也由他们的保险支付)。这些管理项目是有限的,明确的,并被描述为行动。

主管的工作是帮助客户尽快恢复工作(RTW),既帮助客户恢复健康/恢复正常生活,又降低处理业务索赔所需的费用。

我有一套数据,描述过去20年中每个主管对每项索赔采取了哪些行动(时间序列/顺序数据),以及描述索赔进度的文本数据,以及描述索赔和客户(疾病类型、年龄、职业等)的分类数据。

我想要建立的是一个推荐系统,它利用数据来推荐哪种行为最大限度地提高了在进行中的索赔中,某个给定客户返回工作的可能性。

我试过什么

利用上面描述的数据,我建立了一个神经网络来预测一个封闭索赔的结果。神经网络是LSTM和密集层的结合,LSTM用于顺序动作数据,密集用于分类数据,密集用于文本数据的TfIdf转换。有39种可能的结果,其中之一是返回工作,网络表现相对良好,达到了70%的准确率。

我计划像这样使用已完成的模型:迭代所有可能的操作,并为每个操作追加到所讨论的声明中,以生成一个新的“假设”操作序列。对于每个假设序列,通过经过训练的模型进行前馈,并查看哪一个动作使输出向量的指数“得分”最大化,该指标对应于返回工作。最大限度地提高这一分数的行动就是建议。下面是一个包含10个操作的持续索赔的简单玩具示例:

代码语言:javascript
复制
scores = []
# ongoing_claim.shape = (10, 30)
for action in potential_actions:
    hypothesis = ongoing_claim.append(action)
    # ongoing_claim.shape = (11, 30)
    hypothesis = pad_sequence(hypothesis)
    output = model.predict(hypothesis)
    scores[action] = output[index_for_return_to_work]

该建议将是对应于scores中最高值的关键。

不幸的是这不起作用。无论哪种动作,当我在模型中给出新的动作序列时,分数保持不变,以恢复工作--没有任何变化。我认为这是因为考虑到用于训练模型的数据量,简单地添加一个微小的新数据点并不能增加足够的方差来扰乱输出。我试过在最后一层使用sigmoid和softmax激活函数,但这也不起作用。

问题

我应该使用什么样的模型来利用所有的数据,然后检查一个正在进行的索赔,并建议采取何种行动,最大限度地提高特定结果的概率(在这种情况下,返回工作)?

EN

回答 1

Data Science用户

发布于 2020-10-16 13:28:47

它看起来像是由逆强化学习问题定义的斯图亚特·罗素

给定的

  1. 随着时间的推移,在各种情况下,对代理人行为的测量。
  2. 测量对该剂的感官输入;
  3. 物理环境的模型(包括代理人的身体)。

确定代理正在优化的奖励函数。

在您的情况下,它特别是,因为您只观察到一个客户和环境的实际状态的一个很小的子集。

我不认为它是可以解决的,如果不能够积极探索行动,或没有真正强有力的假设或动力学模型。

如果您可以假设历史主管尽了最大努力帮助他们的客户重新开始工作,那么您的任务就简化为:给定历史操作到给定的点,预测下一个历史操作。

即使有了这个简单的问题,你仍然需要小心的条件,可能的非平稳的时间,选择一个好的模型(可能类似于你的尝试),等等。

票数 3
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/84087

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档