首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何处理某个属性中的多个值?

如何处理某个属性中的多个值?
EN

Stack Overflow用户
提问于 2013-05-20 20:19:28
回答 1查看 820关注 0票数 2

我使用WEKA工具对数据进行聚类分析,但是在我的一些属性中,域中有许多值。具体来说,我需要代表一些关于蛋白质的信息,我需要包含的信息是与它们的功能相关的术语。

例如,这些值包含在相同的属性“Function”上:

"RNA -结合蛋白“,”ribosomerRNA结合的结构成分“,”翻译“,”细胞内核糖体核糖核蛋白复合物“。

而这些术语的多样化程度也很大。

有人能帮我吗?

EN

回答 1

Stack Overflow用户

发布于 2013-05-20 22:27:44

一种常见的方法是将具有n不同类别的分类变量拆分为n二进制虚拟变量。

例如:

gender = {male, female}可以用2个虚拟变量重写,如下所示:

  1. male = [0, 1]
  2. female = [1, 0]

在您的例子中,一个函数似乎可以包含几个不同的值(例如,具有多个功能的1种蛋白质)。这也很容易将模型塑造成虚拟变量。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/16657663

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档