我的系统有一个有限的类别集(大约20个)。每个用户都可以使用系统将这些类别分配给项目(让我们称之为user categories)。现在我想介绍一下所谓的system categories --那些将根据统计数据分配给项目的类别,用户如何对其进行分类。我面临的问题是如何在以下情况下选择正确的类别:
item 1
cat A - 10 users
cat B - 7 users
cat C - 1 users
cat D - 0 users在上述步骤中,物料1的system categories应该是:A、AB还是ABC?
或者另一种情况:
item 2
cat A - 10 users
cat B - 10 users
cat C - 10 users
cat D - 5 users编辑:浏览后,我认为这可以使用轮盘选择遗传算法来解决
发布于 2012-07-10 20:06:51
我在Detect trending "reactions" (one or more) in an article (Like Buzzfeed and others)中回答了一个类似的问题,说明我将对此使用模糊逻辑。
我只想让你明白,遗传算法是一种优化方法,它使用模拟进化的算子(主要是复制和变异),轮盘是一种用于选择将应用这些算子的当前解决方案的技术。尽管遗传算法已经被用于分类问题,但我相信它们不是你现在正在寻找的。
我想你可能对“选择”这个术语的用法感到困惑,但我不相信遗传算法或它的选择技术在这里都不适用。
https://stackoverflow.com/questions/11410185
复制相似问题