我托管了几台源游戏服务器,并运行了一个插件,将玩家聊天转储到MySQL数据库。我有一些安静的聊天历史,并在寻找有趣的事情与它。我想要建立一个系统,让我的社区成员确定什么是和不是‘可接受的’。
我的想法是这样的:我允许我的社区成员查看聊天日志(而不确定是谁说的),他们将日志标记为“可接受的”或“不可接受的”。我必须弄清楚,它是只显示一个时间框架中的一个文本块,还是某个时间框架中的一个特定用户,或者仅仅是一个单独的行(也可能是good...could,也意味着用户完全错过了聊天的上下文)。
这有点像captcha系统,在这个系统中,多个用户最终会对相同系列的聊天日志进行分级。从那里,我会得到一组词的价值。其理论是,它会创造一个门槛,其中某些东西是可以接受的,而另一些则是不可接受的。在对现有日志进行分级之后,我将有一种有意义的方法来确定一条消息是否符合我的社区定义的标准。
我的问题是-
发布于 2012-10-16 23:30:14
如果可能的话,我宁愿考虑用户能够在实时的情况下标记消息。正常的用户可以这样做,而不是您必须找到人来审查他们离线。如果您不能或不想使用这种方法:在任何其他消息的上下文之外,可能会发现消息是不合适的,但是查看一个连续的消息流,按照它们实时出现的顺序可能会有帮助。我可能会给他们X个连续的消息。在实时标记的情况下,我建议使用红色标记的消息,或类似的信息,在此之前和之后发送一些信息。
当用户查看一定数量的消息时,您可以尝试设置某种奖励系统。如果允许对消息进行实时标记,则可以奖励查看标记邮件以确认标记状态的人员。
知道哪一个球员是有用的。如果玩家发布了一些不合适的信息,你可以发出警告或者禁止什么。服务器可能不那么有用,但我完全支持存储一些额外的信息,您可能会在后面找到有用的信息。
我不会真的被挂在数据库存储上。有一个包含时间列(或者仅仅是自动增量ID,或者两者都有)、播放器、服务器、消息、isInappropriate的表应该是可以的,这取决于您想要执行的操作类型。
您可以采取的方法(一旦您有一些消息标记为不适当)将非常类似于垃圾邮件过滤器(您应该能够找到足够的材料)。
一般要考虑的是,当标记为不适当时,您是否希望从宽或严格(您希望一些不适当的消息被遗漏,或者一些消息被标记)。调查精确/召回,给出一些有关这方面的想法。
我怀疑在聊天环境中,简单地查找(并可能试图自动识别)出现在不适当消息中的特定单词就足够了。
https://stackoverflow.com/questions/10184023
复制相似问题