我正在制作一个处理大量信息的应用程序。这些信息是使用一些网络爬虫检索的,是关于新闻的,包含新闻标题、URL、发布日期、类别和内容等数据。爬行的数据是XML格式的,我将把这些信息加载到我的应用程序中。
从那里,10个用户将处理每一个新闻,并通过阅读标题手动标记新闻类别。我使用了9个主要类别,对于每个新闻,用户将从0-5决定这个特定新闻在多大程度上属于每个类别。
用户还将按标题搜索新闻,并决定此消息是否与另一条新闻讨论同一事件,或者该消息是否类似于另一条新闻(例如下午3点的足球比赛新闻和下午5点的足球比赛新闻)。
我在制作应用程序本身方面没有问题,我只是需要一些帮助来设计一个/多个表格,这些表可以链接谈论类似事件或相同事件的新闻,因为可以有很多新闻可以谈论同一个事件。
到目前为止,我已经做了这样的事情:
表报
ID
Title
URL
PublicationDate
NewsContent表类别
NewsID
User_ID
Economy
Politics
Present_Day
Sport
Technology
Showbiz
Culture
Region
World表用户
ID
FirstName
LastName“类别”表中的每个类别字段都包含一个微小的数据类型(我使用的是Server),并且我限制了用户可以通过检查约束输入的值,以便允许从0- 5值。到目前为止,我不知道这是否是数据库设计的正确方法,我需要添加表/S,它允许添加有关谈论同一事件的类似新闻或新闻的信息,例如包含一些字段的表Similar_News,如News_ID、SimilarNews1_ID、SimilarNews2_ID等,并且必须包含关于哪个用户‘说这个’的信息,但在我看来,这似乎是一个有缺陷的设计。
任何帮助都是非常感谢的,谢谢。
发布于 2016-06-13 00:34:18
基于这听起来有多动态,我建议您看看NoSQL数据结构。我自己并不这么多地使用它们,但是研究类似MongoDB这样的东西可能是值得的。祝你的申请好运!
https://dba.stackexchange.com/questions/141048
复制相似问题