首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >电影销售按流派维度建模

电影销售按流派维度建模
EN

Stack Overflow用户
提问于 2020-11-19 15:20:01
回答 1查看 47关注 0票数 1

假设我想在OLAP多维数据集中按类型找出每年的电影销售额。数据结构将如下所示:

代码语言:javascript
复制
{
    "Year": 2020,
    "Title": "Spider-Man: Into the Spider-Verse",
    "Revenue": 102000,
    "Genres": ["Action", "Sci-Fi"]
}

对此进行建模的正确方法是什么?我会不会去嵌套流派,这样流派本身就会乘以销售量?例如,事实表将如下所示:

代码语言:javascript
复制
+------------+
| Movie Fact |
+------------+
| Year       |
| Title      |     (1 record for the above data)
| Revenue    |
+------------+

或者它看起来像是:

代码语言:javascript
复制
+------------+
| Movie Fact |
+------------+
| Year       |
| Title      |     (TWO records for the above data)
| Revenue    |
| Genre      |
+------------+

为什么它会是一种方式超过另一种方式?

EN

回答 1

Stack Overflow用户

发布于 2020-11-24 22:39:41

你需要多对多的桥接表来处理同一电影的多种类型。你的事实表显然会有>1部电影。M2M表将仅显示每个电影和每个流派之间的维度关系。

尺寸:

  • Date (所有电影的所有年份或YYYYMMDD格式的日期作为关键字,以及其他列,如年份、日历日期MM/DD/YYYY等,带有key Date_SK)
  • 流派(只是简单的键值列表,如1-动作、2-科幻、3-戏剧等)

桥接表(+分隔此度量值组!):

  • Movies_Genres (Movie_SK,Genre_SK)。对于这部电影,它将包含两行。行1:1;行2: 1,2

事实表:

  • Movies (Movie_SK,Title,Date_SK,Revenue)

所有表之间的联接是:

电影日期<-- Movies

  • Movies_Genres <--
  • 类型<-- Movies_Genres

在维度用法选项卡上,您将通过已连接到流派维度的Movies_Genres度量值组上的“多对多关系”将Movies事实数据表与流派维度联接起来。

这是避免重复的唯一方法。服务器将通过每个流派,在总的收入,你将看到每个流派相同的收入,如果一部电影被选中。

对于每个>1M行的桥接表和维度,性能可能会很慢。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/64907039

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档