我在把csv文件拷贝到卡桑德拉。我有下面的csv文件,表如下所示。
创建表UCBAdmissions(
id int PRIMARY KEY, admit text, dept text, freq int, gender text)
输出是
在0.318秒内导入24行。
cqlsh>从UCBAdmissions中选择*;
身份证,承认,部门,女性,性别
(0行)
输出是
在0.364秒内导入24行。
cqlsh>从UCBAdmissions中选择*;
身份证,承认,部门,女性,性别
23 -获接纳-女性
5名被接纳的人-B
10 -被拒绝-C- 205 -男性
16被拒绝D\x{e76f}
13获接纳.D/ 138 .男
11获接纳C/ 202女
1名获接纳的人获接纳
19获接纳-E-女性
8,被拒绝,B,8,女性
2-被拒绝-A- 313 -男性
4被拒绝A/ 19女性
18被拒绝E/ 138男
15 -获准进入-D- 131 -女性
22,被拒绝,F,351,男性
20 -被拒绝E- 299 -女性
7.承认.B. 17 .女性
6-被拒绝-B- 207 -男性
9.获准入境.C类. 120
14,被拒绝,D- 279
21获接纳*
17获接纳E+ 53男
24,被拒绝,F,317,女性
12 -被拒绝-C- 391
3名被接纳的女性
UCBAdmissions.csv
"“、”承认“、”性别“、”部门“、”弗雷克“
"1“、”承认“、”男性“、”A“、512
"2“、”拒绝“、”男性“、”A“、313
"3“、”承认“、”女性“、”A“、89
"4“、”拒绝“、”女性“、"A",19岁
"5“、”承认“、”男性“、”B“、353
"6“、”拒绝“、”男性“、”B“、207
"7“、”承认“、”女性“、"B",17岁
"8“、”拒绝“、”女性“、”B“、8
"9“、”承认“、”男性“、”C“、120
"10“、”拒绝“、”男性“、”C“、205
"11“、”承认“、”女性“、”C“、202
"12“、”拒绝“、”女性“、”C“、391
"13“、”承认“、”男性“、”D“、138
"14“、”拒绝“、”男性“、”D“、279
"15“、”承认“、”女性“、”D“、131
"16“、”拒绝“、”女性“、”D“、244
"17“、”承认“、”男性“、”E“、53
"18“、”拒绝“、”男性“、”E“、138
"19“、”承认“、”女性“、”E“、94
"20“、”拒绝“、”女性“、”E“、299
"21“、”承认“、”男性“、”F“、22岁
"22“、”拒绝“、”男性“、”F“、351
"23“、”承认“、”女性“、”F“、24岁
"24“、”拒绝“、”女性“、”F“、317
如上面所示,我看到输出顺序从csv文件中被更改。
问题:1和2有什么区别?我们应该按照csv文件的相同顺序在cassandra中创建表吗?
发布于 2015-12-16 06:03:44
Cassandra被设计为分布式的-为了实现这一点,它使用表的分区键(id),并使用集群的分区器(可能是Murmur3Partitioner)来创建一个整数(实际上是一个长的),然后使用该整数将其分配给环中的一个节点。
您所看到的是由结果令牌排序的结果,这是不直观的,但不一定是错误的。在卡桑德拉,没有一种直接的方式来做SELECT * FROM table ORDER BY primaryKey ASC --分布式的特性使得很难有效地做到这一点。
https://stackoverflow.com/questions/34301546
复制相似问题