首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >titan elasticsearch不使用索引

titan elasticsearch不使用索引
EN

Stack Overflow用户
提问于 2015-03-18 21:06:12
回答 1查看 767关注 0票数 2

在我们的大型Titan Graph数据库中,我注意到以下行为:

代码语言:javascript
复制
         \,,,/
         (o o)
-----oOOo-(_)-oOOo-----
14:16:35 WARN  org.apache.hadoop.util.NativeCodeLoader  - Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
gremlin> g = TitanFactory.open('/home/willem/workspace/ovc/src/main/resources/titan-cassandra-es.properties')
14:16:44 WARN  com.thinkaurelius.titan.graphdb.configuration.GraphDatabaseConfiguration  - Local setting cache.db-cache-time=0 (Type: GLOBAL_OFFLINE) is overridden by globally managed value (180000).  Use the ManagementSystem interface instead of the local configuration to control this setting.
==>titangraph[com.thinkaurelius.titan.diskstorage.cassandra.astyanax.AstyanaxStoreManager:[10.1.0.200]]
gremlin> g.indexQuery("mediaSerialNBStringIdx","v.mediaSerialNB:EB*").vertices().count()
==>937
gremlin> g.V().has("mediaSerialNB",PREFIX,"EB").count()
14:17:17 WARN  com.thinkaurelius.titan.graphdb.transaction.StandardTitanTx  - Query requires iterating over all vertices [(mediaSerialNB PREFIX EB)]. For better performance, use indexes

因此,使用indexQuery(...)直接寻址索引利用索引,但将其留给查询优化器,它不会发现该特定字段上存在MixedIndex这一事实。

这是运行elasticsearch 1.2.2的Titan 0.5.3。

以下是索引细节:

代码语言:javascript
复制
gremlin> m = g.getManagementSystem()
==>com.thinkaurelius.titan.graphdb.database.management.ManagementSystem@6a26cb53
gremlin> m.getGraphIndex("mediaSerialNBStringIdx").isMixedIndex()
==>true
gremlin> m.getGraphIndex("mediaSerialNBStringIdx").getFieldKeys()
==>mediaSerialNB
gremlin> m.getGraphIndex("mediaSerialNBStringIdx").getBackingIndex()
==>search
gremlin> k = m.getPropertyKey("mediaSerialNB")
==>mediaSerialNB
gremlin> m.getGraphIndex("mediaSerialNBStringIdx").getIndexStatus(k)
==>INSTALLED

索引状态是"INSTALLED“而不是"ENABLED”这一事实给了我线索吗?如果是这样,我如何帮助elasticsearch启用它?

在阅读重建索引时,我发现了以下内容:

代码语言:javascript
复制
mgmt.updateIndex(rindex, SchemaAction.ENABLE_INDEX);

但这是我们的数据库告诉我们的:

代码语言:javascript
复制
gremlin> mediaSerialNBKey = g.getPropertyKey("mediaSerialNB")
==>mediaSerialNB
gremlin> mediaSerialNBStringIdx = m.getGraphIndex("mediaSerialNBStringIdx")
==>com.thinkaurelius.titan.graphdb.database.management.TitanGraphIndexWrapper@7c54dcff
gremlin> mediaSerialNBStringIdx.getParametersFor(mediaSerialNBKey)
==>mapping->STRING
==>mapped-name->4h6t
==>status->INSTALLED
gremlin> m.updateIndex(mediaSerialNBStringIdx, SchemaAction.ENABLE_INDEX)
Update action [ENABLE_INDEX] does not apply to any fields for index [com.thinkaurelius.titan.graphdb.database.management.TitanGraphIndexWrapper@7c54dcff]
EN

回答 1

Stack Overflow用户

发布于 2015-03-26 23:01:25

是的,您需要启用索引。为此,索引必须处于REGISTERED状态,而不是像您的情况那样处于INSTALLED状态。通常,当使用相同存储后端的所有titan实例确认索引更改时,此转换会自动发生。

然而,也有可能你有一些实例不再活跃。您可以在gremlin控制台列出所有实例:

代码语言:javascript
复制
m=g.getManagementSystem()
m.getOpenInstances()

如果有任何死实例,则应手动删除它们,使用

代码语言:javascript
复制
mgmt.forceCloseInstance("dead-instance-id")
mgmt.commit()

您可以在文档section 27.2中找到更多信息。

根据我的经验,最好在执行索引维护之前关闭除gremlin会话之外的所有实例。

现在,您可以手动注册索引(请参阅section 28.7.1):

代码语言:javascript
复制
m = g.getManagementSystem()
mediaSerialNBStringIdx = m.getGraphIndex("mediaSerialNBStringIdx")
m.updateIndex(mediaSerialNBStringIdx, SchemaAction.REGISTER_INDEX)
m.commit()

要检查:

代码语言:javascript
复制
m = g.getManagementSystem()
k = m.getPropertyKey("mediaSerialNB")
m.getGraphIndex("mediaSerialNBStringIdx").getIndexStatus(k)
// should return REGISTERED

现在,您可以成功启用索引:

代码语言:javascript
复制
m = g.getManagementSystem()
mediaSerialNBStringIdx = m.getGraphIndex("mediaSerialNBStringIdx")
m.updateIndex(mediaSerialNBStringIdx, SchemaAction.ENABLE_INDEX)
m.commit()
票数 5
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/29122916

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档