首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >fscrawler给出了三个javascript错误

fscrawler给出了三个javascript错误
EN

Stack Overflow用户
提问于 2017-08-03 21:30:10
回答 1查看 196关注 0票数 0

我是Elasticsearch的新手,并且一直在尝试使用ingest插件(我已经发布了几个关于它的问题)。有人建议,对于我正在尝试做的事情,我应该使用Fscrawler。我使用的是Elasticsearch 5.5.1,我已经安装了Fscrawler 2.3。我已经安装了java8.0.1,并且创建了一个指向java目录的环境变量'JAVA_HOME‘。使用Kibana,我创建了以下内容:

代码语言:javascript
复制
PUT _ingest/pipeline/docs 
{
  "description": "documents",
  "processors" : [
    {
     "attachment" : {
        "field": "data",
        "indexed_chars" : -1
      }
    }]
}
PUT myindex
{
  "mappings" : {
    "documents" : {
      "properties" : {
        "attachment.data" : {
          "type": "text",
          "analyzer": "standard"
        }
      }
    }
  }
}

在我的Fscrawler的_settings文件中,我将url设置为我的documents文件夹,并在elaasticsearch部分包含了"index" : "myindex"

使用powershell命令.\fscrawler mydocs --loop 1

下面是该命令的输出。

这是我的fscrawler的_settings.json文件

代码语言:javascript
复制
{
  "name" : "docs",
  "fs" : {
    "url" : "w:\\Elasticsearch\\Docs",
    "update_rate" : "15m",
    "excludes" : [ "~*" ],
    "json_support" : false,
    "filename_as_id" : false,
    "add_filesize" : true,
    "remove_deleted" : true,
    "add_as_inner_object" : false,
    "store_source" : false,
    "index_content" : true,
    "attributes_support" : false,
    "raw_metadata" : true,
    "xml_support" : false,
    "index_folders" : true,
    "lang_detect" : false,
    "continue_on_error" : false,
    "pdf_ocr" : true
  },
  "elasticsearch" : {
    "nodes" : [ {
      "host" : "127.0.0.1",
      "port" : 9200,
      "scheme" : "HTTP"
    } ],
    "index" : "myindex",
    "bulk_size" : 100,
    "flush_interval" : "5s",
    "username" : "elastic",
    "password" : "changeme"
  },
  "rest" : {
    "scheme" : "HTTP",
    "host" : "127.0.0.1",
    "port" : 8080,
    "endpoint" : "fscrawler"
  }
}
EN

回答 1

Stack Overflow用户

发布于 2017-08-03 23:08:50

最好不要包含截图,而是复制和粘贴日志。

然后:

  • 你不需要定义一个注入管道
  • 你的fscrawler设置是什么样子的?
  • 有一个关于旧的FSCrawler版本的警告。你以前用过2.2吗?
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/45485707

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档