我正在使用datumbox framework.In进行情感分析,datumbox的代码示例用于情感分析的训练示例取自包含pos和neg句子HERE IS THE EXAMPLE CODE.的资源文件夹
为了获得更好的准确性,我们需要越来越多的训练有素的样本,我们只是不能从一个文件中加载所有数据,对吧?现在,我想从磁盘中获取数据,但无法在datumbox的配置文件中找到如何修复配置属性,从而无法从磁盘中获取经过训练的示例。
在代码示例中,我们从文件中提取经过训练的示例,如下所示。
Map<Object, URI> datasets = new HashMap<>(); //The examples of each category are stored on the same file, one example per row.
datasets.put("positive", TextClassification.class.getClassLoader().getResource("datasets/sentiment-analysis/rt-polarity.pos").toURI());
datasets.put("negative", TextClassification.class.getClassLoader().getResource("datasets/sentiment-analysis/rt-polarity.neg").toURI());一旦我们能够从磁盘读取训练数据,如何替换代码中的上述三行?
你们谁能帮帮我?
以下是说明基于磁盘的培训的blog:
发布于 2016-07-21 15:36:25
我不确定我是否完全理解了你的问题,主要是因为我的英语不好,我猜。但是,如果我是对的,我认为您正在尝试让属性找到磁盘的路径,以添加您需要的文件。您可以尝试在属性文件上的conf文件夹中创建特定字段,如properpath=C://desktop/neededfile etc.Then,您可以使用java.util.Properties调用它,然后您可以使用正确的FileInputStream-like类正确读取您的文件。例如:
inputStream = new FileInputStream(source.properpath);我使用我向您展示的代码来读取xml文件,不同类型的文件,但基本原理仍然相同。我希望这对你有帮助。
https://stackoverflow.com/questions/38497105
复制相似问题