我使用d3js读取一个大小为40 to的csv文件,它可以很好地处理以下代码:
<script type="text/javascript">
d3.csv("test.csv", function(data) {
// data is JSON array. Do something with data;
console.log(data);
});
</script> 现在,我们的想法是避免使用d3js,而是在scala中构造JSONarray并通过z.angularBind()在javascript代码中访问这个变量。以下两种代码都适用于较小的文件,但对于大小为40 of的CSV文件,则会给出java堆空间错误。我无法理解的是,当d3.csv()能够在没有任何堆空间错误的情况下完美地完成工作,为什么下面的代码中的这两个不能完成呢?
编辑代码1:使用scala的
import java.io.BufferedReader;
import java.io.FileReader;
import org.json._
import scala.io.Source
var br = new BufferedReader(new FileReader("/root/test.csv"))
var contentLine = br.readLine();
var keys = contentLine.split(",")
contentLine = br.readLine();
var ja = new JSONArray();
while (contentLine != null) {
var splits = contentLine.split(",")
var i = 0
var jo = new JSONObject()
for(i <- 0 to splits.length-1){
jo.put(keys(i), splits(i));
}
ja.put(jo);
contentLine = br.readLine();
}
//z.angularBind("ja",ja.toString()) //ja can be accessed now in javascript (EDITED-10/11/15)编辑代码2: --我认为如果像下面的代码那样使用Apache构造JSON数组,堆空间问题就会消失,但是这个也会导致堆空间错误:
def myf(keys: Array[String], value: String):String = {
var splits = value.split(",")
var jo = new JSONObject()
for(i <- 0 to splits.length-1){
jo.put(keys(i), splits(i));
}
return(jo.toString())
}
val csv = sc.textFile("/root/test.csv")
val firstrow = csv.first
val header = firstrow.split(",")
val data = csv.filter(x => x != firstrow)
var g = data.map(value => myf(header,value)).collect()
// EDITED BELOW 2 LINES-10/11/15
//var ja= g.mkString("[", ",", "]")
//z.angularBind("ja",ja) //ja can be accessed now in javascript发布于 2015-11-04 07:44:19
您正在创建JSON对象。它们不是java/scala固有的,因此将在该环境中占用更多的空间。z.angularBind()真正做了什么?
此外,javascript环境的堆大小(请参阅https://www.quora.com/What-is-the-maximum-size-of-a-JavaScript-object-in-browser-memory中的chrome)和java环境的堆大小(请参见How is the default java heap size determined?)。
更新:删除回答中我误解问题的原始部分
https://stackoverflow.com/questions/33514734
复制相似问题