文章/答案/技术大牛

发布

社区首页 >问答首页 >不支持数据类型ArrayType(FloatType，false) -collaborative筛选

问不支持数据类型ArrayType(FloatType，false) -collaborative筛选
EN

Stack Overflow用户

提问于 2017-02-09 15:12:11

回答 1查看 646关注 0票数 0

我正在学习推荐系统，我想把在肌萎缩侧索硬化症模型中创建的userFactor和itemFactor传递给K-means，但k-means想要VectorUDT，但我从模型中获得了ArrayType(FloatType)。

我还试图将userFactor传递给向量汇编程序，然后创建一个向量到k均值的向量，但同样的错误也会产生帮助。

这是个新手。

from pyspark.sql.types import IntegerType
from pyspark.ml.clustering import KMeans
from pyspark.ml.feature import VectorAssembler


userFactorsDF= alsmodel.userFactors.select("features")

vecAssembler = VectorAssembler(inputCols=["features"], outputCol="features")
featuresdf = vecAssembler.transform(userFactorsDF)

kmeans = KMeans().setK(2).setSeed(1)
model1 = kmeans.fit(featuresdf)


ERROR

IllegalArgumentException: u'Data type ArrayType(FloatType,false) is not supported.'
---------------------------------------------------------------------------
IllegalArgumentException                  Traceback (most recent call last)
<ipython-input-77-05324b5cde72> in <module>()
      7 vecAssembler = VectorAssembler(inputCols=["features"], outputCol="features")
      8 
----> 9 featuresdf = vecAssembler.transform(userFactorsDF)
     10 
     11 kmeans = KMeans().setK(2).setSeed(1)

pyspark

filtering

k-means

recommendation-engine

collaborative

回答 1

Stack Overflow用户

发布于 2018-11-06 13:38:27

您可以尝试编写一个UDF，并在将其传递给VectorAssembler之前从中提取值。

UserDefinedFunction mode = udf((Seq<String> array, fromIndex int, toIndex int) -> array.slice(fromIndex ,toIndex ).mkString(","));

票数 -1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/42130387

复制

相似问题

问不支持数据类型ArrayType(FloatType，false) -collaborative筛选
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问不支持数据类型ArrayType(FloatType，false) -collaborative筛选EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问不支持数据类型ArrayType(FloatType，false) -collaborative筛选
EN