Cum de a cartografia RDD de clasă caz la LabeledPoint (eticheta, vector caracteristic).
Aceasta este DZR de clasă caz Examen (x: dublă, y: Double):
Ds (1.0,6.0)
Ds (2.0,8.0)
Ds (3.0,10.0)
Ds (3.0,10.0)
ds (4.0,12.0)
Ds (5.0,14.0)
Am încercat a face acest lucru -
val parsedData = aRDD.map(row =>
new LabeledPoint(
row._1,
Vectors.dense(row._2))
Obținerea de eroare „Valoarea _1 nu este membru al main.scala.spark.Q1Partb.Q1.Exam“ la row._1 și row._2
și asta -
val parsedData = aRDD.map{line =>
val Array(rawLabel, rawfeatures) = line.split(',')
val features = rawfeatures) .split(' ').map(_.toDouble)
LabeledPoint(rawLabel.toDouble, Vectors.dense(features))}
Obținerea de eroare „valoare recursiv x tip $ 4 are nevoie“ pentru rawLabel și „valoare divizat nu este membru al main.scala.spark.Q1Partb.Q1.ds“ pentru line.split ( „“)