scala spark dataframe 修改字段类型 - 代码天地

scala spark dataframe 修改字段类型

其他 2020-04-03 11:50:55 阅读次数: 0

package classifierAlg
import config.conf.{sc, spark_session}
import config.conf.spark_session.implicits._
import org.apache.spark.sql.functions._
import org.apache.spark.sql.types._
import org.apache.spark.sql.{Column, DataFrame}
object euclideanDist {
  def main(args: Array[String]): Unit = {
    val path:String = "data/irsdf/part-00000-ca2d6ce7-bcd0-4c24-aba9-e8cb01dcc04c-c000.csv"
    val df: DataFrame = spark_session.read.csv(path).toDF("ft1","ft2","ft3","ft4","label")
    val cols: Array[String] = df.columns
    val n: Int = cols.length
//     val colNames : Array[String] = df.schema.fieldNames
    val colsd: Array[Column] = cols.map(f => df(f).cast(DoubleType))
    val df2: DataFrame = df.select(colsd: _*)
    df2.printSchema()

  }
}

猜你喜欢

转载自www.cnblogs.com/wuzaipei/p/12625471.html

scala spark dataframe 修改字段类型

Spark DataFrame中的join类型

spark.dataframe的一些常用操作(Scala)

(Scala版)Spark Sql RDD/DataFrame/DataSet 相互转换

关于Scala：如何查找Spark RDD / Dataframe大小

Spark DataFrame批量修改数据类型

Spark DataFrame

【Spark】DataFrame

【Saprk】Spark DataFrame 列的类型转换

scala spark2.0 rdd dataframe 分布式计算欧式距离

Spark DataFrame的Join操作和withColumn、withColumnRenamed方法实践案例（Scala Demo代码）

scala spark

Spark & Scala：

scala in spark

spark的scala

Spark DataFrame 与Pandas DataFrame差异

Spark基础-scala学习（七、类型参数）

spark将dataframe中的字段转成一列

Spark DataFrame vector 类型存储到Hive表

Spark RDD转DataFrame并更改列column的类型

Spark-Spark SQL and DataFrame

spark - DataFrame Api 练习

spark - RDD转成DataFrame

基于spark的DataFrame实战

spark SQL and DataFrame(一)

spark dataframe 转成 dataset

Spark DataFrame vs Dataset

spark RDD 生成 DataFrame

spark dataframe -> rdd

Spark DataFrame常用操作

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)