1. 程式人生 > >【spark】命令列檢視parquet檔案內容

【spark】命令列檢視parquet檔案內容

1,進入spark shell

./spark-shell

2,執行以下操作讀取parquet檔案

val sqlContext = new org.apache.spark.sql.SQLContext(sc)

val parquetFile = sqlContext.parquetFile("/home/neunntest/hdfs/dataSet/2018-1-2/iris20180102_1514855343/*.parquet")

3,列印具體內容

parquetFile.take(150).foreach(println)


連結:https://www.jianshu.com/p/57b20d9d7b4a