scala和java解壓zip的檔案，並上傳到hdfs伺服器

阿新 • • 發佈：2019-01-26

之前一直使用的事java開發的，後來學習hadoop，spark以後，需要做一個解壓檔案到伺服器的例子，由於學習scala時間不長，故先用java程式碼寫出來，在改成scala的程式碼，過程中出現了很多問題，我將會在最後說明，請大家注意不要少了包。

環境宣告：windows8.1，eclipse，idea14，hadoop2.6，scala2.11，請自行配置好hadoop的環境。

java程式碼如下：

<span style="font-size:12px;">public class TestFile {
public static void main(String[] args) {
String zipDir = "G:/zip";
File zipFile = new File(zipDir);
File[] zipFiles = zipFile.listFiles();
for(File zip:zipFiles)
{
if(zip.getName().endsWith(".zip"))
{
System.out.println("name is "+zip.getName()+" , path = "+zip.getAbsolutePath());
//解壓zip壓縮檔案
boolean result = unZipFile(zip,zipDir);
if(result)
{
String filedir = zip.getName().substring(0, zip.getName().indexOf("."));
String localDir = zipDir+filedir;
System.out.println("檔案f.getName()解壓成功 filedir = "+filedir);
//上傳檔案到HDFS
String cloudDir = "hdfs://10.132.10.235:9000/zcd/";
upload(localDir,cloudDir);
//刪除本地目錄
File fileDir = new File(localDir);
deleteFile(fileDir);
fileDir.delete();
zip.delete();

}
else
{
System.out.println("檔案f.getName()解壓失敗");
}
}
}
}

private static boolean unZipFile(File zipFile, String descDir)  
    {  
boolean flag = true;

try {
File pathFile = new File(descDir);  
if(!pathFile.exists()){  
   pathFile.mkdirs();  
}  
ZipFile zip = new ZipFile(zipFile);  
for(Enumeration entries = zip.getEntries();entries.hasMoreElements();){  
   ZipEntry entry = (ZipEntry)entries.nextElement();  
   String zipEntryName = entry.getName();  
   InputStream in = zip.getInputStream(entry);  
   String outPath = (descDir+zipEntryName).replaceAll("\\*", "/");;  
   //判斷路徑是否存在,不存在則建立檔案路徑  
   File file = new File(outPath.substring(0, outPath.lastIndexOf('/')));  
   if(!file.exists()){  
       file.mkdirs();  
   }  
   //判斷檔案全路徑是否為資料夾,如果是上面已經上傳,不需要解壓  
   if(new File(outPath).isDirectory()){  
       continue;  
   }  
   //輸出檔案路徑資訊  
   System.out.println(outPath);  
     
   OutputStream out = new FileOutputStream(outPath);  
   byte[] buf1 = new byte[1024];  
   int len;  
   while((len=in.read(buf1))>0){  
       out.write(buf1,0,len);  
   }  
   in.close();  
   out.close();  
   }
} catch (ZipException e) {
flag = false;
e.printStackTrace();
} catch (FileNotFoundException e) {
flag = false;
e.printStackTrace();
} catch (IOException e) {
flag = false;
e.printStackTrace();
}  
        System.out.println("******************解壓完畢********************");   
        return flag;
    }  

private static void upload(String localDir,String cloudDir)
{
try {
System.out.println("hadoop上傳檔案開始...");
// 獲取一個conf物件
Configuration conf = new Configuration();
File fileDir = new File(localDir);
File[] files = fileDir.listFiles();
InputStream in = null;
FileSystem fs = null;
OutputStream out = null;
for(File file:files)
{
// 本地檔案存取的位置
String LOCAL_SRC = file.getAbsolutePath();
// 存放到雲端HDFS的位置
String CLOUD_DEST = cloudDir+file.getName();
in = new BufferedInputStream(new FileInputStream(LOCAL_SRC));
// 檔案系統
fs = FileSystem.get(URI.create(CLOUD_DEST), conf);
// 輸出流
out = fs.create(new Path(CLOUD_DEST));
// 連線兩個流，形成通道，使輸入流向輸出流傳輸資料
IOUtils.copyBytes(in, out, 1024, true);
}
in.close();
fs.close();
out.close();
System.out.println("hadoop上傳檔案結束...");
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IllegalArgumentException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}

private static void deleteFile(File file)
{
if(file.exists())
{                    
   if(file.isFile())
   {                   
      file.delete();
   }
   else if(file.isDirectory())
   {              
     File files[] = file.listFiles();               
     for(int i=0;i<files.length;i++)
     {            
         deleteFile(files[i]);
     } 
   } 
} 
}
}</span>

scala程式碼如下：

object zip {
  def main(args: Array[String]) {
    val zipDir = "G:/zip"
val zipFile = new File(zipDir)
    val zipFiles = zipFile.listFiles()
    for(zip <- zipFiles)
    {
      if(zip.getName.endsWith(".zip"))
      {
        println("name is "+zip.getName+" , path = "+zip.getAbsolutePath)
        //解壓zip壓縮檔案
 
val result = unZipFile(zip,zipDir)
        if(result)
        {
          val filedir = zip.getName.substring(0, zip.getName.indexOf("."))
          val localDir = zipDir+filedir
          println("檔案f.getName()解壓成功 filedir = = "+filedir)
          //上傳檔案到HDFS
val cloudDir = "hdfs://10.132.10.235:9000/zcd/"
upload 
(localDir,cloudDir);
//刪除本地目錄
val fileDir = new File(localDir)
          deleteFile(fileDir)
          fileDir.delete()
          zip.delete()
        }
        else{
          println("檔案f.getName()解壓失敗")
        }
      }
    }
  }

  /**
   * 解壓
   * @param zipFile
* @param descDir
* @return
*/
def unZipFile(zipFile:File , descDir:String ):Boolean ={
    var flag = true
    try {
      val pathFile:File = new File(descDir)
      if (!pathFile.exists) {
        pathFile.mkdirs
      }
      val zip = new ZipFile(zipFile)
      val entries = zip.getEntries
      while (entries.hasMoreElements){
       // val entry = entries.nextElement.asInstanceOf[ZipFile]
val entry = entries.nextElement
        val zipEntryName = entry.getName
        val in = zip.getInputStream(entry)
        val outPath = (descDir + zipEntryName).replaceAll("\\*", "/")
        //判斷路徑是否存在,不存在則建立檔案路徑
val file = new File(outPath.substring(0, outPath.lastIndexOf('/')))
        if (!file.exists) {
          file.mkdirs
        }
        //判斷檔案全路徑是否為資料夾,如果是上面已經上傳,不需要解壓
if (!new File(outPath).isDirectory()) {
          //輸出檔案路徑資訊
println(outPath)
          val out = new FileOutputStream(outPath)
          //val writer = new PrintWriter(new File(outPath))
val buf1 = Array[Byte]()
          while((in.read(buf1))>0){
            in.read
            out.write(buf1)
          }
          // out.close
}
        in.close
      }
    }catch{
      case e: ZipException =>
        flag = false
      case e: FileNotFoundException =>
        flag = false
      case e: IOException =>
        flag = false
}
    println("******************解壓完畢********************")
     flag
  }

  /**
   * 上傳
   * @param localDir
* @param cloudDir
*/
def upload(localDir:String,cloudDir:String): Unit ={
    try {
      println("hadoop上傳檔案開始...");
// 獲取一個conf物件
val conf = new Configuration();
val fileDir = new File(localDir);
val files = fileDir.listFiles();
var in:InputStream = null
      var fs:FileSystem=null
      var out:OutputStream=null
      for(file <- files){
        // 本地檔案存取的位置
val LOCAL_SRC = file.getAbsolutePath
        // 存放到雲端HDFS的位置
val CLOUD_DEST = cloudDir+file.getName
        in = new BufferedInputStream(new FileInputStream(LOCAL_SRC))
        // 檔案系統
fs = FileSystem.get(URI.create(CLOUD_DEST), conf)
        // 輸出流
out = fs.create(new Path(CLOUD_DEST))
        // 連線兩個流，形成通道，使輸入流向輸出流傳輸資料
IOUtils.copyBytes(in, out, 1024, true)
      }
      in.close
      fs.close
      out.close
      println("hadoop上傳檔案結束...");
} catch {
      case e: FileNotFoundException =>
         e.printStackTrace
      case e: IllegalArgumentException =>
         e.printStackTrace
      case e: IOException =>
         e.printStackTrace
    }
  }
  /**
   * 刪除
   * @param file
*/
def deleteFile(file:File ):Unit={
    if(file.exists()){
      if(file.isFile()){
        file.delete()
      }else if(file.isDirectory()){
        val files = file.listFiles()
        for(file <- files){
          deleteFile(file)
        }
      }
    }
  }
}

在這裡主要說scala程式碼編寫過程中出現的問題：

scala可以自動解析物件的型別，所以不需要我們自己宣告物件的型別，一般都用val來宣告，除非是一定要改變的值，就用var，必須初始化。

在scala中一開始這句話是報錯的，提示不能解析，也就是找不到entries找不到nextElement 這個方法。

val entry = entries.nextElement

我們需要做如下的裝換：

val entry = entries.nextElement.asInstanceOf[ZipFile]

上面這個原因是因為我使用了一個ant1.8.jar的jar包，最後發現是這個包的原因，在scala下執行還有警告。用ant.jar替換ant1.8.jar包，就可以了。

在宣告物件的時候，物件是必須初始化的，如果可以為null，但是有時候你必須宣告它的型別，可以如下宣告，加上它的型別即可。

var in:InputStream = null

往hdfs寫檔案時可以用方法即可

// 本地檔案存取的位置
val LOCAL_SRC = file.getAbsolutePath
// 存放到雲端HDFS的位置
val CLOUD_DEST = cloudDir+file.getName
in = new BufferedInputStream(new FileInputStream(LOCAL_SRC))
// 檔案系統
fs = FileSystem.get(URI.create(CLOUD_DEST), conf)
// 輸出流
out = fs.create(new Path(CLOUD_DEST))
// 連線兩個流，形成通道，使輸入流向輸出流傳輸資料
IOUtils.copyBytes(in, out, 1024, true)

scala和java解壓zip的檔案，並上傳到hdfs伺服器

之前一直使用的事java開發的，後來學習hadoop，spark以後，需要做一個解壓檔案到伺服器的例子，由於學習scala時間不長，故先用java程式碼寫出來，在改成scala的程式碼，過程中出現了很多問題，我將會在最後說明，請大家注意不要少了包。環境宣告：windows

Java解壓zip檔案(支援中文字元檔案)

昨天接到了一個解壓zip檔案的任務,所以今天在做任務之前，便寫demo試了一下, 部分思路參考自:這裡貼上程式碼: public void Decompressing2() throws IOException { String pa

java解壓zip檔案例項

package test; import java.io.File; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.

分別用scala和java執行Spring Boot專案，並輸出HelloWorld

這個必須Mark一下！用scala寫spring boot的資源好少，找的好辛苦以下都是我在網上找的前輩們寫的，有些地方只能理解一點，但是是可以成功執行的！我是在IDEA中用Maven構建的spring boot專案pom.xml<?xml version="1.0"

hadoop工作流引擎解壓jar檔案，並執行出現型別不匹配的情況

在做hadoop工作流引擎專案開發的時候，編寫某些特定的Mapreduce程式，雖然該程式在hadoop平臺型執行正常，但在工作流引擎中執行卻出現錯誤，主要的原因是該工作流引擎是提取jar中的Mapper和Reducer以及主類，執行該jar時是要重新設定輸入輸出型別，原先

python 二維列表對映寫入csv檔案，並上傳OSS

# -*- coding: utf-8 -*- import sys import oss2 from datetime import datetime import csv import traceb

Intellij idea將jsp專案到處war包，並上傳到伺服器

看這篇文章的前提是你已經會用IDEA寫專案。開啟專案，在右上角點配置。選擇Artifacts，再點綠色加號。選擇第三個，再選擇Empty 然後在右側欄進行如下設定，最後點OK 然後再點這個綠色加號，選中你的jsp所在目錄並OK 以後在專案裡按ct

Java 複製zip檔案到指定目錄並解壓zip檔案

過程中使用apache的ant jar包 apache-ant-1.8.2.jar 示例程式碼如下： import org.apache.log4j.Logger; import java.io.File; import java.io.IOException;

java 解壓zip中文檔案出現錯誤

java 解壓zip中文檔案出現錯誤 java.lang.IllegalArgumentException: MALFORMED 解決這個錯誤需要 jdk 1.7及以上版本支援並在建立ZipFile 時指定中文字符集gbk ZipFile zipFile = new

PHP擴充套件類ZipArchive實現壓縮解壓Zip檔案和檔案打包下載

PHP ZipArchive 是PHP自帶的擴充套件類，可以輕鬆實現ZIP檔案的壓縮和解壓，使用前首先要確保PHP ZIP 擴充套件已經開啟，具體開啟方法就不說了，不同的平臺開啟PHP擴增的方法網上都有，如有疑問歡迎交流。這裡整理一下常用的示例供參考。一、解壓縮zip檔案

java解壓zip、rar（多級檔案）

/** * 解壓上傳檔案 * @param importZipFilePath * 上傳檔案地址 * @param importFilePath * 解壓檔案存放地址 * @param cancel

Java 解壓zip壓縮包

ice gin inpu ret zipentry .get get next exce 因為最近項目需要批量上傳文件，而這裏的批量就是將文件壓縮在了一個zip包裏，然後讀取文件進行解析文件裏的內容。因此需要先對上傳的zip包進行解壓。以下直接提供代碼供參考： 1.第一個

java解壓zip文件至指定文件夾

ava tel exceptio 失敗 ppr mark roc types EDA 前面，筆者講到。如何把文件打包為zip包，那麽反過來怎麽把zip文件包解壓為正常文件呢？把zip包解壓為正常文件包，要比把文件打包為zip簡單一點。因為存在多級文件的壓縮，卻不存在多級文件

Java解壓縮zip檔案工具類(支援zip資料夾下多級目錄結構)

文章目錄 Java解壓縮zip檔案工具類(支援zip資料夾下多級目錄結構) 1. 前言 2. 正文 2.1 解壓縮後文件目錄結構展示 2.2 注意事項 2.3 異常

Cygwin踩坑記錄（三）-tar命令解壓.zip檔案提示“gzip: stdin has more than one entry--rest ignored”

當我從Activiti6.0 GitHub上下載下來.zip的原始碼的時候，打算用tar命令解壓檔案結果報錯提示：造成錯誤的原因是因為tar的底層間接呼叫了gzip，而gzip的使用是有限

.net 解壓zip檔案

1.DotNetLib /// <summary> /// 解壓功能(解壓壓縮檔案到指定目錄) 壓縮檔案中可包含任意格式檔案 /// </summary> /// <param name="

Linux中解壓zip檔案

先安裝unzip（命令安裝方式） [[email protected] ~]# yum install unzip 中間出現一次選擇現在就可以使用了解壓命令： unzip 檔名 zip -d myfile.zip smart.txt 刪除壓縮檔案

ubuntu解壓zip檔案出現許可權問題

在ubuntu中解壓zip檔案時，解壓出的csv檔案帶上了鎖和叉號，使得普通使用者無法進行讀取。解決辦法： cd到解壓出來的檔案目錄下。執行： sudo chmod u+rw train.c

使用 ZLib 壓縮/解壓 ZIP 檔案

實際應用中有時候會遇到需要處理 ZIP 壓縮解壓的情況，這時候我們有大概三種選擇：呼叫 rar.exe, unzip.exe 等使用某現成庫完全手寫第一種雖然能完成任務，但是沒法知曉結果。曾經有人對說，可以抓命令列輸出結果來判斷……這種依靠介面文字來進行精確判斷的行為個人認為相當不靠

Mac 解壓zip檔案錯誤：無法將"*.zip"解壓縮到"" （錯誤 1-操作不被允許）

錯誤提示：無法將"*.zip"解壓縮到"" （錯誤 1-操作不被允許）或者解壓縮失敗英文提示： "Unable to unarchive into file path" (Error 1 - Operation not permitted.) o

scala和java解壓zip的檔案，並上傳到hdfs伺服器

相關推薦