寫出MapReduce程序完成以下功能

阿新 • • 發佈：2017-07-26

oid exce 目標 app list con pan public word

寫出MapReduce程序完成以下功能.

input1：

2012-3-1 a
2012-3-2 b
2012-3-3 c
2012-3-4 d
2012-3-5 a
2012-3-6 b
2012-3-7 c
2012-3-3 c

input2：

2012-3-1 b
2012-3-2 a
2012-3-3 b
2012-3-4 d
2012-3-5 a
2012-3-6 c
2012-3-7 d
2012-3-3 c

目標操作實現結果：

2012年3月3日 c
2012年3月7日 c
2012年3月6日 b
2012年3月5日 a
2012年3月4日 d
2012年3月3日 c
2012年3月2日 b
2012年3月1日 a
2012年3月3日 c
2012年3月7日 d
2012年3月6日 c
2012年3月5日 a
2012年3月4日 d
2012年3月3日 b
2012年3月2日 a
2012年3月1日 b

代碼如下（由於水平有限，不保證完全正確，如果發現錯誤歡迎指正）：

package one;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

 
public class TestYear {
    public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {
        Configuration config = new  Configuration();
        config.set("fs.defaultFS", "hdfs://192.168.0.100:9000");
        config.set("yarn.resourcemanager.hostname", "192.168.0.100 
");
        
        FileSystem fs = FileSystem.get(config);
        
        Job job = Job.getInstance(config);
        
        job.setJarByClass(TestYear.class);
        
        //設置所用到的map類
        job.setMapperClass(myMapper.class);
        job.setMapOutputKeyClass(NullWritable.class);
        job.setMapOutputValueClass(Text.class);
        
        //設置用到的reducer類
        job.setReducerClass(myReducer.class);
        job.setOutputKeyClass(NullWritable.class);
        job.setOutputValueClass(Text.class);
        
        //設置輸出地址
        FileInputFormat.addInputPath(job, new Path("/zhoukao3/"));
        
        Path path = new Path("/output1/");
        
        if(fs.exists(path)){
            fs.delete(path, true);
        }
        
        //指定文件的輸出地址
        FileOutputFormat.setOutputPath(job, path);
        
        //啟動處理任務job
        boolean completion = job.waitForCompletion(true);
        if(completion){
            System.out.println("Job Success!");
        }
    }
    
    public static class myMapper extends Mapper<LongWritable, Text, NullWritable , Text>{

        @Override
        protected void map(LongWritable key, Text value, Context context)throws IOException, InterruptedException {
            String values=value.toString();
            String words[]=values.split("[-]| ");//2012,3,1,a
            String s=words[0]+"年"+words[1]+"月"+words[2]+"日"+"  "+words[3];
            context.write(NullWritable.get(),new Text(s));
        }
    }
    
    public static class myReducer extends Reducer<NullWritable , Text,NullWritable , Text>{

        @Override
        protected void reduce(NullWritable key, Iterable<Text> values,Context context)throws IOException, InterruptedException {
            for (Text value  : values) {
                context.write(key, value);
            }
        }
        
    }
}

小結：把value-list作為map的value輸出，這樣就不會排序和去重，然後reduce再去接收並且context.write()出來，需要註意的是-號是特殊字符，需要做分割處理，所以可以加上\\或者[ ]，註意點這些小細節就能完成最終的效果。

寫出MapReduce程序完成以下功能

oid exce 目標 app list con pan public word 寫出MapReduce程序完成以下功能. input1： 2012-3-1 a 2012-3-2 b 2012-3-3 c 2012-3-4 d 2012-3-5 a 2012-3-6 b

寫一個函數完成三次登陸功能，再寫一個函數完成註冊功能

三次 ret div name use == home brush while def register(): while 1: username = input(‘輸入用戶名:‘) passwd = input(‘輸入密碼:‘)

Hadoop_21_編寫MapReduce程序實現Join功能

持久化 tle 格式 AD style tro 消息 clas HA 1.序列化與Writable接口 1.1.hadoop的序列化格式　　序列化和反序列化就是結構化對象和字節流之間的轉換，主要用在內部進程的通訊和持久化存儲方面　　hadoop在節點間的內部通訊使用的是

如何在python專案中寫出像Django中一樣功能的settings

一核心檔案目錄結構二實現程式碼 resdme: 　　在實現此功能主要用到的知識點及模組: 　　1.反射　　2.importlib模組　　3.內建方法dir # 全域性配置 name = 'personal' 全域性配置

如何在python項目中寫出像Django中一樣功能的settings

文件目錄 config 存在 alt elf 功能 int 顯示 att 一核心文件目錄結構二實現代碼 resdme: 　　在實現此功能主要用到的知識點及模塊: 　　1.反射　　3.內置方法dir # 全局配置 NAME = ‘roo

如何寫出安全的、基本功能完善的Bash指令碼

每個人或多或少總會碰到要使用並且自己完成編寫一個最基礎的Bash指令碼的情況。真實情況是，沒有人會說“哇哦，我喜歡寫這些指令碼”。所以這也是為什麼很少有人在寫的時候專注在這些指令碼上。我本身也不是一個Bash指令碼專家，但是我會在本文中跟你展示一個最基礎最簡單的安全指令碼模板，會讓你寫的Bash指令碼更加

小程序初體驗：手把手教你寫出第一個小程序（一）

輸入框個人創建公測快速 nsh 成功 too 調用本文筆者將根據quick start中的範例代碼，帶大家簡單地剖析一下小程序的運行方式，並介紹小程序開發中一些通用的特性，帶著大家一步步寫出自己的小程序。適用對象：前端初學者，對小程序開發感興趣者 tip

設計四個線程，當中共兩個線程每次對j添加1，另外兩個線程每次對j降低1。循環100次，寫出程序。

public read 設計 test6 ng- -m popu div for package cn.usst.DataTest6; /** * 設計四個線程，當中共兩個線程每次對j添加1，另外兩個線程每次對j降低1。循環100次，寫出程序。 * @ * *

菜鳥，程序員，大師，神人四個等級寫出代碼的區別.

python 程序 lte and odin mat env math odi # !/usr/bin/env python# -*- coding: utf-8 -*-# 據說係菜鳥，程序員，大師，神人四個等級寫出代碼的區別...import math as m#for

Python開發學習寫出第一個Python程序

Python編程語言 Python開發學習目標：了解Python，了解Python的特征，了解Python的應用，掌握Linux下Python開發環境的搭建，理解Windows下Python環境搭建，寫出第一個Python程序。什麽是Python 一種解釋型的、面向對象的、帶有動態語義

4年前的隨筆---寫出高質量程序的要點

找到 post 規範 ++ 總量 word popu 清晰之前從1990年開始敲代碼。到如今已經快20年了。總結出寫出高質量程序的幾個要點: - 1、開始寫之前思路越清晰完整越好。 - 2、寫的過程中代碼一定要規範一致，這種代碼便於維護和改動。這個規範一致性包括名稱

練習：寫一個腳本，完成以下任務

ech 相同寫一個腳本 src 腳本 blog 用戶添加 http user 練習：寫一個腳本，完成以下任務 1.添加5個用戶，user1，users，。。。user5 2.每個用戶的密碼和用戶名相同，並且要求，添加密碼完成後不顯示passwd命令的執行結果信息： 3.每

設計 4 個線程，其中兩個線程每次對 j 增加 1，另外兩個線程對 j 每次減少 1。寫出程序。

logs ati static run ride test ide err div 先設計一個類處理加減這一行為： public class ManyThread { private int j = 0; public synchronized

程序員面試京東前端，現場JavaScript代碼寫出魔方特效

java 進行微笑面試官 article 大局觀一份 html5 data 程序員面試京東前端，現場JS代碼寫出魔方特效，成功搞定20K月薪今天小編我逛論壇，看到了一位程序員小夥子，因為是有了兩年工作經驗，然後去京東面試前端崗，一面二面輕松就過了，到了技術面這一塊，

匯編語言——匯編程序從寫出到最終執行的過程

生成語言樣式 art masm 程序編譯 spa color assume 一個匯編語言程序從寫出到最終執行的簡要過程：編寫--〉編譯--〉連接--〉執行 1、編寫 notepad++選擇Assembly編寫程序，保存成xx.asm，樣式如下 assume c

實驗5.1（舊），寫出一個由一個主函數和三個小函數組成的程序，該程序可以從某一字符串中刪除指定字符。

using span ring font 修改 mes out 部分 nbsp 實驗目的：輸入一串字符，再輸入一個指定字符，將字符串中刪去指定字符再顯示出來。要求程序把輸入字符串、刪除指定字符和顯示字符串的功能分別在各自單獨的.cpp文件由外部函數來處理，主文件中

前端實戰：教你寫出簡單的側邊欄功能以及返回頂部特效

個人部落格網站文章地址：http://blog.mclink.xyz/index/article/index/id/33.html 前陣子博主忙著一些事情，有些時間沒更新了，幾天前有個側邊欄的需求，於是自己簡單用幾個框架簡單實現了一個。原理挺簡單的，在此記錄一下。先放效

IDEA 下寫出第一個 SSH 整合框架練手專案（二，整合SSH及登陸頁面的完成）

這是SSH 整合專案的第二章，第一章基於Meavn 整合 Spring 和 Hibernate 框架並進行了進行了自動建表，這一章則在此基礎上加入 Struts 2 框架以及完成一個簡單的登陸頁面。 1. 配置 Struts 2 選中 Project Struts

導致程序員寫出爛代碼的35個惡習，看看你染上了幾個？

ofo 測試的 ava -i ogr 拒絕 eclipse 四大堅持 IT行業的科技公司們一直苦苦追尋傳說中以一當十的超級程序員，最新的研究表明確實存在這樣一小撮效率奇高的“程序金剛”，但是一位普通程序猿如何能夠蛻變成代碼金剛呢？國內外的各大專家總結了導致程序猿效率低

IDEA 下寫出第一個 SSH 整合框架練手專案（四，部門和員工的增刪改查完成）

這是SSH 整合專案的第三章，第一章基於Meavn 整合 Spring 和 Hibernate 框架並進行了進行了自動建表，第二章則在此基礎上加入 Struts 2 框架以及完成一個簡單的登陸頁面。第三章主要側重於分頁查詢功能的實現，第四章則著重完善增刪改查程式碼，因為

寫出MapReduce程序完成以下功能

相關推薦