java中如何從字串中刪選中文字元（GBK編碼和UTF-8編碼）

阿新 • • 發佈：2019-02-18

1.GBK編碼中文佔兩個位元組，英文佔一個位元組。下面進行一個小的程式的測試：

<span style="font-size:24px;">import java.io.UnsupportedEncodingException;


public class TestMain{
	
	public static void main(String[] args) throws UnsupportedEncodingException
	{
		String str = "a二bcde";
		byte[] by = str.getBytes("GBK");
		System.out.print(by.length);
		
		for(byte b: by)
			System.out.print(b+"$$$");
	}
}</span>

輸出為：797$$$-74$$$-2$$$98$$$99$$$100$$$101$$$

這裡我們注意上面字串中的中文字元被轉換為兩個byte，輸出是都為負數

所以我們可以用byte[i] < 0判斷是否為中文字元，如果是GBK編碼那麼，只要找到第一個byte[i]小於零的位置，連續連個位置即為中文字元。

2.UTF-8編碼中文佔三個位元組，英文佔兩個位元組。下面進行一小段程式的測試：

import java.io.UnsupportedEncodingException;


public class TestMain{
	
	public static void main(String[] args) throws UnsupportedEncodingException
	{
		String str = "a我bcde";
		byte[] by = str.getBytes("UTF-8");
		System.out.print(by.length);
		
		for(byte b: by)
			System.out.print(b+"$$$");
	}
}

輸出為：897$$$-26$$$-120$$$-111$$$98$$$99$$$100$$$101$$$故我們可以從第一個byte[i] < 0的位置連續取3個位元組，然後轉化為字串即是我們想要的中文字元

java中如何從字串中刪選中文字元（GBK編碼和UTF-8編碼）

1.GBK編碼中文佔兩個位元組，英文佔一個位元組。下面進行一個小的程式的測試： <span style="font-size:24px;">import java.io.Unsupport

Python中的Unicode編碼和UTF-8編碼

2個傳輸硬盤中文字符結合 2.7 客戶端有一點來看下午看廖雪峰的Python2.7教程，看到字符串和編碼一節，有一點感受，結合崔慶才的Python博客，把這種感受記錄下來： ASCII碼：是用一個字節（8bit， 0-255）中的127個字母表示大

《Java》Java“字串操作”實際應用——形成GBK編碼和UTF-8編碼的文字檔案，通過其二進位制資料觀察兩種編碼的不同

一、任務目標完成一個java application應用程式，可以把GBK編碼的漢字字串與UTF-8編碼的漢字字串相互轉換。並配合寫檔案操作形成不同編碼格式的文字檔案，可以通過其二進位制資料觀察兩種編碼的不同。二、程式設計思路博主將“程式設計思路”以流程

Java如何從字串中提取數字

在使用java程式設計處理字串時，常常需要獲取字串中的數字，來進行進一步的計算。接下來介紹幾種從字串中提取數字的方法。（1）正則表示式這裡正則表示式表示匹配除數字以外的字元，然後r

python中的字符串編碼問題——2.理解ASCII碼、ANSI碼、Unicode編碼、UTF-8編碼

unicode編碼統一 col 簡單 utf 文字 stand 二進制 pan ASCII碼：全名是American Standard Code for Information Interchange，ASCII碼中，一個英文字母（不分大小寫）占一個字節的空間，範圍0x0

Html表單提交到Servlet輸出到頁面亂碼 Html使用的編碼是UTF-8編碼顯示頁面，之後使用form表單提交欄位到Servlet中，Servlet將利用getParamer方法獲得fo

Html使用的編碼是UTF-8編碼顯示頁面，之後使用form表單提交欄位到Servlet中，Servlet將利用getParamer方法獲得form提交的欄位，之後通過Respone中的writer將獲取到的前臺欄位反饋到前臺中去，出現中午亂碼錯誤，這是因為添加了這個欄位。 response.setCon

讀取xml格式utf-8編碼和utf-8 無bom編碼格式,出現前言中不允許有內容的問題

1,java 讀取 xml utf-8 編碼格式的檔案,出現 Caused by: org.xml.sax.SAXParseException; lineNumber: 1; columnNumber: 1; 前言中不允許有內容。出現這樣的原因, 是因為讀取檔案

VMware中CentOS配置靜態IP進行網路訪問（NAT方式和橋接模式）

首先進行NAT聯網方式的配置一、檢視宿主主機的ip，主要檢視宿主主機的VMnet8的ipv4地址、子網掩碼等 1、例如，本機的VMnet8的ipv4地址為：ipv4—192.168.159.1，子網掩碼為255.255.255.0 2、開啟虛擬網路編輯器

JAVA多執行緒wait與notify詳細解析（由生產者和消費者案例引出）

生產者和消費者這個關係是個經典的多執行緒案例。現在我們編寫一個Demo來模擬生產者和消費者之間的關係。假如有兩個類，一個是資料生產者類DataProvider，另一個是資料消費者類DataConsumer，這兩個類同時對資料類Data進行操作，生產者類負責生產資料，消費者類負責消費資料，下面是

java 從字串中以單個或多個空格進行分隔提取字串

String str = "test test1 test2 test3"; String [] arr = str.split("\\s+"); for(String ss : arr){

java 從字串中提取省、市、區、鎮、鄉等區域名稱（包含少數民族地區）

近期寫的一個專案，需要從IOS和Android傳來的一個字串提取省、市、區等區域名稱，於是就整理了一個工具類，程式碼如下： import java.util.ArrayList; import java.util.LinkedHashMap; import java.u

java實現:查詢字串中最長迴文子串 ---- leetCode notes

Given a string s, find the longest palindromic substring in s. You may assume that the maximum len

java從字串中提取數字的簡單例項

1 String類提供的方法: ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 package 測試練習; import Java.util.*

從0到1導出Linux下的MySQL中含有中文數據的文件（not complete）

MySQL Linux 註明版本號：這是剛安裝完MySQL的時候的樣子：首先解決secure_file_priv的問題：由於文件是只讀的，所以只能在root模式下來改。使用vi命令編輯mysqld.cnf：在文件結尾加上這一行，保存並退出。現在再看看：未完待續。參考鏈接：1.mysql命令之二：查看m

java中判斷字串中漢字的個數

使用方法3與方法4時需要注意一些問題，程式碼中會有註釋。程式碼如下： package 包名; import java.util.ArrayList; import java.util.regex.Matcher; import java.util.regex.Pattern; publ

從字串中分離檔案路徑檔名及拓展

實現效果：關鍵知識：（用到了string物件的Substring() LastIndexOf() ）實現程式碼： 1 private void button1_Click(objec

利用strrchr函式從字串中分離字元

比如在用FIFO寫單伺服器多使用者的程式中，要分離出使用者請求行中的路徑，可以用strrchr函式。 #include <string.h> 函式原型：extern char * strrchr (const char *s, int c) 引數說明：s為一個字串的指標,c為

java中判斷字串中郵箱的個數

使用到：郵箱的正則表示式，列表的部分知識，Matcher方法 package 包名; import java.util.ArrayList; import java.util.regex.Matcher; import java.util.regex.Pattern; public cla

從字串中取出使用者名稱密碼存入HashMap中

package com.hwadee.test; import java.util.HashMap; import java.util.Iterator; import java.util.Set; import java.util.regex.Matcher; import java

Java基礎-----從Excel中獲取資料生成shell指令碼

前言 java讀取Excel的驅動包：連結：https://pan.baidu.com/s/1ejCR9sS2OUmttFYpQnJkKQ 提取碼：58rm 實現1：從Excel中讀取表名，由於每個欄位會對應一個表名，故讀取的某列會有若干個連續的表名出現，所以用set集合

java中如何從字串中刪選中文字元（GBK編碼和UTF-8編碼）

相關推薦