1. 程式人生 > >C++ string CString 詳解

C++ string CString 詳解

C++ string 詳解

前言: string 的角色 1 string 使用 1.1 充分使用string 操作符 1.2 眼花繚亂的string find 函式 1.3 string insert, replace, erase 2 string 和 C風格字串 3 string 和 Charactor Traits 4 string 建議 5 小結 6 附錄前言: string 的角色C++ 語言是個十分優秀的語言,但優秀並不表示完美。還是有許多人不願意使用C或者C++,為什麼?原因眾多,其中之一就是C/C++的文字處理功能太麻煩,用起來很不方便。以前沒有接觸過其他語言時,每當別人這麼說,我總是不屑一顧,認為他們根本就沒有領會C++的精華,或者不太懂C++,現在我接觸perl, php, 和Shell指令碼以後,開始理解了以前為什麼有人說C++文字處理不方便了。

舉例來說,如果文字格式是:使用者名稱 電話號碼,檔名name.txt Tom 23245332Jenny 22231231Heny 22183942Tom 23245332...現在我們需要對使用者名稱排序,且只輸出不同的姓名。那麼在shell 程式設計中,可以這樣用: awk '{print $1}' name.txt | sort | uniq簡單吧?如果使用C/C++ 就麻煩了,他需要做以下工作: 先開啟檔案,檢測檔案是否開啟,如果失敗,則退出。 宣告一個足夠大得二維字元陣列或者一個字元指標陣列 讀入一行到字元空間 然後分析一行的結構,找到空格,存入字元陣列中。 關閉檔案 寫一個排序函式,或者使用寫一個比較函式,使用qsort排序
遍歷陣列,比較是否有相同的,如果有,則要刪除,copy... 輸出資訊你可以用C++或者C語言去實現這個流程。如果一個人的主要工作就是處理這種類似的文字(例如做apache的日誌統計和分析),你說他會喜歡C/C++麼?當然,有了STL,這些處理會得到很大的簡化。我們可以使用 fstream來代替麻煩的fopen fread fclose, 用vector 來代替陣列。最重要的是用 string來代替char * 陣列,使用sort排序演算法來排序,用unique 函式來去重。聽起來好像很不錯 。看看下面程式碼(例程1): #i nclude <string>#i nclude <iostream>
#i nclude <algorithm>#i nclude <vector>#i nclude <fstream>using namespace std;int main(){ ifstream in("name.txt"); string strtmp; vector<string> vect; while(getline(in, strtmp, '/n')) vect.push_back(strtmp.substr(0, strtmp.find(' '))); sort(vect.begin(), vect.end()); vector<string>::iterator it=unique(vect.begin(), vect.end()); copy(vect.begin(), it, ostream_iterator<string>(cout, "/n")); return 0;}也還不錯吧,至少會比想象得要簡單得多!(程式碼裡面沒有對錯誤進行處理,只是為了說明問題,不要效仿).當然,在這個文字格式中,不用vector而使用map會更有擴充性,例如,還可通過人名找電話號碼等等,但是使用了map就不那麼好用sort了。你可以用map試一試。這裡string的作用不只是可以儲存字串,還可以提供字串的比較,查詢等。在sort和unique函式中就預設使用了less 和equal_to函式, 上面的一段程式碼,其實使用了string的以下功能: 儲存功能,在getline() 函式中 查詢功能,在find() 函式中 子串功能,在substr() 函式中 string operator < , 預設在sort() 函式中呼叫 string operator == , 預設在unique() 函式中呼叫總之,有了string 後,C++的字元文字處理功能總算得到了一定補充,加上配合STL其他容器使用,其在文字處理上的功能已經與perl, shell, php的距離縮小很多了。 因此掌握string 會讓你的工作事半功倍。1 string 使用其實,string並不是一個單獨的容器,只是basic_string 模板類的一個typedef 而已,相對應的還有wstring, 你在string 標頭檔案中你會發現下面的程式碼:extern "C++" { typedef basic_string <char> string; typedef basic_string <wchar_t> wstring;} // extern "C++"由於只是解釋string的用法,如果沒有特殊的說明,本文並不區分string 和 basic_string的區別。string 其實相當於一個儲存字元的序列容器,因此除了有字串的一些常用操作以外,還有包含了所有的序列容器的操作。字串的常用操作包括:增加、刪除、修改、查詢比較、連結、輸入、輸出等。詳細函式列表參看附錄。不要害怕這麼多函式,其實有許多是序列容器帶有的,平時不一定用的上。如果你要想了解所有函式的詳細用法,你需要檢視basic_string,或者下載STL程式設計手冊。這裡通過例項介紹一些常用函式。 1.1 充分使用string 操作符string 過載了許多操作符,包括 +, +=, <, =, , [], <<, >>等,正式這些操作符,對字串操作非常方便。先看看下面這個例子:tt.cpp(例程2)#i nclude <string>#i nclude <iostream>using namespace std;int main(){ string strinfo="Please input your name:"; cout << strinfo ; cin >> strinfo; if( strinfo == "winter" ) cout << "you are winter!"<<endl; else if( strinfo != "wende" ) cout << "you are not wende!"<<endl; else if( strinfo < "winter") cout << "your name should be ahead of winter"<<endl; else cout << "your name should be after of winter"<<endl; strinfo += " , Welcome to China!"; cout << strinfo<<endl; cout <<"Your name is :"<<endl; string strtmp = "How are you? " + strinfo; for(int i = 0 ; i < strtmp.size(); i ++) cout<<strtmp[i]; return 0;} 下面是程式的輸出 -bash-2.05b$ make ttc++ -O -pipe -march=pentiumpro tt.cpp -o tt-bash-2.05b$ ./ttPlease input your name:Heroyou are not wende!Hero , Welcome to China!How are you? Hero , Welcome to China!有了這些操作符,在STL中仿函式都可以直接使用string作為引數,例如 less, great, equal_to 等,因此在把string作為引數傳遞的時候,它的使用和int 或者float等已經沒有什麼區別了。例如,你可以使用: map<string, int> mymap;//以上預設使用了 less<string>有了 operator + 以後,你可以直接連加,例如:string strinfo="Winter";string strlast="Hello " + strinfo + "!";//你還可以這樣:string strtest="Hello " + strinfo + " Welcome" + " to China" + " !";看見其中的特點了嗎?只要你的等式裡面有一個 string 物件,你就可以一直連續"+",但有一點需要保證的是,在開始的兩項中,必須有一項是 string 物件。其原理很簡單:系統遇到"+"號,發現有一項是string 物件。 系統把另一項轉化為一個臨時 string 物件。 執行 operator + 操作,返回新的臨時string 物件。 如果又發現"+"號,繼續第一步操作。由於這個等式是由左到右開始檢測執行,如果開始兩項都是const char* ,程式自己並沒有定義兩個const char* 的加法,編譯的時候肯定就有問題了。有了操作符以後,assign(), append(), compare(), at()等函式,除非有一些特殊的需求時,一般是用不上。當然at()函式還有一個功能,那就是檢查下標是否合法,如果是使用: string str="winter";//下面一行有可能會引起程式中斷錯誤str[100]='!';//下面會丟擲異常:throws: out_of_rangecout<<str.at(100)<<endl;瞭解了嗎?如果你希望效率高,還是使用[]來訪問,如果你希望穩定性好,最好使用at()來訪問。1.2 眼花繚亂的string find 函式由於查詢是使用最為頻繁的功能之一,string 提供了非常豐富的查詢函式。其列表如下: 函式名 描述 find 查詢 rfind 反向查詢 find_first_of 查詢包含子串中的任何字元,返回第一個位置 find_first_not_of 查詢不包含子串中的任何字元,返回第一個位置 find_last_of 查詢包含子串中的任何字元,返回最後一個位置 find_last_not_of 查詢不包含子串中的任何字元,返回最後一個位置 以上函式都是被過載了4次,以下是以find_first_of 函式為例說明他們的引數,其他函式和其引數一樣,也就是說總共有24個函式 :size_type find_first_of(const basic_string& s, size_type pos = 0)size_type find_first_of(const charT* s, size_type pos, size_type n)size_type find_first_of(const charT* s, size_type pos = 0)size_type find_first_of(charT c, size_type pos = 0)所有的查詢函式都返回一個size_type型別,這個返回值一般都是所找到字串的位置,如果沒有找到,則返回string::npos。有一點需要特別注意,所有和string::npos的比較一定要用string::size_type來使用,不要直接使用int 或者unsigned int等型別。其實string::npos表示的是-1, 看看標頭檔案:template <class _CharT, class _Traits, class _Alloc> const basic_string<_CharT,_Traits,_Alloc>::size_type basic_string<_CharT,_Traits,_Alloc>::npos = basic_string<_CharT,_Traits,_Alloc>::size_type) -1;find 和 rfind 都還比較容易理解,一個是正向匹配,一個是逆向匹配,後面的引數pos都是用來指定起始查詢位置。對於find_first_of 和find_last_of 就不是那麼好理解。find_first_of 是給定一個要查詢的字符集,找到這個字符集中任何一個字元所在字串中第一個位置。或許看一個例子更容易明白。有這樣一個需求:過濾一行開頭和結尾的所有非英文字元。看看用string 如何實現: #i nclude <string>#i nclude <iostream>using namespace std;int main(){ string strinfo=" //*---Hello Word!......------"; string strset="ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz"; int first = strinfo.find_first_of(strset); if(first == string::npos) { cout<<"not find any characters"<<endl; return -1; } int last = strinfo.find_last_of(strset); if(last == string::npos) { cout<<"not find any characters"<<endl; return -1; } cout << strinfo.substr(first, last - first + 1)<<endl; return 0;} 這裡把所有的英文字母大小寫作為了需要查詢的字符集,先查詢第一個英文字母的位置,然後查詢最後一個英文字母的位置,然後用substr 來的到中間的一部分,用於輸出結果。下面就是其結果:Hello Word前面的符號和後面的符號都沒有了。像這種用法可以用來查詢分隔符,從而把一個連續的字串分割成為幾部分,達到 shell 命令中的 awk 的用法。特別是當分隔符有多個的時候,可以一次指定。例如有這樣的需求:張三|3456123, 湖南李四,4564234| 湖北王小二, 4433253|北京...我們需要以 "|" ","為分隔符,同時又要過濾空格,把每行分成相應的欄位。可以作為你的一個家庭作業來試試,要求程式碼簡潔。 1.3 string insert, replace, erase 瞭解了string 的操作符,查詢函式和substr,其實就已經瞭解了string的80%的操作了。insert函式, replace函式和erase函式在使用起來相對簡單。下面以一個例子來說明其應用。 string只是提供了按照位置和區間的replace函式,而不能用一個string字串來替換指定string中的另一個字串。這裡寫一個函式來實現這個功能:void string_replace(string & strBig, const string & strsrc, const string &strdst) { string::size_type pos=0; string::size_type srclen=strsrc.size(); string::size_type dstlen=strdst.size(); while( (pos=strBig.find(strsrc, pos)) != string::npos){ strBig.replace(pos, srclen, strdst); pos += dstlen; }}看看如何呼叫: #i nclude <string>#i nclude <iostream>using namespace std;int main() { string strinfo="This is Winter, Winter is a programmer. Do you know Winter?"; cout<<"Orign string is :/n"<<strinfo<<endl; string_replace(strinfo, "Winter", "wende"); cout<<"After replace Winter with wende, the string is :/n"<<strinfo<<endl; return 0;}其輸出結果: Orign string is :This is Winter, Winter is a programmer. Do you know Winter?After replace Winter with wende, the string is :This is wende, wende is a programmer. Do you know wende?如果不用replace函式,則可以使用erase和insert來替換,也能實現string_replace函式的功能: void string_replace(string & strBig, const string & strsrc, const string &strdst) { string::size_type pos=0; string::size_type srclen=strsrc.size(); string::size_type dstlen=strdst.size(); while( (pos=strBig.find(strsrc, pos)) != string::npos){ strBig.erase(pos, srclen); strBig.insert(pos, strdst); pos += dstlen; }}當然,這種方法沒有使用replace來得直接。 2 string 和 C風格字串 現在看了這麼多例子,發現const char* 可以和string 直接轉換,例如我們在上面的例子中,使用 string_replace(strinfo, "Winter", "wende");來代用 void string_replace(string & strBig, const string & strsrc, const string &strdst) 在C語言中只有char* 和 const char*,為了使用起來方便,string提供了三個函式滿足其要求: const charT* c_str() const const charT* data() const size_type copy(charT* buf, size_type n, size_type pos = 0) const 其中: c_str 直接返回一個以/0結尾的字串。 data 直接以陣列方式返回string的內容,其大小為size()的返回值,結尾並沒有/0字元。 copy 把string的內容拷貝到buf空間中。 你或許會問,c_str()的功能包含data(),那還需要data()函式幹什麼?看看原始碼: const charT* c_str () const{ if (length () == 0) return ""; terminate (); return data (); }原來c_str()的流程是:先呼叫terminate(),然後在返回data()。因此如果你對效率要求比較高,而且你的處理又不一定需要以/0的方式結束,你最好選擇data()。但是對於一般的C函式中,需要以const char*為輸入引數,你就要使用c_str()函式。 對於c_str() data()函式,返回的陣列都是由string本身擁有,千萬不可修改其內容。其原因是許多string實現的時候採用了引用機制,也就是說,有可能幾個string使用同一個字元儲存空間。而且你不能使用sizeof(string)來檢視其大小。詳細的解釋和實現檢視Effective STL的條款15:小心string實現的多樣性。另外在你的程式中,只在需要時才使用c_str()或者data()得到字串,每呼叫一次,下次再使用就會失效,如:string strinfo("this is Winter");...//最好的方式是:foo(strinfo.c_str());//也可以這麼用:const char* pstr=strinfo.c_str();foo(pstr);//不要再使用了pstr了, 下面的操作已經使pstr無效了。strinfo += " Hello!";foo(pstr);//錯誤!會遇到什麼錯誤?當你幸運的時候pstr可能只是指向"this is Winter Hello!"的字串,如果不幸運,就會導致程式出現其他問題,總會有一些不可遇見的錯誤。總之不會是你預期的那個結果。3 string 和 Charactor Traits 瞭解了string的用法,該詳細看看string的真相了。前面提到string 只是basic_string的一個typedef。看看basic_string 的引數: template <class charT, class traits = char_traits<charT>,class Allocator = allocator<charT> >class basic_string{ //...}char_traits不僅是在basic_string 中有用,在basic_istream 和 basic_ostream中也需要用到。 就像Steve Donovan在過度使用C++模板中提到的,這些確實有些過頭了,要不是系統自己定義了相關的一些屬性,而且用了個typedef,否則還真不知道如何使用。但複雜總有複雜道理。有了char_traits,你可以定義自己的字串型別。當然,有了char_traits < char > 和char_traits < wchar_t > 你的需求使用已經足夠了,為了更好的理解string ,咱們來看看char_traits都有哪些要求。如果你希望使用你自己定義的字元,你必須定義包含下列成員的結構: 表示式 描述 char_type 字元型別 int_type int 型別 pos_type 位置型別 off_type 表示位置之間距離的型別 state_type 表示狀態的型別 assign(c1,c2) 把字元c2賦值給c1 eq(c1,c2) 判斷c1,c2 是否相等 lt(c1,c2) 判斷c1是否小於c2 length(str) 判斷str的長度 compare(s1,s2,n) 比較s1和s2的前n個字元 copy(s1,s2, n) 把s2的前n個字元拷貝到s1中 move(s1,s2, n) 把s2中的前n個字元移動到s1中 assign(s,n,c) 把s中的前n個字元賦值為c find(s,n,c) 在s的前n個字元內查詢c eof() 返回end-of-file to_int_type(c) 將c轉換成int_type to_char_type(i) 將i轉換成char_type not_eof(i) 判斷i是否為EOF eq_int_type(i1,i2) 判斷i1和i2是否相等 想看看實際的例子,你可以看看sgi STL的char_traits結構原始碼.現在預設的string版本中,並不支援忽略大小寫的比較函式和查詢函式,如果你想練練手,你可以試試改寫一個char_traits , 然後生成一個case_string類, 也可以在string 上做繼承,然後派生一個新的類,例如:ext_string,提供一些常用的功能,例如:定義分隔符。給定分隔符,把string分為幾個欄位。 提供替換功能。例如,用winter, 替換字串中的wende 大小寫處理。例如,忽略大小寫比較,轉換等 整形轉換。例如把"123"字串轉換為123數字。 這些都是常用的功能,如果你有興趣可以試試。其實有人已經實現了,看看Extended STL string。如果你想偷懶,下載一個頭檔案就可以用,有了它確實方便了很多。要是有人能提供一個支援正則表示式的string,我會非常樂意用。4 string 建議 使用string 的方便性就不用再說了,這裡要重點強調的是string的安全性。 string並不是萬能的,如果你在一個大工程中需要頻繁處理字串,而且有可能是多執行緒,那麼你一定要慎重(當然,在多執行緒下你使用任何STL容器都要慎重)。 string的實現和效率並不一定是你想象的那樣,如果你對大量的字串操作,而且特別關心其效率,那麼你有兩個選擇,首先,你可以看看你使用的STL版本中string實現的原始碼;另一選擇是你自己寫一個只提供你需要的功能的類。 string的c_str()函式是用來得到C語言風格的字串,其返回的指標不能修改其空間。而且在下一次使用時重新呼叫獲得新的指標。 string的data()函式返回的字串指標不會以'/0'結束,千萬不可忽視。 儘量去使用操作符,這樣可以讓程式更加易懂(特別是那些指令碼程式設計師也可以看懂) 5 小結 難怪有人說:string 使用方便功能強,我們一直用它!6 附錄 string 函式列表 函式名 描述 begin 得到指向字串開頭的Iterator end 得到指向字串結尾的Iterator rbegin 得到指向反向字串開頭的Iterator rend 得到指向反向字串結尾的Iterator size 得到字串的大小 length 和size函式功能相同 max_size 字串可能的最大大小 capacity 在不重新分配記憶體的情況下,字串可能的大小 empty 判斷是否為空 operator[] 取第幾個元素,相當於陣列 c_str 取得C風格的const char* 字串 data 取得字串內容地址 operator= 賦值操作符 reserve 預留空間 swap 交換函式 insert 插入字元 append 追加字元 push_back 追加字元 operator+= += 操作符 erase 刪除字串 clear 清空字元容器中所有內容 resize 重新分配空間 assign 和賦值操作符一樣 replace 替代 copy 字串到空間 find 查詢 rfind 反向查詢 find_first_of 查詢包含子串中的任何字元,返回第一個位置 find_first_not_of 查詢不包含子串中的任何字元,返回第一個位置 find_last_of 查詢包含子串中的任何字元,返回最後一個位置 find_last_not_of 查詢不包含子串中的任何字元,返回最後一個位置 substr 得到字串 compare 比較字串 operator+ 字串連結 operator== 判斷是否相等 operator!= 判斷是否不等於 operator< 判斷是否小於 operator>> 從輸入流中讀入字串 operator<< 字串寫入輸出流 getline 從輸入流中讀入一行 CString,int,string,char*之間的轉換2007年01月06日 星期六 11:11 A.M.string 轉 CString CString.format("%s", string.c_str()); char 轉 CString CString.format("%s", char*); char 轉 string string s(char *); string 轉 char * char *p = string.c_str(); CString 轉 string string s(CString.GetBuffer()); 1,string -> CString CString.format("%s", string.c_str()); 用c_str()確實比data()要好. 2,char -> string string s(char *); 你的只能初始化,在不是初始化的地方最好還是用assign(). 3,CString -> string string s(CString.GetBuffer()); GetBuffer()後一定要ReleaseBuffer(),否則就沒有釋放緩衝區所佔的空間. 《C++標準函式庫》中說的 有三個函式可以將字串的內容轉換為字元陣列和C—string 1.data(),返回沒有”/0“的字串陣列 2,c_str(),返回有”/0“的字串陣列 3,copy() --------------------------------------------------------------- CString與int、char*、char[100]之間的轉換- - CString與int、char*、char[100]之間的轉換- - CString互轉int 將字元轉換為整數,可以使用atoi、_atoi64或atol。 而將數字轉換為CString變數,可以使用CString的Format函式。如 CString s; int i = 64; s.Format("%d", i) Format函式的功能很強,值得你研究一下。 void CStrDlg::OnButton1() { // TODO: Add your control notification handler code here CString ss="1212.12"; int temp=atoi(ss); CString aa; aa.Format("%d",temp); AfxMessageBox("var is " + aa); } sart.Format("%s",buf); CString互轉char* ///char * TO cstring CString strtest; char * charpoint; charpoint="give string a value"; strtest=charpoint; ///cstring TO char * charpoint=strtest.GetBuffer(strtest.GetLength()); 標準C裡沒有string,char *==char []==string 可以用CString.Format("%s",char *)這個方法來將char *轉成CString。要把CString轉成char *,用操作符(LPCSTR)CString就可以了。 CString轉換 char[100] char a[100]; CString str("aaaaaa"); strncpy(a,(LPCTSTR)str,sizeof(a)); /////////////////////////////////////////////////////////////// //string 轉換為 char 型 char* str = strdup ( SendData.strSql.c_str() ); cout << str << endl; char 轉換為 string 型 char* str = "char 轉換為 string 型"; SendData.strSql = str;//SendData.strSql 為std::string型