1. 程式人生 > >C++ string 用法詳解--原作者是Nicolai M.Josuttis

C++ string 用法詳解--原作者是Nicolai M.Josuttis

任何人對本文進行引用都要標明作者是Nicolai M.Josuttis

///////////////////////////////////////////////////////////////////////////////////

C++ 語言是個十分優秀的語言,但優秀並不表示完美。還是有許多人不願意使用C或者C++,為什麼?原因眾多,其中之一就是C/C++的文字處理功能太麻煩,用起來很不方便。以前沒有接觸過其他語言時,每當別人這麼說,我總是不屑一顧,認為他們根本就沒有領會C++的精華,或者不太懂C++,現在我接觸 perl, php, 和Shell指令碼以後,開始理解了以前為什麼有人說C++文字處理不方便了。

舉例來說,如果文字格式是:使用者名稱 電話號碼,檔名name.txt Tom 23245332 Jenny 22231231 Heny 22183942 Tom 23245332 …

現在我們需要對使用者名稱排序,且只輸出不同的姓名。

那麼在shell 程式設計中,可以這樣用:

awk '{print $1}' name.txt | sort | uniq

簡單吧?

如果使用C/C++ 就麻煩了,他需要做以下工作: 先開啟檔案,檢測檔案是否開啟,如果失敗,則退出。 宣告一個足夠大得二維字元陣列或者一個字元指標陣列 讀入一行到字元空間 然後分析一行的結構,找到空格,存入字元陣列中。 關閉檔案 寫一個排序函式,或者使用寫一個比較函式,使用sort()排序 遍歷陣列,比較是否有相同的,如果有,則要刪除,copy… 輸出資訊

你可以用C++或者C語言去實現這個流程。如果一個人的主要工作就是處理這種類似的文字(例如做apache的日誌統計和分析),你說他會喜歡C/C++麼?

當然,有了STL,這些處理會得到很大的簡化。我們可以使用 fstream來代替麻煩的fopen fread fclose, 用vector來代替陣列。最重要的是用 string來代替char * 陣列,使用sort排序演算法來排序,用unique 函式來去重。聽起來好像很不錯。看看下面程式碼(例程1):

#include <string>
#include <iostream>
#include <algorithm>
#include <vector>
#include <fstream>
using namespace std
; int main() { ifstream in("name.txt"); string strtmp; vector<string> vect; while(getline(in, strtmp, '\n')) vect.push_back(strtmp.substr(0, strtmp.find(' '))); sort(vect.begin(), vect.end()); vector<string>::iterator it=unique(vect.begin(), vect.end()); copy(vect.begin(), it, ostream_iterator<string>(cout, "\n")); return 0; }

也還不錯吧,至少會比想象得要簡單得多!(程式碼裡面沒有對錯誤進行處理,只是為了說明問題,不要效仿).

當然,在這個文字格式中,不用vector而使用map會更有擴充性,例如,還可通過人名找電話號碼等等,但是使用了map就不那麼好用sort了。你可以用map試一試。

這裡string的作用不只是可以儲存字串,還可以提供字串的比較,查詢等。在sort和unique函式中就預設使用了less 和equal_to函式, 上面的一段程式碼,其實使用了string的以下功能: 儲存功能,在getline() 函式中 查詢功能,在find() 函式中 子串功能,在substr() 函式中 string operator < , 預設在sort() 函式中呼叫 string operator == , 預設在unique() 函式中呼叫

總之,有了string 後,C++的字元文字處理功能總算得到了一定補充,加上配合STL其他容器使用,其在文字處理上的功能已經與perl, shell, php的距離縮小很多了。 因此掌握string 會讓你的工作事半功倍。

1 string 使用

其實,string並不是一個單獨的容器,只是basic_string 模板類的一個typedef 而已,相對應的還有wstring, 你在string 標頭檔案中你會發現下面的程式碼:

extern "C++" {
typedef basic_string <char> string;
typedef basic_string <wchar_t> wstring;
} // extern "C++"

由於只是解釋string的用法,如果沒有特殊的說明,本文並不區分string 和 basic_string的區別。

string 其實相當於一個儲存字元的序列容器,因此除了有字串的一些常用操作以外,還有包含了所有的序列容器的操作。字串的常用操作包括:增加、刪除、修改、查詢比較、連結、輸入、輸出等。詳細函式列表參看附錄。不要害怕這麼多函式,其實有許多是序列容器帶有的,平時不一定用的上。

如果你要想了解所有函式的詳細用法,你需要檢視basic_string,或者下載STL程式設計手冊。這裡通過例項介紹一些常用函式。

1.1 充分使用string 操作符

string 過載了許多操作符,包括 +, +=, <, =, , [], <<, >>等,正式這些操作符,對字串操作非常方便。先看看下面這個例子:

#include <string>
#include <iostream>
using namespace std;
int main()
{
    string strinfo="Please input your name:";
    cout << strinfo ;
    cin >> strinfo;
    if( strinfo == "winter" )
        cout << "you are winter!"<<endl;
    else if( strinfo != "wende" )
        cout << "you are not wende!"<<endl;
    else if( strinfo < "winter")
        cout << "your name should be ahead of winter"<<endl;
    else
        cout << "your name should be after of winter"<<endl;
    strinfo += " , Welcome to China!";
    cout << strinfo<<endl;
    cout <<"Your name is :"<<endl;
    string strtmp = "How are you? " + strinfo;
    for(int i = 0 ; i < strtmp.size(); i ++)
        cout<<strtmp[i];
    return 0;
}

下面是程式的輸出

Please input your name:Hero
you are not wende!
Hero , Welcome to China!
How are you? Hero , Welcome to China!

有了這些操作符,在STL中仿函式都可以直接使用string作為引數,例如 less, great, equal_to 等,因此在把string作為引數傳遞的時候,它的使用和int 或者float等已經沒有什麼區別了。例如,你可以使用:

map<string, int> mymap; //以上預設使用了 less<string>

有了 operator + 以後,你可以直接連加,例如:

string strinfo="Winter";
string strlast="Hello " + strinfo + "!";
string strtest="Hello " + strinfo + " Welcome" + " to China" + " !";//你還可以這樣:

看見其中的特點了嗎?只要你的等式裡面有一個 string 物件,你就可以一直連續”+”,但有一點需要保證的是,在開始的兩項中,必須有一項是 string 物件。其原理很簡單:

系統遇到”+”號,發現有一項是string 物件。 系統把另一項轉化為一個臨時 string 物件。 執行 operator + 操作,返回新的臨時string 物件。 如果又發現”+”號,繼續第一步操作。

由於這個等式是由左到右開始檢測執行,如果開始兩項都是const char ,程式自己並沒有定義兩個const char 的加法,編譯的時候肯定就有問題了。

有了操作符以後,assign(), append(), compare(), at()等函式,除非有一些特殊的需求時,一般是用不上。當然at()函式還有一個功能,那就是檢查下標是否合法,如果是使用:

string str="winter";//下面一行有可能會引起程式中斷錯誤
str[100]='!';//下面會丟擲異常:throws: out_of_range
cout<<str.at(100)<<endl;

瞭解了嗎?如果你希望效率高,還是使用[]來訪問,如果你希望穩定性好,最好使用at()來訪問。

1.2 眼花繚亂的string find 函式

由於查詢是使用最為頻繁的功能之一,string 提供了非常豐富的查詢函式。其列表如下: 函式名 描述 find 查詢 rfind 反向查詢 find_first_of 查詢包含子串中的任何字元,返回第一個位置 find_first_not_of 查詢不包含子串中的任何字元,返回第一個位置 find_last_of 查詢包含子串中的任何字元,返回最後一個位置 find_last_not_of 查詢不包含子串中的任何字元,返回最後一個位置以上函式都是被過載了4次,以下是以find_first_of 函式為例說明他們的引數,其他函式和其引數一樣,也就是說總共有24個函式 :

size_type find_first_of(const basic_string& s, size_type pos = 0)
size_type find_first_of(const charT* s, size_type pos, size_type n)
size_type find_first_of(const charT* s, size_type pos = 0)
size_type find_first_of(charT c, size_type pos = 0)

所有的查詢函式都返回一個size_type型別,這個返回值一般都是所找到字串的位置,如果沒有找到,則返回string::npos。有一點需要特別注意,所有和string::npos的比較一定要用string::size_type來使用,不要直接使用int 或者unsigned int等型別。其實string::npos表示的是-1, 看看標頭檔案:

template <class _CharT, class _Traits, class _Alloc>
const basic_string<_CharT,_Traits,_Alloc>::size_type
basic_string<_CharT,_Traits,_Alloc>::npos
= basic_string<_CharT,_Traits,_Alloc>::size_type) -1;

find 和 rfind 都還比較容易理解,一個是正向匹配,一個是逆向匹配,後面的引數pos都是用來指定起始查詢位置。對於find_first_of 和find_last_of 就不是那麼好理解。

find_first_of 是給定一個要查詢的字符集,找到這個字符集中任何一個字元所在字串中第一個位置。或許看一個例子更容易明白。

有這樣一個需求:過濾一行開頭和結尾的所有非英文字元。看看用string 如何實現:

#include <string>
#include <iostream>
using namespace std;
int main()
{
    string strinfo=" //*---Hello Word!......------";
    string strset="ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz";
    int first = strinfo.find_first_of(strset);
    if(first == string::npos)
    {
        cout<<"not find any characters"<<endl;
        return -1;
    }
    int last = strinfo.find_last_of(strset);
    if(last == string::npos)
    {
        cout<<"not find any characters"<<endl;
        return -1;
    }
    cout << strinfo.substr(first, last - first + 1)<<endl;
    return 0;
}

這裡把所有的英文字母大小寫作為了需要查詢的字符集,先查詢第一個英文字母的位置,然後查詢最後一個英文字母的位置,然後用substr 來的到中間的一部分,用於輸出結果。下面就是其結果:

Hello Word

前面的符號和後面的符號都沒有了。像這種用法可以用來查詢分隔符,從而把一個連續的字串分割成為幾部分,達到 shell 命令中的 awk 的用法。特別是當分隔符有多個的時候,可以一次指定。例如有這樣的需求:

張三|3456123, 湖南
李四,4564234| 湖北
王小二, 4433253|北京
...

我們需要以 “|” “,”為分隔符,同時又要過濾空格,把每行分成相應的欄位。可以作為你的一個作業來試試,要求程式碼簡潔。

1.3 string insert, replace, erase

瞭解了string 的操作符,查詢函式和substr,其實就已經瞭解了string的80%的操作了。insert函式, replace函式和erase函式在使用起來相對簡單。下面以一個例子來說明其應用。 string只是提供了按照位置和區間的replace函式,而不能用一個string字串來替換指定string中的另一個字串。這裡寫一個函式來實現這個功能:

void string_replace(string & strBig, const string & strsrc, const string &strdst)
{
    string::size_type pos=0;
    string::size_type srclen=strsrc.size();
    string::size_type dstlen=strdst.size();
    while( (pos=strBig.find(strsrc, pos)) != string::npos)
    {
        strBig.replace(pos, srclen, strdst);
        pos += dstlen;
    }
}

看看如何呼叫:

#include <string>
#include <iostream>
using namespace std;
int main()
{
    string strinfo="This is Winter, Winter is a programmer. Do you know Winter?";
    cout<<"Orign string is :\n"<<strinfo<<endl;
    string_replace(strinfo, "Winter", "wende");
    cout<<"After replace Winter with wende, the string is :\n"<<strinfo<<endl;
    return 0;
}

其輸出結果:

Orign string is :
This is Winter, Winter is a programmer. Do you know Winter?
After replace Winter with wende, the string is :
This is wende, wende is a programmer. Do you know wende?

如果不用replace函式,則可以使用erase和insert來替換,也能實現string_replace函式的功能:

void string_replace(string & strBig, const string & strsrc, const string &strdst)
{
    string::size_type pos=0;
    string::size_type srclen=strsrc.size();
    string::size_type dstlen=strdst.size();
    while( (pos=strBig.find(strsrc, pos)) != string::npos)
    {
        strBig.erase(pos, srclen);
        strBig.insert(pos, strdst);
        pos += dstlen;
    }
}

當然,這種方法沒有使用replace來得直接。

2 string 和C-style字串

現在看了這麼多例子,發現const char* 可以和string 直接轉換,例如我們在上面的例子中,使用

string_replace(strinfo, "Winter", "wende");來代用void string_replace(string & strBig, const string & strsrc, const string &strdst)

在C語言中只有char 和 const char,為了使用起來方便,string提供了三個函式滿足其要求:

const charT* c_str() const
const charT* data() const
size_type copy(charT* buf, size_type n, size_type pos = 0) const

其中: c_str 直接返回一個以\0結尾的字串。 data 直接以陣列方式返回string的內容,其大小為size()的返回值,結尾並沒有\0字元。 copy 把string的內容拷貝到buf空間中。 你或許會問,c_str()的功能包含data(),那還需要data()函式幹什麼?看看原始碼:

const charT* c_str () const
{
    if (length () == 0)
        return "";
    terminate ();
    return data ();
}

原來c_str()的流程是:先呼叫terminate(),然後在返回data()。因此如果你對效率要求比較高,而且你的處理又不一定需要以\0的方式結束,你最好選擇data()。但是對於一般的C函式中,需要以const char*為輸入引數,你就要使用c_str()函式。

對於c_str() data()函式,返回的陣列都是由string本身擁有,千萬不可修改其內容。其原因是許多string實現的時候採用了引用機制,也就是說,有可能幾個string使用同一個字元儲存空間。而且你不能使用sizeof(string)來檢視其大小。詳細的解釋和實現檢視Effective STL的條款15:小心string實現的多樣性。

另外在你的程式中,只在需要時才使用c_str()或者data()得到字串,每呼叫一次,下次再使用就會失效,如:

string strinfo("this is Winter");
...
//最好的方式是:
foo(strinfo.c_str());
//也可以這麼用:
const char* pstr=strinfo.c_str();
foo(pstr);
//不要再使用了pstr了, 下面的操作已經使pstr無效了。
strinfo += " Hello!";
foo(pstr);//錯誤!

會遇到什麼錯誤?當你幸運的時候pstr可能只是指向”this is Winter Hello!”的字串,如果不幸運,就會導致程式出現其他問題,總會有一些不可遇見的錯誤。總之不會是你預期的那個結果。

3 string 和 Charactor Traits 瞭解了string的用法,該詳細看看string的真相了。前面提到string 只是basic_string的一個typedef。看看basic_string 的引數:

template <class charT, class traits = char_traits<charT>,
class Allocator = allocator<charT> >
class basic_string
{
//...
}

char_traits不僅是在basic_string 中有用,在basic_istream 和 basic_ostream中也需要用到。 就像Steve Donovan在過度使用C++模板中提到的,這些確實有些過頭了,要不是系統自己定義了相關的一些屬性,而且用了個typedef,否則還真不知道如何使用。

但複雜總有複雜道理。有了char_traits,你可以定義自己的字串型別。當然,有了char_traits < char > 和char_traits < wchar_t > 你的需求使用已經足夠了,為了更好的理解string ,咱們來看看char_traits都有哪些要求。

如果你希望使用你自己定義的字元,你必須定義包含下列成員的結構: 表示式 描述

char_type 字元型別
int_type int 型別
pos_type 位置型別
off_type 表示位置之間距離的型別
state_type 表示狀態的型別
assign(c1,c2) 把字元c2賦值給c1
eq(c1,c2) 判斷c1,c2 是否相等
lt(c1,c2) 判斷c1是否小於c2
length(str) 判斷str的長度
compare(s1,s2,n) 比較s1s2的前n個字元
copy(s1,s2, n)s2的前n個字元拷貝到s1move(s1,s2, n)s2中的前n個字元移動到s1assign(s,n,c)s中的前n個字元賦值為c
find(s,n,c)s的前n個字元內查詢c
eof() 返回end-of-file
to_int_type(c)c轉換成int_type
to_char_type(i)i轉換成char_type
not_eof(i) 判斷i是否為EOF
eq_int_type(i1,i2) 判斷i1i2是否相等

想看看實際的例子,你可以看看sgi STL的char_traits結構原始碼.

現在預設的string版本中,並不支援忽略大小寫的比較函式和查詢函式,如果你想練練手,你可以試試改寫一個char_traits , 然後生成一個case_string類, 也可以在string 上做繼承,然後派生一個新的類,例如:ext_string,提供一些常用的功能,例如:

定義分隔符。給定分隔符,把string分為幾個欄位。 提供替換功能。例如,用winter, 替換字串中的wende 大小寫處理。例如,忽略大小寫比較,轉換等 整形轉換。例如把”123”字串轉換為123數字。 這些都是常用的功能,如果你有興趣可以試試。其實有人已經實現了,看看Extended STL string。如果你想偷懶,下載一個頭檔案就可以用,有了它確實方便了很多。要是有人能提供一個支援正則表示式的string,我會非常樂意用。

4 string 建議 使用string 的方便性就不用再說了,這裡要重點強調的是string的安全性。 string並不是萬能的,如果你在一個大工程中需要頻繁處理字串,而且有可能是多執行緒,那麼你一定要慎重(當然,在多執行緒下你使用任何STL容器都要慎重)。 string的實現和效率並不一定是你想象的那樣,如果你對大量的字串操作,而且特別關心其效率,那麼你有兩個選擇,首先,你可以看看你使用的STL版本中string實現的原始碼;另一選擇是你自己寫一個只提供你需要的功能的類。 string的c_str()函式是用來得到C語言風格的字串,其返回的指標不能修改其空間。而且在下一次使用時重新呼叫獲得新的指標。 string的data()函式返回的字串指標不會以’\0’結束,千萬不可忽視。 儘量去使用操作符,這樣可以讓程式更加易懂

5 小結 難怪有人說:string 使用方便功能強,我們一直用它!

6 附錄

string 函式列表 函式名 描述
begin 得到指向字串開頭的Iterator
end 得到指向字串結尾的Iterator
rbegin 得到指向反向字串開頭的Iterator
rend 得到指向反向字串結尾的Iterator
size 得到字串的大小
length 和size函式功能相同
max_size 字串可能的最大大小
capacity 在不重新分配記憶體的情況下,字串可能的大小
empty 判斷是否為空
operator[] 取第幾個元素,相當於陣列
c_str 取得C風格的const char* 字串
data 取得字串內容地址
operator= 賦值操作符
reserve 預留空間
swap 交換函式
insert 插入字元
append 追加字元
push_back 追加字元
operator+= += 操作符
erase 刪除字串
clear 清空字元容器中所有內容
resize 重新分配空間
assign 和賦值操作符一樣
replace 替代
copy 字串到空間
find 查詢
rfind 反向查詢
find_first_of 查詢包含子串中的任何字元,返回第一個位置
find_first_not_of 查詢不包含子串中的任何字元,返回第一個位置
find_last_of 查詢包含子串中的任何字元,返回最後一個位置
find_last_not_of 查詢不包含子串中的任何字元,返回最後一個位置
substr 得到字串
compare 比較字串
operator+ 字串連結
operator== 判斷是否相等
operator!= 判斷是否不等於
operator< 判斷是否小於
operator>> 從輸入流中讀入字串
operator<< 字串寫入輸出流
getline 從輸入流中讀入一行

///////////////////////////////////////////////////////////////////////////////////

之所以拋棄char*的字串而選用C++標準程式庫中的string類,是因為他和前者比較起來,不必擔心記憶體是否足夠、字串長度等等,而且作為一個類出現,他整合的操作函式足以完成我們大多數情況下(甚至是100%)的需要。我們可以用 = 進行賦值操作,== 進行比較,+ 做串聯(是不是很簡單?)。我們儘可以把它看成是C++的基本資料型別。 好了,進入正題……… 首先,為了在我們的程式中使用string型別,我們必須包含標頭檔案。如下:

#include <string> //注意這裡不是string.h string.h是C字串標頭檔案

1.宣告一個C++字串 宣告一個字串變數很簡單:

string Str;

這樣我們就聲明瞭一個字串變數,但既然是一個類,就有建構函式和解構函式。上面的宣告沒有傳入引數,所以就直接使用了string的預設的建構函式,這個函式所作的就是把Str初始化為一個空字串。String類的建構函式和解構函式如下:

a)    string s;  //生成一個空字串s
b)    string s(str) //拷貝建構函式 生成str的複製品
c)    string s(str,stridx) //將字串str內“始於位置stridx”的部分當作字串的初值
d)    string s(str,stridx,strlen) //將字串str內“始於stridx且長度頂多strlen”的部分作為字串的初值
e)    string s(cstr) //將C字串作為s的初值
f)    string s(chars,chars_len) //將C字串前chars_len個字元作為字串s的初值。
g)    string s(num,c) //生成一個字串,包含num個c字元
h)    string s(beg,end) //以區間beg;end(不包含end)內的字元作為字串s的初值
i)    s.~string() //銷燬所有字元,釋放記憶體

都很簡單,我就不解釋了。

2.字串操作函式 這裡是C++字串的重點,我先把各種操作函式羅列出來,不喜歡把所有函式都看完的人可以在這裡找自己喜歡的函式,再到後面看他的詳細解釋。

a) =,assign()   //賦以新值
b) swap()   //交換兩個字串的內容
c) +=,append(),push_back() //在尾部新增字元
d) insert() //插入字元
e) erase() //刪除字元
f) clear() //刪除全部字元
g) replace() //替換字元
h) + //串聯字串
i) ==,!=,<,<=,>,>=,compare()  //比較字串
j) size(),length()  //返回字元數量
k) max_size() //返回字元的可能最大個數
l) empty()  //判斷字串是否為空
m) capacity() //返回重新分配之前的字元容量
n) reserve() //保留一定量記憶體以容納一定數量的字元
o) [ ], at() //存取單一字元
p) >>,getline() //從stream讀取某值
q) <<  //將謀值寫入stream
r) copy() //將某值賦值為一個C_string
s) c_str() //將內容以C_string返回
t) data() //將內容以字元陣列形式返回
u) substr() //返回某個子字串
v)查詢函式
w)begin() end() //提供類似STL的迭代器支援
x) rbegin() rend() //逆向迭代器
y) get_allocator() //返回配置器

下面詳細介紹:

2.1 C++字串和C字串的轉換

C++提供的由C++字串得到對應的C_string的方法是使用data()、c_str()和copy(),其中,data()以字元陣列的形式返回字串內容,但並不新增’\0’。c_str()返回一個以‘\0’結尾的字元陣列,而copy()則把字串的內容複製或寫入既有的c_string 或字元陣列內。C++字串並不以’\0’結尾。我的建議是在程式中能使用C++字串就使用,除非萬不得已不選用c_string。由於只是簡單介紹,詳細介紹掠過,誰想進一步瞭解使用中的注意事項可以給我留言(到我的收件箱)。我詳細解釋。
2.2 大小和容量函式 一個C++字串存在三種大小:a)現有的字元數,函式是size()和length(),他們等效。Empty()用來檢查字串是否為空。 b)max_size() 這個大小是指當前C++字串最多能包含的字元數,很可能和機器本身的限制或者字串所在位置連續記憶體的大小有關係。我們一般情況下不用關心他,應該大小足夠我們用的。但是不夠用的話,會丟擲length_error異常c)capacity()重新分配記憶體之前 string所能包含的最大字元數。這裡另一個需要指出的是reserve()函式,這個函式為string重新分配記憶體。重新分配的大小由其引數決定,預設引數為0,這時候會對string進行非強制性縮減。

還有必要再重複一下C++字串和C字串轉換的問題,許多人會遇到這樣的問題,自己做的程式要呼叫別人的函式、類什麼的(比如資料庫連線函式 Connect(char,char)),但別人的函式引數用的是char形式的,而我們知道,c_str()、data()返回的字元陣列由該字串擁有,所以是一種const char,要想作為上面提及的函式的引數,還必須拷貝到一個char,而我們的原則是能不使用C字串就不使用。那麼,這時候我們的處理方式是:如果此函式對引數(也就是char)的內容不修改的話,我們可以這樣Connect((char)UserID.c_str(), (char)PassWD.c_str()),但是這時候是存在危險的,因為這樣轉換後的字串其實是可以修改的(有興趣地可以自己試一試),所以我強調除非函式呼叫的時候不對引數進行修改,否則必須拷貝到一個char上去。當然,更穩妥的辦法是無論什麼情況都拷貝到一個char上去。同時我們也祈禱現在仍然使用C字串進行程式設計的高手們(說他們是高手一點兒也不為過,也許在我們還穿開襠褲的時候他們就開始程式設計了,哈哈…)寫的函式都比較規範,那樣我們就不必進行強制轉換了。

2.3元素存取 我們可以使用下標操作符[]和函式at()對元素包含的字元進行訪問。但是應該注意的是操作符[]並不檢查索引是否有效(有效索引 0~str.length()),如果索引失效,會引起未定義的行為。而at()會檢查,如果使用at()的時候索引無效,會丟擲 out_of_range異常。 有一個例外不得不說,const string a;的操作符[]對索引值是a.length()仍然有效,其返回值是’\0’。其他的各種情況,a.length()索引都是無效的。舉例如下:

const string Cstr(“const string”);
string Str(“string”);

Str[3];    //ok
Str.at(3);  //ok

Str[100]; //未定義的行為
Str.at(100);  //throw out_of_range

Str[Str.length()]  //未定義行為
Cstr[Cstr.length()] //返回 ‘\0’
Str.at(Str.length());//throw out_of_range
Cstr.at(Cstr.length()) ////throw out_of_range

我不贊成類似於下面的引用或指標賦值: char& r=s[2]; char* p= &s[3];

因為一旦發生重新分配,r,p立即失效。避免的方法就是不使用。

2.4比較函式 C++字串支援常見的比較操作符(>,>=,<,<=,==,!=),甚至支援string與C-string的比較(如 str<”hello”)。在使用>,>=,<,<=這些操作符的時候是根據“當前字元特性”將字元按字典順序進行逐一得比較。字典排序靠前的字元小,比較的順序是從前向後比較,遇到不相等的字元就按這個位置上的兩個字元的比較結果確定兩個字串的大小。同時,string(“aaaa”)

string s(“abcd”);
s.compare(“abcd”); //返回0
s.compare(“dcba”); //返回一個小於0的值
s.compare(“ab”); //返回大於0的值
s.compare(s); //相等
s.compare(0,2,s,2,2); //用”ab”和”cd”進行比較 小於零
s.compare(1,2,”bcx”,2); //用”bc”和”bc”比較。

怎麼樣?功能夠全的吧!什麼?還不能滿足你的胃口?好吧,那等著,後面有更個性化的比較演算法。先給個提示,使用的是STL的比較演算法。什麼?對STL一竅不通?你重修吧!

2.5 更改內容 這在字串的操作中佔了很大一部分。 首先講賦值,第一個賦值方法當然是使用操作符=,新值可以是string(如:s=ns) 、c_string(如:s=”gaint”)甚至單一字元(如:s=’j’)。還可以使用成員函式assign(),這個成員函式可以使你更靈活的對字串賦值。還是舉例說明吧:

s.assign(str); //直接
s.assign(str,1,3);//如果str是”iamangel” 就是把”ama”賦給字串
s.assign(str,2,string::npos);//把字串str從索引值2開始到結尾賦給s
s.assign(“gaint”); //不說
s.assign(“nico”,5);//把’n’ ‘I’ ‘c’ ‘o’ ‘\0’賦給字串
s.assign(5,’x’);//把五個x賦給字串

把字串清空的方法有三個:s=””;s.clear();s.erase();(我越來越覺得舉例比說話讓別人容易懂!)。 string提供了很多函式用於插入(insert)、刪除(erase)、替換(replace)、增加字元。 先說增加字元(這裡說的增加是在尾巴上),函式有 +=、append()、push_back()。舉例如下:

s+=str;//加個字串
s+=”my name is jiayp”;//加個C字串
s+=’a’;//加個字元

s.append(str);
s.append(str,1,3);//不解釋了 同前面的函式引數assign的解釋
s.append(str,2,string::npos)//不解釋了

s.append(“my name is jiayp”);
s.append(“nico”,5);
s.append(5,’x’);

s.push_back(‘a’);//這個函式只能增加單個字元 對STL熟悉的理解起來很簡單

也許你需要在string中間的某個位置插入字串,這時候你可以用insert()函式,這個函式需要你指定一個安插位置的索引,被插入的字串將放在這個索引的後面。

   s.insert(0,”my name”);
    s.insert(1,str);

這種形式的insert()函式不支援傳入單個字元,這時的單個字元必須寫成字串形式(讓人噁心)。既然你覺得噁心,那就不得不繼續讀下面一段話:為了插入單個字元,insert()函式提供了兩個對插入單個字元操作的過載函式:insert(size_type index,size_type num,chart c)和insert(iterator pos,size_type num,chart c)。其中size_type是無符號整數,iterator是char*,所以,你這麼呼叫insert函式是不行的:insert(0,1,’j’);這時候第一個引數將轉換成哪一個呢?所以你必須這麼寫:insert((string::size_type)0,1,’j’)!第二種形式指出了使用迭代器安插字元的形式,在後面會提及。順便提一下,string有很多操作是使用STL的迭代器的,他也儘量做得和STL靠近。 刪除函式erase()的形式也有好幾種(真煩!),替換函式replace()也有好幾個。舉例吧:

string s=”il8n”;
s.replace(1,2,”nternationalizatio”);//從索引1開始的2個替換成後面的C_string
s.erase(13);//從索引13開始往後全刪除
s.erase(7,5);//從索引7開始往後刪5個

2.6提取子串和字串連線

題取子串的函式是:substr(),形式如下:

s.substr();//返回s的全部內容
s.substr(11);//從索引11往後的子串
s.substr(5,6);//從索引5開始6個字元

把兩個字串結合起來的函式是+。(誰不明白請致電120)

2.7輸入輸出操作 1.>> 從輸入流讀取一個string。 2.<< 把一個string寫入輸出流。 另一個函式就是getline(),他從輸入流讀取一行內容,直到遇到分行符或到了檔案尾。

2.8搜尋與查詢 查詢函式很多,功能也很強大,包括了:

    find()
    rfind()
    find_first_of()
    find_last_of()
    find_first_not_of()
    find_last_not_of()

這些函式返回符合搜尋條件的字元區間內的第一個字元的索引,沒找到目標就返回npos。所有的函式的引數說明如下: 第一個引數是被搜尋的物件。第二個引數(可有可無)指出string內的搜尋起點索引,第三個引數(可有可無)指出搜尋的字元個數。比較簡單,不多說 不理解的可以向我提出,我再仔細的解答。當然,更加強大的STL搜尋在後面會有提及。 最後再說說npos的含義,string::npos的型別是string::size_type,所以,一旦需要把一個索引與npos相比,這個索引值必須是string::size)type型別的,更多的情況下,我們可以直接把函式和npos進行比較(如:if(s.find(“jia”)==string::npos))。

任何人對本文進行引用都要標明作者是Nicolai M.Josuttis 譯者是侯捷/孟巖

原文:https://www.byvoid.com/zhs/blog/cpp-string