C++ —— string类（上）

🕗 发布于 2024-11-19 17:38 c++ 开发语言 1024程序员节 c语言 数据结构

string的介绍

string类功能的使用介绍

constructor —— 构造

介绍使用（1）（2）（4）：构造、拷贝构造、带参构造

介绍（3）：拷贝string类对象的一部分字符，从pos位置开始，拷贝len个字符

size（） length() max_size()

operator[] —— []运算符重载

iterator —— 迭代器（正向）

begin()

end()

reverse_iterator —— 反向迭代器

string的介绍

string严格来说是属于C++标准库的，不是属于STL（标准模板库）。

STL：

我们看到里面其实是没有string的，string产生的比STL较早的，在头文件中，会单独看到一个string的头文件。C++文档

所谓的string其实就是一个字符串，它要解决的就是要管理字符串。（日常当中字符串是很多的，如：身份证号码，家庭地址，电话号码等等）

打开string头文件可以看到：

有4种，这个与所谓的编码有关系，这里我们先看string：

由于编码的原因，string是typedef出来的，它的原生类型是：

//原生类型
basic_string<char>

除了char，还有其他字符的类型（编码的原因）

//原生类型
basic_string<char16_t>

//原生类型
basic_string<char32_t>

basic_string<wchar_t>

注意：basic_string其实是一个模板，所以string底层还是一个模板。

所以，string是一个管理字符串的类。

string的介绍：

总的来说，string是一个对象，是用一个字符的顺序表实现的（也就是字符数组实现的），所以它就是一个字符顺序表（或字符数组），它可以动态的增长。（可以主要兼容UTF-8）

string底层大致成员变量如下：

class string
{
public:
   /*成员函数（功能接口）*/
private:
char* str;   //指针指向堆上的空间，这些空间存储对应字符串
size_t size;   //有效字符个数
size_t capacity;  //容量
};

下面将介绍string类的常用接口说明。

string类功能的使用介绍

string主要包含接口如下：

我们要使用string类要记得包含一个头文件：

#include <string>   //C++

//C语言的是
#include<string.h>    //注意两者区分

constructor —— 构造

string类对象的常见构造
（constructor）函数名称	功能说明
string()	构造空的string类对象，即空字符串
string(const char* s)	用C-string来构造string类对象
string(size_t n, char c)	string类对象中包含n个字符c
string(const string&s)	拷贝构造函数

但string构造总的来说是有七种构造方式的：

我们来看C++98版本的，string它有七种构造方式，下面来介绍一下：

default (1)
string();        //无参构造（也是默认构造，构造一个空字符串，长度为0个字符）

copy (2)
string (const string& str);    //拷贝构造

substring (3)
string (const string& str, size_t pos, size_t len = npos);   //子串构造函数（复制str中，从字符位置pos开始，到len位置字符的部分）

from c-string (4)
string (const char* s);    //带参构造（用一个常量字符串构造）

from sequence (5)
string (const char* s, size_t n);    //拷贝前n个字符初始化

fill (6)
string (size_t n, char c);    //连续n个C的字符去初始化

range (7)
template <class InputIterator>
string  (InputIterator first, InputIterator last);    //迭代器区间初始化

介绍使用（1）（2）（4）：构造、拷贝构造、带参构造

我们先来介绍使用（1）（2）（4）：

(string重载了流插入、流提取）

#include<iostream>
#include<string>

using namespace std;


int main()
{
string s1;           //默认构造
string s2("12345");  //带参构造
string s3(s2); //拷贝构造


//string也重载了流插入流提取（>>，<<）
cout << s1 << endl;
cout << s2 << endl;
cout << s3 << endl;

cin >> s1;
cout << s1 << endl;

return 0;
}

介绍（3）：拷贝string类对象的一部分字符，从pos位置开始，拷贝len个字符

substring (3)
string (const string& str, size_t pos, size_t len = npos);   //拷贝构造的一个变形

//也就是拷贝一部分字符，从pos位置开始，拷贝len个字符

//接着上面演示的构造代码
int main()
{
string s1;           //默认构造
string s2("1234567");  //带参构造
string s3(s2); //拷贝构造


//string也重载了流插入流提取（cout，cin）
cout << s1 << endl;
cout << s2 << endl;
cout << s3 << endl;

cin >> s1;
cout << s1 << endl;

string s4(s2, 2, 4);  //这里就是让s4去拷贝s2的下标为2的位置开始，拷贝4个字符
cout << s4 << endl;

return 0;
}

我们观察输出结果，看到从3开始拷贝四个字符到6，3456四个字符就到s4里去了。若此时这里给的字符超过字符串长度，会不会报错呢？

string s2("1234567"); 
string s4(s2, 2, 15);   //让它从pos=2开始拷贝15个字符

我们观察结果，是没有报错的：

文档中：

也就是说string太短了，不够len个字符，它就直到它结束为止（有多少拷贝多少）；这里还说或者为npos也是拷到它的结束。

第三个构造它的len是有缺省值npos的，如果不传第三个参数len，那么它就用这个缺省值，直到拷贝它的结束为止。

string s2("1234567"); 
string s4(s2, 2);
cout<<s2<<endl;
cout<<s4<<endl;

运行结果：

下面对npos介绍一下

destructor —— 析构

string的析构函数会自动调用，string的底层是一个动态开辟的数组，构造和析构函数是自动调用的（类和对象这里有介绍）。

operator= —— 赋值重载

赋值运算符重载也是默认成员函数（类和对象有介绍）。

string (1)
string& operator= (const string& str);  //支持string的赋值

c-string (2)
string& operator= (const char* s);      //支持char*的赋值

character (3)
string& operator= (char c);             //支持一个字符的赋值

测试：

int main()
{
string s1;           
string s6("hello world", 5);

s1 = s6;
    //本质就是调用了operator=
cout << s1 << endl;

s1 = "abcde";
cout << s1 << endl;

s1 = 'x';
cout << s1 << endl;

return 0;
}

运行结果：

string类对象的容量操作

函数名称	功能说明
size	返回字符串有效字符长度
length	返回字符串有效字符长度
max_size	获取最大长度（能最大开多长）
capacity	返回空间容量的大小
empty	检查字符串释放为空串，若是空串返回true，否则返回false
clear	清空有效字符
reserve	为字符串预留空间
resize	将有效字符的个数改成n个，多出的空间用字符c填充

size（） length() max_size()

size（）和 length（）它们两个功能上完全一致，只是一般size用的比较多，是为了与其他容器接口保持一致。

这里拿size（）来说，string提供了一个size的接口，它是用来获取string的长度（有多少个字符）。

max_size()是用来获取它最大的长度，就是它最大能开多长

int main()
{
string s("FFDUST");
cout << s.length() << endl;
cout << s.size() << endl;

cout << s.max_size() << endl;
}

reserve（）和 resize（）

reserve（）接口就是先给该对象预留多少空间，不改变有效元素个数，若reserve的参数小于string的底层空间总大小时，reserve不会改变容量大小（这里VS下不会缩容，其他编译器可能会缩容，C++规定没有约束）。

int main()
{
string s("FFDUST");
cout << "s的空间大小为:" << s.capacity() << endl;
s.reserve(100);
cout << "s的空间大小为:" << s.capacity() << endl;
s.reserve(1);
cout << "s的空间大小为:" << s.capacity() << endl;

return 0;
}

VS这里会做整数倍对齐，所以这里capacity可能会比传的参数较大一些。

注意：谈string容量的时候默认不包含\0的，所以开空间实际上会多1位用来放\0，但capacity返回的是不带\0的。

reserve的用法：提前开空间，避免扩容，提高效率。

int main()
{
string s;
s.reserve(100);
size_t sz = s.capacity();

cout << "making s grow:\n";
for (int i = 0; i < 100; ++i)
{
s.push_back('c');
if (sz != s.capacity())
{
sz = s.capacity();
cout << "capacity changed: " << sz << '\n';
}
}

return 0;
}

这里就是给s预留了足够大的空间，再插入时候不会发生扩容。

resize（）接口（将有效字符的个数改成n个，多出的空间用字符c填充），相当于扩容插入。

这里它是有两个版本的：resize(size_t n) 与 resize(size_t n, char c)都是将字符串中有效字符个数改变到n个，不同的是当字符个数增多时：resize(n)用0（也就是\0）来填充多出的元素空间，resize(size_t n, char c)用字符c来填充多出的元素空间。注意的是：resize若比size小的话会删除数据（缩容不确定），比capacity大就会扩容。

int main()
{
string s("ffdust");
cout << s << endl;
cout << "s的空间大小为:" << s.capacity() << endl;
s.resize(100);      //默认插入\0
cout << s << endl;
cout << "s的空间大小为:" << s.capacity() << endl;
}

int main()
{
string s("ffdust");
cout << s << endl;
cout << "s的空间大小为:" << s.capacity() << endl;

s.resize(100,'1');        //用字符1填充多出的元素空间，注意这里会扩容
cout << s << endl;
cout << "s的空间大小为:" << s.capacity() << endl;

}

clear（）

clear（）也就是清空有效字符，一般严格来说不会清理掉容量，只是把数据清理掉了

int main()
{
string s("ffdust");
cout << s << endl;
cout << &s << endl;
cout << "s的空间大小为:" << s.capacity() << endl;
s.clear();
cout << s << endl;
cout << &s << endl;
cout << "s的空间大小为:" << s.capacity() << endl;

return 0;
}

运行结果：

empty（）

empty（）接口时用来判空的（有没有字符），也就是检测字符串是否为空串，若是返回true，否则返回false。

int main()
{
string s("ffdust");
cout << s << endl;
if (s.empty())
{
cout << s << "，是空串" << endl;
}
else
{
cout << s << "，不是空串" << endl;
}
cout << "s的空间大小为:" << s.capacity() << endl;
s.clear();
cout << s << endl;
if (s.empty())
{
cout << s << "，是空串" << endl;
}
else
{
cout << s << "，不是空串" << endl;
}
cout << "s的空间大小为:" << s.capacity() << endl;

return 0;
}

运行结果：

遍历及访问string所需的一些接口

函数功能	功能说明
operator[]	返回pos位置的字符，const string类对象也以调用
begin（）+end（）	begin获取第一个字符的迭代器 + end获取最后一个字符下一个位置的迭代器
rbegin（）+rend（）	rbegin获取最后一个字符迭代器 + rend获取第一个字符前一个位置的迭代器
范围for	C++11支持更简洁的范围for的新遍历方式

遍历string有三种方式：

下标+[]
迭代器
范围for

operator[] —— []运算符重载

string重载operator[]，访问pos位置的字符，返回这个字符的引用。（可以读和修改）

string重载了[]，这样就可以让string当成数组一样使用下标访问。string底层意思大致理解是有一个指针，指针指向一个数组，是动态开辟的，它还要有size和capacity，重载operator[]，就可以让它去访问第i个位置的字符：

class string
{
public:
    char& operator[](size_t i)
    {
return _str[i];           //返回第i字符的引用（这里引用返回，不只是可以减少拷贝，还能让它被修改）
    }
private:
char* str;
size_t size;
size_t capacity;
};

使用如下：

int main()
{
string s6("hello world");
cout << s6 << endl;

s6[5] = 'a';     //将下标为5的字符修改成a
cout << s6 << endl;
return 0;
}

运行结果：

就相当于用数组一样，可以获取这个位置的字符，也可以修改这个位置的字符，但这里的底层就是函数调用，调用的operator[]，注意：这里越界了可以检查出来的。

char& operator[](size_t i)
{
    assert(i < _size);   //这里断言，只要越界了就直接报错
return _str[i];
}

我们看到这里15位置越界访问了，就报错了。

所以，我们可以搭配着size接口防止越界访问来一个一个字符的遍历：

int main()
{
string s6("hello world1111");

    //下标+[]
for (int i = 0; i < s6.size(); i++)
{
cout << s6[i] << " ";
}
cout << endl;

return 0;
}

运行结果：

iterator —— 迭代器（正向）

迭代器遍历：

int main()
{
string s6("hello world");
    //迭代器遍历——正向
string::iterator it = s6.begin();
while (it != s6.end())
{
cout << *it << " ";
++it;
}
cout << endl;

return 0;
}

正向遍历（begin+end）：

注：迭代器是STL六大组件之一，迭代器是用来遍历和访问这些容器的 。（迭代器有可能是原生指针，也有可能不是）。

迭代器是类似于一个指针一样的东西，通过解引用可以访问对应位置的数据，迭代器还规定，不管它底层是怎么定义的，它是属于对应容器的类域。（上面string的迭代器属于string的类域，所以要写成 string::iterator），所以所有的容器都可以通过迭代器来访问（通用的访问容器的方式）。

begin()

begin()就是返回开始位置的迭代器。

string这里就是返回的是第一个有效字符的位置的迭代器。

注：这里有两个版本，第一个就是普通对象用来调用的，第二个是const修饰的对象的const迭代器所调用（这里普通对象也能调用，但是只能读，不能写）。

end()

end()返回的是最后一个有效数据的下一个位置的迭代器。

string这里就是返回最后一个有效字符的下一个位置的迭代器。

reverse_iterator —— 反向迭代器

这里就与iterator完全相反着了

反向遍历（rbegin+rend）：

int main()
{
      //反向迭代器遍历
    // string::reverse_iterator rit = s6.rbegin();
    // C++11之后，直接使用auto定义迭代器，让编译器推到迭代器的类型
    auto rit = s6.rbegin();
    while (rit != s6.rend())
    {
    cout << *rit <<" ";
    ++rit;
    }
    cout << endl;
}

运行结果：

rbegin和rend

这两个接口就相当于begin与end接口相反的。

也就是rbegin获取最后一个字符迭代器， rend获取第一个字符前一个位置的迭代器。

const修饰的迭代器

const修饰的对象，要用迭代器遍历时，是需要const修饰的迭代器的，它不能使用普通迭代器，

const迭代器修饰的是迭代器的指向，而不是迭代器的本身（类似于const修饰指针）

如下所示：

int main()
{
    //const对象
    const string cs("const hello world");
    //const修饰的（正向）迭代器
    string::const_iterator cit = cs.begin();  //这里也可以用cbegin接口，不过begin接口有提供的const修饰的版本，这就已经够用了
    while (cit != cs.end())     //cend同上也可以用
    {
    //错误C3892“cit” : 不能给常量赋值
    //*cit += 'x';
    cout << *cit << " ";
    ++cit;
    }
    cout << endl;

    //const修饰的反向迭代器
    string::const_reverse_iterator crit = cs.rbegin();   //这里也可以用crbegin接口，不过rbegin接口有提供的const修饰的版本，这就已经够用了
    while (crit != cs.rend())    //crend同上也可以用
    {
    //错误C3892“crit” : 不能给常量赋值
    //*crit += 'x';
    cout << *crit << " ";
    ++crit;
    }
    cout << endl;

    return 0;
}

运行结果：

const修饰的迭代器，普通对象也是可以使用的（也就是权限可以缩小，但不能放大），不过只能读，不能写。

int main()
{
    //普通对象
string s("hello world");
    //const修饰的迭代器
string::const_iterator it = s.begin();
while (it != s.end())
{
//错误C3892“it” : 不能给常量赋值
//*it += 'x';
cout << *it << " ";
++it;
}
cout << endl;

//const修饰的反向迭代器
string::const_reverse_iterator rit = s.rbegin();
    while (rit != s.rend())
    {
    //错误C3892“rit” : 不能给常量赋值
    //*rit += 'x';
    cout << *rit << " ";
    ++rit;
    }
    cout << endl;
    return 0;
}

运行结果：

（这里也可以用auto自动推导它的类型，方便代码的编写）

范围for

对于一个有范围的集合而言，C++11中引入了基于范围的for循环。for循环后的括号由冒号“ ：”分为两部分：第一部分是范围内用于迭代的变量，第二部分则表示被迭代的范围，自动迭代，自动取数据，自动判断结束。
范围for可以作用到数组和容器对象上进行遍历。

auto

在早期 C/C++ 中 auto 的含义是：使用 auto修饰的变量，是具有自动存储器的局部变量。 C++11 中，赋予了 auto 全新的含义即： auto 不再是一个存储类型 指示符，而是作为一个新的类型指示符来指示编译器， auto 声明的变量必须由编译器在编译时期 推导而得。

范围for和auto就可以配合使用来遍历string：

int main()
{
string s6("hello world");
    
    //字符赋值，自动迭代，自动判断结束
for (auto e : s6)  //auto这里自动推导类型为char
{
cout << e << " ";
}
cout << endl;

return 0;
}

运行结果：

所以这里范围for想表达的是：

注意：范围for的底层角度是跟迭代器一样的，也就是说范围for这段代码被编译了之后会被替换成迭代器。（所以要支持范围for前提是要支持迭代器遍历）

从汇编层可以看到，这里就是被替换成了迭代器：

范围for跟迭代器就相当于没有区别，范围for只是方便编写代码。这里对比迭代器，也展示出auto的价值就是缩短代码（简化代码），不过这样会使代码可读性降低。

//这两个it的类型是一致的
string::iterator it = s6.begin();

//auto会自动推导成上面的string::iterator
auto it = s6.begin();

迭代器是可以修改的。

int main()
{
string::iterator it = s6.begin();
cout << s6 << endl;
while (it != s6.end())
{
*it += 2;           //让里面的每一个值都加等2
cout << *it << " ";
++it;
}
cout << endl;

for (auto e : s6)
{
cout << e << " ";
}
cout << endl;

return 0;
}

运行结果对比一下：

可以看到每一个值都被改变了，范围for打印数据也受到影响。范围for里也是可以修改数据的，下面在范围for里面打印原来的值：

int main()
{
string::iterator it = s6.begin();
cout << s6 << endl;
while (it != s6.end())
{
*it += 2;           //让里面的每一个值都加等2
cout << *it << " ";
++it;
}
cout << endl;

for (auto e : s6)
{
        e -= 2;           //只需要让e减等2即可
cout << e << " ";
}
cout << endl;

return 0;
}

运行结果：

注意：这里有坑的是，范围for打印出来的结果看似把s6恢复原状了，这时cout一下s6可以看到s6还是没有变回去的。这个原因是：

这里若想在范围for里修改，只需要加& 符号，也就是引用

for (auto& e : s6)    //这里auto自动推导为char类型，
                      //若想是char的引用，就需要主动添加一个&
//这时e就是s6里面（*it）的别名，也就是取它每个字符的别名
{
e -= 2;           //这时修改e，就修改了string里的值
cout << e << " ";
}
cout << endl;

注意：用auto声明指针类型时，用auto和auto*没有任何区别(也就是当是一个指针类型时，可以直接写auto即可），但用auto声明引用类型时则必须加上&（auto &）。

typeid().name()

typeid()可以帮助我们观察类型：

typeid(变量名).name()   //可以看到该变量的类型

int func1()
{
return 10;
}

int main()
{
int a = 10;
auto b = a;
auto c = 'a';
auto d = func1();
cout << typeid(b).name() << endl;
cout << typeid(c).name() << endl;
cout << typeid(d).name() << endl;
int x = 10;
auto y = &x;
auto* z = &x;
auto& m = x;
cout << typeid(x).name() << endl;
cout << typeid(y).name() << endl;
cout << typeid(z).name() << endl;
return 0;
}

运行结果：

这里auto使用时还需要注意一些事项：

// 编译报错:rror C3531: “e”: 类型包含“auto”的符号必须具有初始值设定项
auto e;

不能这样定义，它不知道e到底是多大，auto定义的变量类型一定是由右边的变量或者函数调用表达式的返回值推导的。

// 不能做参数
void func2(auto a) //这里就算给了缺省值也不支持的
{}

auto不能做参数类型，但auto可以做返回值。

// 可以做返回值，但是建议谨慎使用
auto func3()
{
return 3;
}

// 编译报错：error C3538: 在声明符列表中，“auto”必须始终推导为同一类型
auto cc = 3, dd = 4.0;

注意在一行里面定义，定义时要用同一类型

// 编译报错：error C3318: “auto []”: 数组不能具有其中包含“auto”的元素类型
auto array[] = { 4, 5, 6 };

auto不能定义一个数组（C++规定）

在这篇先总结一部分string的接口使用，剩下的部分接口总结使用在后续文章介绍。

制作不易,若有不足之处或出问题的地方，请各位大佬多多指教，感谢大家的阅读支持！！!

原文地址：https://blog.csdn.net/2301_80873544/article/details/143518215

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【C++】哈希表实现
下一篇：springboot第83集：理解SaaS多租户应用的架构和设计，设备介入，网关设备，安全，实时实现，序列化...

深入理解 AWS Route 53 加权路由策略：实现多区域负载均衡
在当今的云计算环境中，有效管理和分配流量对于确保应用程序的高可用性和性能至关重要。AWS Route 53 的加权路由策略提供了一个强大的工具来实现这一目标。在本文中，我们将深入探讨加权路由策略的概念
阅读更多2024-11-21
Elasticsearch：如何部署文本嵌入模型并将其用于语义搜索
如何部署文本嵌入模型并将其用于语义搜索。它使你能够生成文本的向量表示并对生成的向量执行向量相似性搜索。示例中使用的模型在上公开可用。该示例使用来自的公共数据集。它由来自 Microsoft Bing
阅读更多2024-11-21
深入理解CRC：通信可靠性的关键
循环冗余校验（CRC, Cyclic Redundancy Check）是现代数据传输和存储中不可或缺的技术，用于提高系统的可靠性和数据完整性。CRC的强大之处在于其能够高效检测并定位传输错误，确保数
阅读更多2024-11-21
低速接口项目之串口Uart开发(一)——串口UART
在 RS-232 标准中，最常用的配置是八个数据位+无奇偶校验+一个停止位，按照一个完整的字节包括一位起始位、8 位数据位、一位停止位即总共十位数据来算，要想完整的实现这十位数据的发送，就需要 11个
阅读更多2024-11-21
网络安全基础
相对性、时效性、相关性、不确定性、复杂性以及重要性等。指网络系统的硬件、软件及其系统中的数据受到保护，不因偶然的或者恶意的原因而遭受到破坏、更改、泄露，系统连续可靠正常地运行，网络服务不中断。1、机密
阅读更多2024-11-21
Docker1：认识docker、在Linux中安装docker
Docker：快速构建、运行、管理应用的工具。简单来说，帮助我们部署项目、以及项目依赖的各种组件。Docker是一个典型的运维工具。以上就是在Linux中，安装docker的全部详细过程，感兴趣就关注
阅读更多2024-11-21
基于Springboot+Vue医院急诊系统(源码+PPT+LW+调试部署)
基于Spring Boot + Vue的医院急诊系统，旨在为患者提供便捷的医院急诊服务，同时提升医院的信息化管理水平。系统分为前台和后台两部分，前台功能包括医生信息、医院病房、医院论坛、医院资讯、个人
阅读更多2024-11-21
Gin 框架中的表单处理与数据绑定
Gin框架允许注册自定义验证规则。import ("regexp"// 注册自定义验证规则})首先，根据表单的需要定义一个或多个结构体。这些结构体应该清晰地反映表单数据的结构和类型
阅读更多2024-11-21
CAAS 和 IAAS
和是两种云服务模式，分别代表不同层次的云计算服务。
阅读更多2024-11-21
Spark 分布式计算中网络传输和序列化的关系（二）
Spark 中序列化和网络传输的优化直接关系到分布式计算的整体性能。结合高效的序列化工具（如 Kryo）和合理的网络传输策略（如压缩、分区优化），可以显著提高数据处理效率。中，网络传输和序列化是数据处
阅读更多2024-11-21

C++ —— string类（上）

string的介绍

string类功能的使用介绍

constructor —— 构造

介绍使用（1）（2）（4） ：构造、拷贝构造、带参构造

介绍（3）：拷贝string类对象的一部分字符，从pos位置开始，拷贝len个字符

介绍（5）：取字符串的前n个字符拷贝

介绍（6） ：连续n个C字符初始化

介绍（7）：用迭代器区间构造

destructor —— 析构

operator= —— 赋值重载

string类对象的容量操作

reserve（） 和 resize（）

遍历及访问string所需的一些接口

operator[] —— []运算符重载

iterator —— 迭代器 （正向）

rbegin和rend

const修饰的迭代器

范围for

auto

typeid().name()

相关文章

介绍使用（1）（2）（4）：构造、拷贝构造、带参构造

介绍（6）：连续n个C字符初始化

reserve（）和 resize（）

iterator —— 迭代器（正向）