admin管理员组

文章数量:1794759

【C++】string类(接口使用详解 上)

string的学习会分为两个大步骤,第一步就是会使用string,第二部是模拟实现string。这篇文章我们介绍一下string类以及它的使用。string大概有一百多个接口,我们需要重点掌握的就十几二十个。string其实就是字符串,严格来说string类是一个管理字符串的类,它就是一个字符顺序表。

1.标准库中的string类

下面是string类的文档介绍。

cplusplus/reference/string/string/?kw=string

/?kw=string

使用 string 类时,必须包含 #include头文件( #include <string> )以及using namespace std ;

这里先大致说一下前面提供的文档怎么看。

顺便提一句

string其实是typedef出来的,原型是basic_string<char>,除了char类型其实还有其他的,只是不常用,了解一下即可。

2.string类的常用接口说明

2.1 string类对象的常见构造

文档里C++98就提供了7种构造函数接口,重点有三个。

我们现在把这三种方式使用一下。

代码语言:javascript代码运行次数:0运行复制
#include <iostream>
#include <string>  //头文件
using namespace std;
int main()
{
	string s1; //默认构造
	string s2("111111"); //带参构造
	string s3(s2); //拷贝构造

	return 0;
}

string是重载了流插入和流提取的,所以是可以直接用的。

代码语言:javascript代码运行次数:0运行复制
string s1; //默认构造
string s2("111111"); //带参构造
string s3(s2); //拷贝构造

cout << s2 << endl;  //流提取
cout << s3 << endl;

cin >> s1; //流插入
cout << s1 << endl;

输入中文也可以。

2.2 其他构造函数(简单介绍)

来看(3)string (const string& str, size_t pos, size_t len = npos); 它可以算是拷贝构造(2)的一个变型,和(2)对比着来看,(2)是全部拷贝,(3)就是拷贝一部分。

从pos这个位置开始,拷贝len的长度过去。

代码语言:javascript代码运行次数:0运行复制
string s4("hello world");
cout << s4 << endl;
//从下标是6的位置(w),拷贝5个字符
string s5(s4, 6, 5);
cout << s5 << endl;

如果len比剩余字符大,不会报错,会默认拷贝到字符串结束 。

不传第三个参数,也是默认拷贝到字符串结束 。

我们可以点进这个npos看一下是什么。

这里想表达的意思就是,字符串有多长取多长。

来看(5)string (const char* s, size_t n); 它其实可以看成(4)的变形。

取字符串s的前n个初始化。

代码语言:javascript代码运行次数:0运行复制
//取hello world的前6个字符初始化
string s6("hello world", 6);
cout << s6 << endl;

来看(6)string (size_t n, char c);

取n个c字符初始化。

代码语言:javascript代码运行次数:0运行复制
string s7(3, 'a');
cout << s7 << endl;

2.3 析构函数

string类里的析构函数是自动调用的,我们不需要管。

2.4 string类对象的容量操作

有星号的为重点。

2.4.1 size和length

size和length返回字符串有效字符长度,它们两个基本没什么区别。那为什么同样的东西有两个?这就跟C++的发展历史有关了,感兴趣的可以去了解一下,这里就不多说了。

代码语言:javascript代码运行次数:0运行复制
//获取长度
string s8("hello world");
cout << s8.length() << endl;
cout << s8.size() << endl;

我们以后经常用到的是size。

2.4.2 capacity

我们前面写的数据结构都了解过capacity的含义,所以在这里capacity也很好理解,就是容量。

这里我们可以了解一下vs编译器下如何扩容,看下面一段代码。

代码语言:javascript代码运行次数:0运行复制
void TestPushBack()
{
	string s;
	size_t sz = s.capacity();  //保存之前容量
	cout << "capacity changed: " << sz << '\n';
	cout << "making s grow:\n";
	for (int i = 0; i < 100; ++i)
	{
		s.push_back('c');
		if (sz != s.capacity()) //capacity变化了,打印一下之前的容量大小
		{
			sz = s.capacity();
			cout << "capacity changed: " << sz << '\n';
		}
	}
}
代码语言:javascript代码运行次数:0运行复制
int main()
{
	TestPushBack();
	return 0;
}

初始空间大小是15,第一次扩容,是2倍扩,从16到32,后面就是1.5倍扩。

vs下做了特殊处理,对小于16个空间时,vs把内容存到了一个_Buf里,这个buff也并不在堆上,大于16字节之后,_Buf就废弃了,vs重新在堆上开辟一块空间存数据。所以第一次扩容是二倍扩就是因为数据从一个地方到了另一个空间,后面就都是1.5倍扩容,所以整体来看,vs下的扩容是1.5倍扩。这是vs自己的设计,不同编译器的扩容不同。了解一下即可。

2.4.3 reserve和resize

频繁的扩容其实是不好的,扩容也是一种消耗。解决方法就是用reserve和resize。常用的是reverse。

reserve支持我们给一个n,提前开好空间。这里的规定就是,开的空间只能大于等于n,不能少于n。vs下选择开比100大的,别的编译器可能就是刚好开100。

这里开空间是不包含'\0'的,所以实际最少最少开101字节,但是string这个capacity返回的大小都不包含'\0'的。

提前开空间可以减少扩容。

但是reserve还有可能会缩容。这取决于编译器。

文档的意思就是:n大于或等于capacity就行,其他情况(就是小于)下capacity是否会缩小自己,是不一定的。但是capacity一定不会对string的内容和length造成影响。

n<10和n>20是确定的,前者一定不会变,capacity不会缩的小于size,后者一定会变,变成n的大小,现在不确定的就是10<n<20的情况。

在vs上验证一下。

代码语言:javascript代码运行次数:0运行复制
string s1("aaaaaaaaaaaaaaaaaa");
cout << s1.size() << endl;
cout << s1.capacity() << endl;

然后reserve一个比size(18)小的数。

代码语言:javascript代码运行次数:0运行复制
s1.reserve(17);
cout << s1.size() << endl;
cout << s1.capacity() << endl;

vs下结果不变。我们再给18到31之间的值。

vs下选择不缩小,不同的编译器处理方式会不同。我们再给比capacity(31)大的值。

vs下结果是一定会扩的大于n。

2.4.4 clear和empty

clear就是把数据清除,有的编译器可能还会把容量也清除了,一般不清容量。

直接上代码演示。

代码语言:javascript代码运行次数:0运行复制
string s1("aaaaaaaaaaaaaaaaaa");
cout << s1.size() << endl;
cout << s1.capacity() << endl;

s1.clear();
cout << s1.size() << endl;
cout << s1.capacity() << endl;

empty就是判空,这没啥多说的。

2.5 string类对象的访问及遍历操作

2.5.1 operator[]

有了operator[]我们就可以访问pos位置的字符,就像我们在使用数组。同时也方便我们对其修改。

代码语言:javascript代码运行次数:0运行复制
string s7(10, 'x');
cout << s7 << endl;

//访问下标为5的字符,并且修改它
s7[5] = 'b';
cout << s7 << endl;

数组的越界C++的检查是不确定的,有了operator[],如果我们越界访问,是一定会被检查出来的。

代码语言:javascript代码运行次数:0运行复制
string s7(10, 'x');
cout << s7 << endl;

//越界访问
s7[11] = 'b';
cout << s7 << endl;

有了[]的重载,我们就可以配合size对这个字符串进行遍历。

代码语言:javascript代码运行次数:0运行复制
//下标+[]的遍历方式
string s8("hello world");
for (int i = 0; i < s8.size(); i++)
{
	cout << s8[i] << " ";
}
cout << endl;
2.5.2 迭代器 begin+end

除了上面这种下标+[]的遍历方式,string还支持迭代器的方式进行遍历。迭代器是我们前面提到过的STL六大组件其中一个,可以用来遍历和访问容器。先看下面代码,后面会解释。

代码语言:javascript代码运行次数:0运行复制
//迭代器遍历
string s8("hello world");
string::iterator it = s8.begin();
while (it != s8.end())
{
	cout << *it << " ";
	++it;
}
cout << endl;

现在来对这几行代码进行一个解释。

迭代器提供了一种通用的访问方式,所有的容器都可以用iterator访问,所有容器都有自己的iterator。begin和end在文档的iterators这个位置。

更详细的介绍自己去文档里看一下,这里就不细说了。

2.5.3 auto和范围for

C++11里面提供的遍历方式,叫范围for,所有容器也都可以用它遍历。先看代码。

代码语言:javascript代码运行次数:0运行复制
//范围for
string s8("hello world");
for (auto ch : s8)
{
	cout << ch << " ";
}
cout << endl;

现在来解释一下这个范围for和auto。

范围for自动从s8这个容器获取每一个字符,给ch这个变量,ch变量的类型是auto,auto的意思就是自动推导,自动推导ch的类型。当然把auto换成char也可以。

只要类型匹配就行,auto就是自动匹配类型。范围for自动赋值,自动迭代,自动判断结束,它的底层就是迭代器。

这里要注意,范围for改变不影响容器的值。

代码语言:javascript代码运行次数:0运行复制
string s8("hello world");
string::iterator it = s8.begin();
while (it != s8.end())
{
	*it += 2;  //把所有字符加2
	cout << *it << " ";
	it++;
}
cout << endl;

for (char ch : s8)
{
	ch -= 2; //还原所有字符
	cout << ch << " ";
}
cout << endl;
cout << s8 << endl; //s8还原了吗??

我们一顿操作之后发现,s8在迭代器里改变了,范围for里并没有被还原。

前面说过,范围for底层就是迭代器,范围for部分的代码从迭代器角度理解就相当于我们把*it给给了ch,而ch只是string里面每个字符的拷贝,相当于ch只是一个局部变量,我们只是修改了这个局部变量,并没有修改string里面对应的字符。迭代器为什么可以修改?迭代器可以想象成是一个像指针的东西,*it就是string里的一个字符,直接修改。

如果范围for想修改s8,我们可以引用传参。如下。

代码语言:javascript代码运行次数:0运行复制
for (auto& ch : s8)  //引用传参,参数类型自动推导
{
	ch -= 2; //还原所有字符
	cout << ch << " ";
}

前面提到的三种遍历方式没特别大的区别,按需使用。

范围for遍历数组是非常方便的,如下。

代码语言:javascript代码运行次数:0运行复制
	for (auto a : arr) //不做修改 
		cout << a << " ";
    //要修改就引用传参

在这里补充2个C++11的小语法,方便我们后面的学习。

·在早期 C/C++ 中 auto 的含义是:使用 auto 修饰的变量,是具有自动存储器的局部变量,后来这个 不重要了。 C++11 中,标准委员会变废为宝赋予了 auto 全新的含义即: auto 不再是一个存储类型 指示符,而是作为一个新的类型指示符来指示编译器, auto 声明的变量必须由编译器在编译时期 推导而得·用 auto 声明指针类型时,用 auto auto* 没有任何区别,但用 auto 声明引用类型时则必须 加 &。 ·当在同一行声明多个变量时,这些变量必须是相同的类型,否则编译器将会报错,因为编译 器实际 只对第一个类型进行推导,然后用推导出来的类型定义其他变量·auto 不能作为函数的参数,可以做返回值,但是建议谨慎使用。 ·auto 不能直接用来声明数组。

2.5.4 反向迭代器rbegin

前面说到的迭代器是正向迭代器,string里还有反向迭代器rbegin。

先看一下反向迭代器的使用效果。

代码语言:javascript代码运行次数:0运行复制
//反向迭代器
string::reverse_iterator rit = s8.rbegin();
while (rit != s8.rend())
{
	cout << *rit << " ";
	rit++; //这里还是++不是--
}
cout << endl;

来解释一下反向迭代器。 只是简单像下面这样理解。

这里的rit已经不是原生指针了,指针++绝对不会是倒着加。现在我们只需要知道、会用反向迭代器就行。

还有一种情况就是const修饰的string。仔细看迭代器其实给了两种情况,拿begin举例。

普通对象返回普通迭代器,const对象返回const迭代器。const迭代器的特点就是只能读不能写。

代码语言:javascript代码运行次数:0运行复制
const string s9("hello world");
string::const_iterator cit = s9.begin();
while (cit != s9.end())
{
	cout << *cit << " ";//只读
	++cit; //自己可以改,s9不可以改
}

总结: 迭代器有4种: iterator (正向迭代器,最常见) const_iterator ( const正向迭代器) reverse_iterator (反向迭代器) const_reverse_iterator (const反向迭代器)

我的博客即将同步至腾讯云开发者社区,邀请大家一同入驻:

本次分享就到这里,拜拜~

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。 原始发表:2024-10-19,如有侵权请联系 cloudcommunity@tencent 删除c++string遍历编译器接口

本文标签: Cstring类(接口使用详解 上)