自学内容网 自学内容网

C++实现字符串 trim,C++实现字符串split, C++如何分割字符串为数组,C++如何去除字符串两边的空格

C++ 开发时,一般都会用到STL,但STL里的std::string 里并没有内建的trim函数用于去除字符串两边的空白,同时也没有将某个字符串分割成字符串数组的内置函数。笔者零时需要一个这样的函数,自己编写了一个,现分享如下:

一、C++实现字符串 trim

      去除字符串两边的空白,空白包括 空格(0x20)与 tab字符(\t),函数实现如下:

#include<string>

void trim(std::string& str)
{
size_t size = str.size();

if (size == 0)
return;

const char * data = str.data();
size_t first = 0;
while (first < size) {
if (data[first] == ' ' || data[first] == '\t')
first++;
else
break;
}

if (first == size) {
str = "";
return;
}

size_t last = size -1;
while (last > first) {
if (data[last] == ' ' || data[last] == '\t')
last--;
else
break;
}

if (first == 0 && last == size - 1)
return;

str = str.substr(first, last - first + 1);
}

 这个函数在必要时修改原字符串,为了避免参数传递时重复调用std::string构造函数,需要用引用传递参数,即修改原字符串。如果字符串两边没有空白,则原字符串不做任何修改,这是符合要求的。函数返回值为 void,而不是 std::string ,这样可以避免重复调用std::string构造函数。

二、C++实现字符串split

在javascript、php与python等语言中,都有一个字符串的分割函数,将字符串分割成一个字符串列表,笔者实现的代码如下:

#include<string>
#include<vector>

size_t str_split(const std::string& s, std::vector<std::string>& tokens, char delimiter = ' ', bool use_trim=true)
{
tokens.clear();
size_t begin_pos = s.find_first_not_of(delimiter, 0);

while (begin_pos != std::string::npos) {
size_t end_pos = s.find(delimiter, begin_pos);
std::string token = s.substr(begin_pos, end_pos - begin_pos);

if (use_trim) {
trim(token);
}

if (!token.empty())
tokens.emplace_back(token);

if (end_pos != std::string::npos)
begin_pos = s.find_first_not_of(delimiter, end_pos + 1);
else
break;
}

return tokens.size();
}

该函数通过参数 delim 来指定分割字符,如果传入一个非空的字符串,函数会返回一个字符串数组。函数有一个参数 use_trim 用来指定是否为分割得到的结果去除空白字符,这在处理用户的不规范输入时特别有用,例如用户输入一个形如"abc |  123  | hkj  "的字符串,在每一个分割符左右都有空格,而计算结果可能需要去除,str_split 正好能满足要求。

三、调用示例:

#define TEST_COUNT 1000

void test_str_split()
{
std::string str = "ABC|| CDE | \t123|  456 || 789|";

std::vector<std::string> tokens1;

str_split(str, tokens1, '|');
    std::cout << "strlist:" << tokens1.size() << " " << std::endl;

str = "|| CDE|";
str_split(str, tokens1, '|');
    std::cout << "strlist:" << tokens1.size() << " " << std::endl;

str = "  CDE|";
str_split(str, tokens1, '|');
    std::cout << "strlist:" << tokens1.size() << " " << std::endl;

str = "ABC|| CDE | \t123|  456 || 789|vvv|ddd|ccc|eff|zzz|||";
str_split(str, tokens1, '|', false);
    std::cout << "strlist:" << tokens1.size() << " " << std::endl;
}


原文地址:https://blog.csdn.net/ababab12345/article/details/142798428

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!