在 C++ 中标记字符串与getline() 函数和字符数组

「这是我参与11月更文挑战的第18天,活动详情查看:2021最后一次更文挑战

在 C++ 中标记字符串

对字符串进行标记表示根据某些分隔符拆分字符串。有很多方法可以对字符串进行标记。在这篇文章中解释了其中的四个:

使用字符串流

一个字符串流与允许你从字符串,就好像它是一个流中读取流的字符串对象关联。
下面是 C++ 实现:

#include <bits/stdc++.h>

using namespace std;

int main()
{
	
	string line = "juejin is a must try";
	vector <string> tokens;
	stringstream check1(line);	
	string intermediate;
	while(getline(check1, intermediate, ' ')){
		tokens.push_back(intermediate);
	}

	for(int i = 0; i < tokens.size(); i++)
		cout << tokens[i] << '\n';
}
复制代码

输出

juejin
is
a
must
try
复制代码

使用strtok()

// 根据给定的分隔符拆分 string[]。 并返回下一个令牌。 它需要在循环中调用以获取所有令牌。 当没有更多标记时,它返回 NULL。
char * strtok(char str[], const char *delims); 
复制代码

下面是 C++ 实现:

#include <stdio.h>
#include <string.h>

int main(){
	char str[] = "juejin-for-juejin";
	char *token = strtok(str, "-");
	while (token != NULL){
		printf("%s\n", token);
		token = strtok(NULL, "-");
	}
	return 0;
}
复制代码

输出

juejin
for
juejin
复制代码

strtok() 的另一个例子:

#include <string.h>
#include <stdio.h>

int main(){
	char gfg[100] = " juejin - for - juejin - Contribute";
	const char s[4] = "-";
	char* tok;
	tok = strtok(gfg, s);
	while (tok != 0) {
		printf(" %s\n", tok);
		tok = strtok(0, s);
	}
	return (0);
}
复制代码

输出

juejin 
for 
juejin
Contribute
复制代码

使用strtok_r()

就像 C 中的 strtok() 函数一样,strtok_r() 执行相同的任务,将字符串解析为标记序列。strtok_r() 是 strtok() 的可重入版本。
我们可以通过两种方式调用 strtok_r()

下面是一个简单的 C++ 程序来展示 strtok_r() 的使用:

#include<stdio.h>
#include<string.h>

int main(){
	char str[] = "juejin for juejin";
	char *token;
	char *rest = str;
	while ((token = strtok_r(rest, " ", &rest)))
		printf("%s\n", token);

	return(0);
}
复制代码

输出

juejin
for
juejin
复制代码

使用 std::sregex_token_iterator

在这种方法中,标记化是在正则表达式匹配的基础上完成的。更适合需要多个分隔符的用例。

下面是一个简单的 C++ 程序,用于展示 std::sregex_token_iterator 的使用:

#include <iostream>
#include <regex>
#include <string>
#include <vector>

std::vector<std::string> tokenize(const std::string str,const std::regex re){
	std::sregex_token_iterator it{ str.begin(),str.end(), re, -1 };
	std::vector<std::string> tokenized{ it, {} };
	tokenized.erase(std::remove_if(tokenized.begin(),tokenized.end(),[](std::string const& s) {
            return s.size() == 0;
            }),
	tokenized.end());
	return tokenized;
}


int main(){
	const std::string str = "将 字符串 分隔,为,空格,和逗号";
	const std::regex re(R"([\s|,]+)");
	const std::vector<std::string> tokenized = tokenize(str, re);
	for (std::string token : tokenized) std::cout << token << std::endl;
	return 0;
}
复制代码

输出

将
字符串
分隔
为
空格
和逗号
复制代码

getline() 函数和字符数组

在C++中,流类支持面​​向行的函数,getline()和write()分别执行输入和输出功能。getline() 函数读取以新行结尾或直到达到最大限制的整行文本。getline() 是 istream 类的成员函数,语法如下:

//(缓冲区,流大小,分隔符)
istream& getline(char*, int size, char='\n')

// 分隔符被视为'\n'
istream& getline(char*, int size)
复制代码

该函数执行以下操作:

  1. 提取字符直到分隔符。
  2. 将字符存储在缓冲区中。
  3. 提取的最大字符数为 size – 1。

注意终止符(或分隔符)可以是任何字符(如' '、'、' 或任何特殊字符等)。终止符被读取但不保存到缓冲区中,而是由空字符替换

// 用字符数组显示 getline() 的 C++ 程序
#include <iostream>
using namespace std;

int main()
{
	char str[20];
	cout << "Enter Your Name::";

	// 查看 getline() 与数组 str 的使用也将上述语句替换为 cin >> str 并查看输出的差异
	cin.getline(str, 20);

	cout << "\n你的名字是: " << str;
	return 0;
}
复制代码

输入 :

鲸落
复制代码

输出 :

你的名字是: 鲸落
复制代码

在上面的程序中,语句 cin.getline(str, 20) 读取字符串,直到遇到换行符或最大字符数(此处为 20)。尝试具有不同限制的函数并查看输出。

Guess you like

Origin juejin.im/post/7035161040836886536