【C言語】文字列関数

✨作者:@ordinary person 1

✨列:「0から1までのC言語」

✨一文:過去のすべてはプロローグです

✨説明:過去は不可逆的であり、未来は変わる可能性があります


これまでに4つの関数(strlen \ strcpy \ strcat \ strcmp)を学習しましたが、これらの関数の長さは無制限です。今日は、当然、他の関数もいくつか紹介したいと思います。コンテンツは比較的大きい場合があります。

長さ制限のある文字列関数

strncpy

画像-20220707091932481

char * strncpy ( char * destination, const char * source, size_t num );
  1. ソースの最初のnum文字を宛先にコピーします。num文字がコピーされる前にソースC文字列(ヌル文字で示される)の終わりが見つかった場合、合計num文字が書き込まれるまで、宛先にゼロが埋め込まれます。
  2. ソース文字列から宛先スペースにnum文字をコピーします。
  3. ソース文字列の長さがnum未満の場合は、ソース文字列をコピーした後、numまでターゲットの末尾に0を追加します。

それでは、簡単なテストを行いましょう。

#include <stdio.h>
#include <string.h>
int main()
{
    
    
	char arr1[20] = "abcdef";
	char arr2[] = "hello world";
	strncpy(arr1, arr2, 5);
	printf("%s\n", arr1);
	return 0;
}

走る:画像-20220707093803269

上記を見てみましょうポイント3

#include <stdio.h>
#include <string.h>
int main()
{
    
    
	char arr1[20] = "abcdef";
	char arr2[] = "ghi";
	strncpy(arr1, arr2, 5);//arr2只有3个这里却要拷贝5个,这是怎么一回事呢
	printf("%s\n", arr1);
	return 0;
}

コピーする前にarr1とarr2がどのように見えるかを確認するためのF10デバッグ:画像-20220707094657476

コピーが完了した後?画像-20220707094744118

コンテンツが不足している場合は、「\0」が追加されることがはっきりとわかります。

strncat

画像-20220707095134661

char * strncat ( char * destination, const char * source, size_t num );
  1. ソースの最初のnum文字を宛先に追加し、さらに終了ヌル文字を追加します。
  2. ソース内のC文字列の長さがnum未満の場合、終了するヌル文字までのコンテンツのみがコピーされます。
#include <stdio.h>
#include <string.h>
int main()
{
    
    
	char arr1[20] = "hello\0xxxxx";
	printf("%s\n", arr1);
	char arr2[] = "world";
	strncat(arr1, arr2, 3);
	printf("%s\n", arr1);
	return 0;
}

結果は誰もが知っているので、プロセスはどのようになりますか?デバッグして見てみましょう:追加する前に:

追加後:画像-20220707095641466

最後に「\0」が自動的に追加されることがはっきりとわかります

追加の長さがそれ自体よりも長い場合はどうなりますか?strncpyと同じ数の「\0」を構成しますか?コードの一部をテストします。

#include <stdio.h>
#include <string.h>
int main()
{
    
    
	char arr1[20] = "hello\0xxxxx";
	printf("%s\n", arr1);
	char arr2[] = "abc";
	strncat(arr1, arr2, 6);
	printf("%s\n", arr1);
	return 0;
}

追加する前に:画像-20220707100015102

追加後:画像-20220707100040572

答えはノーです。「\0」を追加するだけです。簡単な分析を通して、おそらくstrncatの原理も知っています。

strncmp

画像-20220707100258557

int strncmp ( const char * str1, const char * str2, size_t num );

別の文字が異なるか、文字列が終了するか、すべてのnum文字が比較されるまで比較します。

#include <stdio.h>
#include <string.h>
int main()
{
    
    
	char arr1[] = "abcdef";
	char arr2[] = "abc";
	int ret = strncmp(arr1, arr2, 4);
	printf("%d\n", ret);
	if (ret == 0)
	{
    
    
		printf("==\n");
	}
	else if (ret < 0)
	{
    
    
		printf("<\n");
	}
	else
	{
    
    
		printf(">\n");
	}
	return 0;
}

画像-20220707101140742

実際、これらの関数のnが多いほど、長さの制限が大きくなり、違いはあまりありません。長さを制限する文字列関数を使用すると、コードがより厳密になり、可能な限り使用するようになります。

文字列ルックアップ

strstr

画像-20220707101413372

char * strstr ( const char *str1, const char * str2);

str1で最初に出現するstr2へのポインタを返します。また、str2がstr1の一部でない場合はnullポインタを返します。

簡単に理解すると、この関数は部分文字列を見つける関数です

#include <stdio.h>
#include <string.h>
int main()
{
    
    
	char email[] = "[email protected]";
	char substr[] = "eichang";
	char*ret = strstr(email, substr);
	if (ret == NULL)
	{
    
    
		printf("子串不存在\n");
	}
	else
	{
    
    
		printf("%s\n", ret);
	}
	return 0;
}

画像-20220707101942440

それはそれをどのように使うかということではなく、それをどのようにシミュレートするかということです!

strstrの模擬実装

最初に検索プロセスについて説明しましょう。

説明のために2つのケースに分けることができます。

1つは単純なケースです。1つの一致が見つかります

もう1つは、より複雑な状況です。最初の一致が見つからず、現在の位置を記録する必要があり、一致を続行し、それを見つけるために何度も検索する必要があります。

画像-20220707103859541

以下は、単純なシミュレーションの実装です。

#include <assert.h>
#include <stdio.h>
char*my_strstr(const char*str1,const char*str2)
{
    
    
	assert(str1 && str2);
	const char* s1 = str1;
	const char* s2 = str2;
	const char* p = str1;
	while (*p)
	{
    
    
		s1 = p;
		s2 = str2;
		while (*s1!='\0'&&*s2!='\0'&&* s1 == *s2)
		{
    
    
			s1++;
			s2++;
		}
		if (*s2 == '\0')
		{
    
    
			return (char*)p;
		}
		p++;
	}
	return NULL;
}

int main()
{
    
    
	char email[] = "[email protected]";
	char substr[] = "eichang";
	//char*ret = strstr(email, substr);
	char* ret = my_strstr(email, substr);
	if (ret == NULL)
	{
    
    
		printf("子串不存在\n");
	}
	else
	{
    
    
		printf("%s\n", ret);
	}
	return 0;
}

サブストリングの検索は、KMPアルゴリズムを使用して実装できますが、より複雑であるため、ここでは説明しません。

strtok

画像-20220707105048477

char * strtok ( char * str, const char * sep );

sepパラメーターは、区切り文字として使用される文字のセットを定義する文字列です。

最初の引数は、sep文字列内の1つ以上の区切り文字で区切られた0個以上のトークンを含む文字列を指定します。

strtok関数は、str内の次のトークンを検索し、\ 0で終了して、このトークンへのポインターを返します。(注:strtok関数は操作される文字列を変更するため、strtok関数によってセグメント化された文字列は通常、一時コピーの内容であり、変更できます。)

strtok関数の最初のパラメーターはNULLではなく、関数はstr内の最初のトークンを検索し、strtok関数は文字列内のその位置を保存します。

strtok関数の最初のパラメーターはNULLであり、関数は同じ文字列内の保存された位置から開始し、次のトークンを探します。

文字列にトークンが存在しない場合は、NULLポインタを返します。

これは奇妙な機能だと思いますが、それが文字列を切断することを私たちが知ることを妨げるものではありません

#include <stdio.h>
#include <string.h>
int main()
{
    
    
	const char* sep = "@.";
	char email[] = "[email protected]";
	char cp[30] = {
    
     0 };
	strcpy(cp, email);

	char*ret = strtok(cp, sep);
	printf("%s\n", ret);
	ret = strtok(NULL, sep);
	printf("%s\n", ret);
	ret = strtok(NULL, sep);
	printf("%s\n", ret);
	return 0;
}

画像-20220707105512359

forループとの接続方法❓

#include <stdio.h>
#include <string.h>
int main()
{
    
    
	const char* sep = "@.";
	char email[] = "[email protected]";
	char cp[30] = {
    
     0 };
	strcpy(cp, email);

	char* ret = NULL;
	for (ret = strtok(cp, sep); ret != NULL; ret = strtok(NULL, sep))
	{
    
    
		printf("%s\n", ret);
	}
	return 0;
}

エラーメッセージレポート

ストラー

画像-20220707105848512

char * strerror ( int errnum );

エラーコードと対応するエラーメッセージを返します。

#include <stdio.h>
#include <string.h>
int main()
{
    
    
	printf("%s\n", strerror(0));
	printf("%s\n", strerror(1));
	printf("%s\n", strerror(2));
	printf("%s\n", strerror(3));
	printf("%s\n", strerror(4));
	printf("%s\n", strerror(5));
}

画像-20220707110144327

これらは、error-C言語によって設定されたグローバルエラーコードが変数に格納されていることを覚えておく必要はありません。

例えば:

#include <stdio.h>
#include <string.h>
int main()
{
    
    
    FILE* pf = fopen("test.txt", "r");
	if (pf == NULL)
	{
    
    
		printf("%s\n", strerror(errno));
		return 1;
	}
	else
	{
    
    

	}

    return 0;
}

画像-20220707110347132

文字分類機能

これらの関数は非常に多く、散在しているため、例を1つずつ説明しません。ここでは、これらの関数を理解し、自分で練習することができます。

引数が次の条件を満たす場合、関数はtrueを返します

iscntrl任意の制御文字

isspace空白文字:スペース''、フォームフィード'\ f'、改行'\ n'、キャリッジリターン'\ r'、タブ'\t'または垂直タブ'\ v'

isdigit 10進数0〜9 isxdigit 16進数(すべての10進数を含む)、小文字a f、大文字A F

is小文字の小文字a〜z

isupper大文字A〜Z

isalpha文字azまたはAZ

isalnumの文字または数字、a z、A Z、0〜9

ispunct句読点、数字または文字ではない任意のグラフィック文字(印刷可能)

任意のグラフィック文字をisgraph

グラフィック文字や空白を含む、入力可能な文字をisprintします。

#include <stdio.h>
#include <ctype.h>
int main()
{
    
    
    int i = 0;
    char str[] = "Test String.\n";
    char c;
    while (str[i])
    {
    
    
        c = str[i];
        if (isupper(c))
            c = tolower(c);
        putchar(c);
        i++;
    }
    return 0;
}

画像-20220707111234962


おすすめ

転載: blog.csdn.net/weixin_60478154/article/details/125655565