Python | 単語頻度統計と関係マッピングを実現するための辞書取得メソッドの賢明な使用

Python 辞書には多くの組み込み関数とメソッドがあり、その中で get() メソッドは最も基本的で一般的なクエリ メソッドであり、複数のシナリオで柔軟に使用できます。
get() メソッドは構文
dict.get(key[, value]) を使用し、指定されたキー (key) の値を返します。

パラメータ 説明する
見つけられる鍵(key)
価値 オプションのパラメータで、指定されたキーの値が存在しない場合、その値(value)を返します。value のデフォルト値は None なので、このメソッドを使用して指定されたキーの値を検索すると、指定されたキーが存在しない場合でも、プログラムは例外を報告せず、None を返します。

Python 辞書の get() の使用法によると、単語の頻度統計や単純な関係マッピングによく使用されます。
1. 単語頻度統計の実装
単語頻度統計とは、その名の通り、サンプル中に特定の単語やフレーズなどが出現する回数をカウントするもので、テキストを分割した後によく使われます。
例: 既存のリスト (a_list) 内の各単語の出現数をカウントします。

# 词频统计
a_list = ['西瓜', '苹果', '香蕉', '西瓜', '苹果', '梨子', '梨子', '梨子']
a_count = {
    
    }
for a_key in a_list:
    a_count[a_key] = a_count.get(a_key, 0) + 1
print('词频统计结果:\n', a_count)

ここに画像の説明を挿入します
分析: a_count.get(a_key, 0)、a_key に従って対応する値と一致します。キー a_key が存在しない場合は、0 が返されます。
注: 単語の頻度をカウントして並べ替えるには、上記のコードを次のように変更できます。

# 词频统计并排序
a_list = ['西瓜', '苹果', '香蕉', '西瓜', '苹果', '梨子', '梨子', '梨子']
a_count = {
    
    }
for a_key in a_list:
    a_count[a_key] = a_count.get(a_key, 0) + 1  # 计数
a_count = sorted(a_count.items(), key=lambda x: x[1], reverse=True)  # 排序,返回列表格式数据
a_count = dict(a_count)  # 转换为字典格式
print('词频统计并排序:\n', a_count)

ここに画像の説明を挿入します
辞書のソート方法については、https://blog.csdn.net/LHJCSDNYL/article/details/122525942を参照してください。

2. 単純なリレーショナル マッピング ディクショナリ
の「キーと値のペア」形式に従って、いくつかの単純なリレーショナル マッピングを処理するために使用できます。
例: 中国語と英語のマッピングを実装し、中国語を入力して英語の結果を取得する

# 实现关系映射
a_zh = ['西瓜', '苹果', '梨子']
b_en = ['watermelon', 'apple', 'pear']
a_dict = dict(zip(a_zh, b_en))
while 1:
    a_key = input('输入中文名:')
    print('英文名为:', a_dict.get(a_key))

ここに画像の説明を挿入します
注: 上記の関係マッピングは単なる例であり、実際に判断や選択などを行うために使用できます。ただし、マッピング関係を構築するためには、辞書マッピング関係が構築されていることが前提となり、例えば上記の例では、中国語と英語の比較辞書が構築される。
辞書の構築方法については、https://blog.csdn.net/LHJCSDNYL/article/details/122294020を参照してください。

上記は、辞書 get() メソッドの 2 つの一般的な使用シナリオです。

WeChat で [One Code] をフォローすると、Python および mysql 関連の問題の解決策について詳しく知ることができます。
-終わり-

おすすめ

転載: blog.csdn.net/LHJCSDNYL/article/details/126293039