n_gram算法词共现矩阵 python实现

看下结果:

代码

import pandas as pd
def gx_matrix(vol_li):
    # 整合一下,输入是df列,输出直接是矩阵
    names = locals()
    all_col0 = []   # 用来后续求所有字段的集合
    for row in vol_li:
        all_col0 += row
        for each in row:  # 对每行的元素进行处理,存在该字段字典的话,再进行后续判断,否则创造该字段字典
            try:
                 for each1 in row:  # 对已存在字典,循环该行每个元素,存在则在已有次数上加一,第一次出现创建键值对“字段:1”
                    try:
                           names['dic_' + each][each1] = names['dic_' + each][each1] + 1  # 尝试,一起出现过的话,直接加1
                    except:
                           names['dic_' + each][each1] = 1  # 没有的话,第一次加1
            except:
                  names['dic_' + each] = dict.fromkey

猜你喜欢

转载自blog.csdn.net/qq_38735017/article/details/125576333
今日推荐