python利用交集计算词类标签的分类

在词分类中经常有以下标签:
'ab','ba','','13','1','3','bc3','ab24'
那么,如何将这些标签归入各标签的子类中呢?

mystr=['ab','ba','','13','1','3','bc3','ab24']
myl=dict()
for k1 in mystr:
    for k2 in mystr:
        if len(set(k1).intersection(k2))==len(set(k1)) :
            myl.setdefault(k1,[]) 
            myl[k1].append(k2)
print(myl)

{'ab': ['ab', 'ba', 'ab24'], 'ba': ['ab', 'ba', 'ab24'], '': ['ab', 'ba', '', '13', '1', '3', 'bc3', 'ab24'], '13': ['13'], '1': ['13', '1'], '3': ['13', '3', 'bc3'], 'bc3': ['bc3'], 'ab24': ['ab24']}

猜你喜欢

转载自blog.51cto.com/13959448/2316086
今日推荐