Python作业(四)

 1 import jieba
 2 str1 = input('请输入一段汉字\n')
 3 temp=jieba.cut(str1)
 4 dict={}
 5 for i in temp:
 6     if(len(i)==2):
 7         dict[i]=dict.get(i,0)+1
 8 top=0
 9 for k in sorted(dict,key=dict.__getitem__,reverse=True):
10     if top==10:break
11     print(k+"---------"+str(dict[k]))
12     top=top+1

1. 任意给定一个长度不小于100个汉字的字符串,统计每个长度为2的词语出现的次数,并按出现次数降序输出出现次数最多的10个词语。

2.任意给定一个包含HTML标记的字符串,输出其中涉及的HTML标签。

   如,输入的字符串为下面的字符串,则输出为:html,head,meta,title,body

<html lang="en">
 <head>
  <meta name="Author" content="山东理工大学计算机学院">
  <meta name="Keywords" content="计算机,大数据,新工科,创新班">
  <meta name="Description" content="软件1805是山东理工大学新工科建设试点班级">
  <title>山东理工大学新工科建设</title>
 </head>
 <body>
  
 </body>
</html>

猜你喜欢

转载自www.cnblogs.com/Angfe/p/11855196.html