人脸识别测试数据分析

一个人脸识别研究小组对若干名学生做了人脸识别的测试，将测试结果写入到一个文件 dir_50.txt 中，每一行是一张照片的识别结果+“_照片编号”+“.jpg”的字符串组合，示例如下：

['1709020621', '0']_116.jpg
['1709020621']_115.jpg
['1770603107', '1770603105', '0', '0']_1273.jpg

其中，识别结果是一个列表形式的字符串，方括号中是识别出的学生学号字符串，如果识别出了照片中的多个人，就会包含多个学号字符串；如果检测到了一个人脸但没有识别出学号，则以字符串‘0’表示；测试过程中，一个学生可能被抓拍到多张照片中，所以学生的学号会出现在多行信息中。‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬
使用字典和列表进行数据分析，获取实际参加测试的学生人数和人均被检测次数。‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬
（1）读入 dir_50.txt 文件的内容，处理每一行信息。将其中的学号内容以列表形式保存，丢掉‘0’的字串；照片编号作为字典的关键字，学号列表作为字典的值。转换后示例如下：

'116':[1709020621]
'115':[1709020621]
'117':[1709020621]
'1273':[1770603107,1770603105]

（2）将该字典中的学号提取出来，构造另一个字典，以学号作为字典的关键字，累计学号出现的次数，将累计值作为字典的值。格式示例如下：

'1709020621':3
'1770603107':1
'1770603105':1

（3）累计字典中关键字的个数，即为实际参加测试的学生人数；累加每个关键字对应的值，即为所有学号测试次数；所有学号测试次数与实际测试人数之比，即为人均被测次数。将实际参加测试人数和人均被测次数显示输出在屏幕上。
示例1:

输入: 从文件dir_50.txt读入
输出: "实际参加测试的人数是：11"
"人均被测次数是：2.5"

解答：
方法一

f=open('dir_50.txt','r',encoding='utf-8')
lines=f.readlines()
f.close()
d={}
for line in lines:
    line=line.split('_')
    k=line[1][:-5]
    v=[]
    for c in eval(line[0]):
        if c !='0':
            v.append(c)
    d[k]=v #第一问结束
d1={}
for i in d:
    for j in d[i]:
        d1[j]=d1.get(j,0)+1  #第二问结束
s=0
for t in d1:
    s=s+int(d1[t])
print("实际参加测试的人数是：{}".format(len(d1)))
print("人均被测次数是：{:.1f}".format(s/len(d1)))  #第三问结束

方法二：

f=open('dir_50.txt','r',encoding='utf-8')
lines=f.readlines()
f.close()
d={}
for line in lines:
    line=line.split('_')
    k=line[1][:-5]
    v=[]
    for c in eval(line[0]):
        if c !='0':
            v.append(c)
    d[k]=v #第一问结束
d1={}
for i in d:
    for j in d[i]:
        d1[j]=d1.get(j,0)+1  #第二问结束
s=0
for t in d1:
    s=s+int(d1[t])
print("实际参加测试的人数是：{}".format(len(d1)))
print("人均被测次数是：{:.1f}".format(s/len(d1)))  #第三问结束

人脸识别测试数据分析

猜你喜欢