文档中提取汉字信息

版权声明:本文为博主手工码字内容,未经许可谢绝转载。 https://blog.csdn.net/qitianjin/article/details/80586750
匹配双字节字符(包括汉字在内):[^x00-xff] 

html = ''' 西藏自治区拉萨市柳梧大桥常体国家级政府采购专业网站服务热线: 400-810-1996 PPP 频道当前位置:首页 ;»; 政采公告 ;»; 地方公告 ;»; 中标公告西藏自治区拉萨市柳梧大桥常规定期检查项目中标公告 2018 05 07 23:33 来源:公告信息:采购项目名称西藏自治区拉萨市柳梧大桥常规定期检查项目品目服务 / 专业技术服务 / 其他专业技术服务采购单位拉萨市市政工程养护管理处行政区域拉萨市公告时间 2018 05 07 23:33 本项目招标公告日期 2018 04 09 日中标日期 2018 05 04 日评审专家名单康红莉、董玲、旺久、杨金秀、扎西拉旺总中标金额¥ 310.788 万元(人民币)联系人及联系方式:项目联系人王先生项目联系电话 12 采购单位拉萨市市政工程养护管理处采购单位地址拉萨市市政工程养护管理处采购单位联系方式王先生 12 代理机构名称重庆天骄工程项目管理有限公司代理机构地址拉萨市色拉北路慈松塘公园湖岸胜景 3 楼代理机构联系方式王先生 15287191 附件:附件 10507 中标公示 .doc   重庆天骄工程项目管理有限公司受拉萨市市政工程养护管理处的委托,就 西藏自治区拉萨市柳梧大桥常规定期检查项目 项目(项目编号: TJ27389127498 )组织采购,评标工作已经结束,中标结果如下: ; 一、项目信息项目编号: TJ2018007 项目名称:西藏自治区拉萨市柳梧大桥常规定期检查项目项目联系人:王先生联系方式: 135622; 二、采购单位信息采购单位名称:拉萨市市政工程养护管理处采购单位地址:拉萨市市政工程养护管理处采购单位联系方式:王先生 135622; 三、项目用途、简要技术要求及合同履行日期:对柳梧大桥桥梁外观检测、索力检测、裂缝检测、锚头专项检测、技术状况评估等(具体详见招标文件项目需求) ; 四、采购代理机构信息采购代理机构全称:重庆天骄工程项目管理有限公司采购代理机构地址:拉萨市色拉北路慈松塘公园湖岸胜景 3 楼采购代理机构联系方式:王先生 15284867191; 五、中标信息招标公告日期: 2018 04 09 日中标日期: 2018 05 04 日总中标金额: 310.788 万元(人民币)中标供应商名称、联系地址及中标金额:中标单位:中设设计集团股份有限公司单位地址:南京市秦淮区紫云大道 9 号中 ; ; 价: 3107880.00 元(人民币) ; ;;;;; 写:叁佰壹拾万零柒仟捌佰捌拾元整 ;; 本项目招标代理费总金额: 3.318668 万元(人民币)本项目招标代理费收费标准:按 1980 号文 ; 评审专家名单:康红莉、董玲、旺久、杨金秀、扎西拉旺 ; 中标标的名称、规格型号、数量、单价、服务要求:对柳梧大桥桥梁外观检测、索力检测、裂缝检测、锚头专项检测、技术状况评估等(具体详见招标文件项目需求) ; 六、其它补充事宜 ;; 相关公告 ©1999-varmyDate=newDate();document.write(myDate.getFullYear());2018 中华人民共和国财政部版权所有 | 联系我们 | 意见反馈 | ICP 10046031 -10
'''
re_str = r'( 项目编号: | 项目编号 :| 文件编号 :)' + r'[a-zA-Z\[\]0-9-_]+'
print re_str
ret = re.search(re_str , html)
print ret
if ret:
project_code = ret.group( 0)
print project_code


project_code = ''
re_str = r'( 项目编号 | 文件编号 )'+ r'[a-zA-Z\[\]0-9-_ :]+'

ret = re.search(re_str , html)
if ret:
project_code = ret.group( 0)
print project_code
project_code = project_code.replace( ' 项目编号 ' , '')
project_code = project_code.replace( ' 文件编号 ' , '')
project_code =project_code.replace( ':' , '').replace( ' ' , '')
project_code = project_code.replace( '(' , '').replace( ')' , '')

else:
print( 'haha'+ ' \n ')

print project_code


猜你喜欢

转载自blog.csdn.net/qitianjin/article/details/80586750