#coding:utf-8 #Author:zhang string='<div class="item-list ni-list"><ul><li class="first"><a href="http://www.tepintehui.com/detail/57185?ce" title="明星同款| 钟基欧巴穿的小脏鞋5折辣!" ><span>明星同款| 钟基欧巴穿的小脏鞋5折辣!</span></a></li><li><a href="http://www.tepintehui.com/detail/56847?ce" title="装逼| 你们见过凌晨四点钟的洛杉矶吗?" ><span>装逼| 你们见过凌晨四点钟的洛杉矶吗?</span></a></li><li ><a href="http://www.tepintehui.com/detail/57127?ce" title="反人类| 世界上最干净的纸竟然是黄色的!" ><span>反人类| 世界上最干净的纸竟然是黄色的</span></a></li><li><a href="http://www.tepintehui.com/detail/57120?ce" title="科普| 吃了避孕药之后怀的孩子能要吗?" ><span>科普| 吃了避孕药之后怀的孩子能要吗?</span></a></li><li><a href="http://www.tepintehui.com/detail/57125?ce" title="真假| 9年义务升为12年制,是要取消高考吗" ><span>真假| 9年义务升为12年制,是要取消高考吗</span></a></li><li><a href="http://www.tepintehui.com/detail/57124?ce" title="土豪| 揭秘迪士尼见不得光的33号俱乐部" ><span>土豪| 揭秘迪士尼见不得光的33号俱乐部</span></a></li><li ><a href="http://www.tepintehui.com/detail/41008?ce" title="吐槽| 男人单身太久会没感觉?" ><span>吐槽| 男人单身太久会没感觉?</span></a></li><li ><a href="http://www.tepintehui.com/detail/23488?ce" title="冷知识| 为什么镜子是左右颠倒不是上下呢" ' #声明两个变量,记录要查找的起始字符串和终止字符串 start_mark='href="' end_mark="?ce" #声明用于记录每次查找位置的变量,初始值就是索引为0的字符 record_position=0 while record_position<len(string): #先确定下href="这段字符所在起始索引值 start_index=string.find(start_mark,record_position) print(start_index) if start_index==-1: print('没有找到') break #因为使用find找到的是start_mark的'h'这个字母的索引值,还有end_mark的?这个索引值 end_index=string.find(end_mark,start_index) print(end_index) url=string[start_index+len(start_mark):end_index+len(end_mark)] record_position=end_index print(url)
网址提取
猜你喜欢
转载自blog.csdn.net/h1131057908/article/details/81037967
今日推荐
周排行