爬虫09-双色球

import requests
import re

html = requests.get('http://zst.aicai.com/ssq/openInfo/').content.decode('utf-8', 'ignore')
pattern = re.compile('<td.*?>(.*?)</td>.*?<td.*?>(.*?)</td>.*?<td.*?class="redColor sz12".*?>(.*?)</td>.*?<td.*?class="redColor sz12".*?>(.*?)</td>.*?<td.*?class="redColor sz12".*?>(.*?)</td>.*?<td.*?class="redColor sz12".*?>(.*?)</td>.*?<td.*?class="redColor sz12".*?>(.*?)</td>.*?<td.*?class="redColor sz12".*?>(.*?)</td>.*?<td.*?class="blueColor sz12".*?>(.*?)</td>.*?<td.*?>(.*?)</td>.*?<td.*?class="redColor sz12".*?>(.*?)</td>.*?<td.*?>(.*?)</td>.*?<td.*?>(.*?)</td>.*?<td.*?>(.*?)</td>.*?<td.*?>(.*?)</td>', re.S | re.M)
result = re.findall(pattern, html)
print(result)

猜你喜欢

转载自blog.csdn.net/qwerLoL123456/article/details/83515078