[Selenium+Pyecharts] Rastree la información de alquiler de Sydney, limpie los datos y visualícela

1. Propósito principal:

Para los estudiantes internacionales que acaban de llegar a Sydney, los precios de la vivienda no son transparentes y es fácil ser defraudados por agentes o individuos sin escrúpulos (todavía recuerdo hace unos 6 años, cuando alquilé una casa con mi hermano Shi en Sydney por primera vez). vez, costaba 930 dólares a la semana por una habitación y un baño. Me engañaron), por lo que esta aplicación puede ayudar rápidamente a los estudiantes internacionales a comprender el precio promedio de diferentes tipos de casas en una determinada zona de Sídney, como así como cuántas de cada tipo de casa se están alquilando.
Hoy en día, las fronteras de Australia están cerradas y la demanda de alquiler es cada vez menor.¿Cómo discutir nuevos alquileres con propietarios o agentes de forma razonable y fundamentada?Estos datos pueden ayudarte.

2. Implementación de funciones:

1 Los usuarios pueden consultar de forma independiente el área que desean conocer

2 Crawler la información de alquiler más reciente de hoy en esta área de Sydney, limpieza automática de datos y visualización automática

La razón para elegir Sydney Today como rastreador es que, como la plataforma china más grande de Australia, la mayoría de los propietarios e inquilinos chinos confían en Sydney Today, y los estudiantes internacionales chinos prefieren las diversas decoraciones de las casas de los propietarios chinos.

3. Visualización de código:

El comentario se agregó cuando estaba escribiendo el blog. Si hay alguna línea de código específica que no tengo clara, deje un mensaje para discutir.

from selenium import webdriver
import pandas as pd
from selenium.webdriver.common.keys import Keys
import time
from pyecharts.charts import Pie,Bar
from pyecharts import options as opts
from pyecharts.globals import ThemeType

#获取用户想要查询的信息
distinct = str(input("请输入您要查询的区域: ").lower())
times = int(input("请输入您要加载的次数: "))

class SydneyTodayRent():
	#初始化信息
    def __init__(self):
        self.url = 'https://www.sydneytoday.com/house_rent'
        self.wd = webdriver.Chrome()
        self.wd.implicitly_wait(10)
        self.distinct = distinct
        self.distinct_1 = distinct[:-1]
        self.times = times
	#打开今日悉尼
    def open(self):
        self.wd.get(self.url)
	#进行爬虫
    def input(self):
        element = self.wd.find_element_by_id('autocomplete_suburb')
        element.send_keys(self.distinct_1)
        time.sleep(2)
        element.send_keys(Keys.DOWN)
        time.sleep(1)
        element.send_keys(Keys.ENTER)
        time.sleep(1)
        for i in range(int(self.times)):
            print(f'正在进行第{i + 1}次加载')
            self.wd.find_element_by_css_selector('.btn.btn-default.btn-lg.mtg-loadmore').send_keys(Keys.ENTER)

Supongo que te gusta

Origin blog.csdn.net/weixin_52589734/article/details/113569032
Recomendado
Clasificación