Python が気象データをクロールして視覚的に分析します。

私たちは毎日天気予報に注意を払い、今後の天気に合わせて衣服を追加したり脱いだり、旅行の手配をしたりすることができ、その日の気温、風速と風向、相対湿度、空気の質などが注目の焦点になります。今回は、Python のリクエストと BeautifulSoup ライブラリを使用して、中国気象網から当日と今後 14 日間のデータをクロールし、csv ファイルとして保存します。その後、matplotlib、numpy、pandas を使用して、データを可視化・解析して温湿度変化曲線を取得したり、大気質マップや風向レーダーマップなどの結果を取得することで、将来の気象情報を得るのに有効な手段となります。

1. データ取得

ウェブサイトへのリンクをリクエストする

まず、中国気象ネットワークの URL を確認します: http://www.weather.com.cn/weather/101280701.shtml ここで、地元の天気予報 URL にアクセスできます。さまざまな地域をクロールしたい場合は、最後の部分を変更します。市外局番は 101280701 です。前面の天気は 7 日間の Web ページを表し、weather1d は当日を表し、weather15d は次の 14 日間を表します。ここでは主に 7 日間および 14 日間の中国気象ネットワークを参照します。 requests.get() メソッドを使用して Web ページをリクエストします。アクセスが成功すると、Web ページのすべての文字列テキストが取得されます。これがリクエストのプロセスです。

def getHTMLtext(url):     
 """请求获得网页内容"""
 try:         
  r = requests.get(url, timeout = 30)         
  r.raise_for_status()         
  r.encoding = r.apparent_encoding         
  print("成功访问")         
  return r.text     
 except:         
  print("访问错误")         
  return" "

有益な情報を抽出する

ここでは、BeautifulSoup ライブラリを使用して、取得した文字列からデータを抽出しています。まず、Web ページを確認して、データを取得する必要があるタグを見つけます。

写真

7 日間のデータ情報が id="7d" の div タグに含まれており、日付、天気、気温、風速などの情報が ul タグと li タグに含まれていることがわかります。そのため、BeautifulSoup を使用して次のことができます。取得した Web ページのテキスト div タグ id="7d" を検索し、そこに含まれるすべての ul タグと li タグを見つけて、タグ内の対応するデータ値を抽出し、対応するリストに保存します。

ここで注意すべき点は、日付によっては最高気温が存在しない場合があり、データがない状況を判断して処理する必要があることです。さらに、温度の後ろにある摂氏記号、日付数値の抽出、風速テキストの抽出など、一部のデータ保存形式を事前に処理する必要があり、文字検索や文字列のスライス処理が必要になります。

def get_content(html):
"""处理得到有用信息保存数据文件"""
final = []          # 初始化一个列表保存数据
bs = BeautifulSoup(html, "html.parser")  # 创建BeautifulSoup对象
body = bs.body
data = body.find('div', {'id': '7d'})    # 找到div标签且id = 7d

以下はその日のデータをクロールします

data2 = body.find_all('div',{'class':'left-div'})
text = data2[2].find('script').string 
text = text[text.index('=')+1 :-2]   # 移除改var data=将其变为json数据
jd = json.loads(text)
dayone = jd['od']['od2']     # 找到当天的数据
final_day = []           # 存放当天的数据
count = 0
for i in dayone:
temp = []
if count <=23:
temp.append(i['od21'])     # 添加时间
temp.append(i['od22'])     # 添加当前时刻温度
temp.append(i['od24'])     # 添加当前时刻风力方向
temp.append(i['od25'])     # 添加当前时刻风级
temp.append(i['od26'])     # 添加当前时刻降水量
temp.append(i['od27'])     # 添加当前时刻相对湿度
temp.append(i['od28'])     # 添加当前时刻控制质量
#print(temp)
final_day.append(temp)
count = count +1

以下は 7 日間のデータをクロールします

ul = data.find('ul')      # 找到所有的ul标签
li = ul.find_all('li')      # 找到左右的li标签
i = 0     # 控制爬取的天数
for day in li:          # 遍历找到的每一个li
if i < 7 and i > 0:
temp = []          # 临时存放每天的数据
date = day.find('h1').string     # 得到日期
date = date[0:date.index('日')]   # 取出日期号
temp.append(date)    

inf = day.find_all('p')      # 找出li下面的p标签,提取第一个p标签的值,即天气
temp.append(inf[0].string)


    tem_low = inf[1].find('i').string   # 找到最低气温

    if inf[1].find('span') is None:   # 天气预报可能没有最高气温
        tem_high = None
    else:
        tem_high = inf[1].find('span').string  # 找到最高气温
    temp.append(tem_low[:-1])
    if tem_high[-1] == '℃':
     temp.append(tem_high[:-1])
    else:
     temp.append(tem_high)
    wind = inf[2].find_all('span')  # 找到风向
    for j in wind:
     temp.append(j['title'])
    wind_scale = inf[2].find('i').string # 找到风级
    index1 = wind_scale.index('级')
    temp.append(int(wind_scale[index1-1:index1]))
    final.append(temp)
i = i + 1

return final_day,final

/weather15d に対しても同じプロセスが実行されます: 15 日間の情報。ここを確認すると、彼の 15 日間の Web ページには 8 ~ 14 日しかないことがわかります。最初の 1 ~ 7 日間は /weather にあります。ここで訪問します。 Web ページはクロールされたデータをマージして、最後の 14 日間のデータを取得します。 - 手前は今後14日間のデータクローリング処理で、その日の24時間気象情報データは検索した結果、jsonデータであることが分かり、json.loads()で利用できます。

このメソッドは、その日のデータを取得し、その日の気象情報を抽出します。

写真

csvファイルを保存する

クロールされたデータは前にリストに追加されました。ここでは csv ライブラリが紹介され、f_csv.writerow(header) メソッドと f_csv.writerows(data) メソッドを使用して、それぞれヘッダーと各行のデータを書き込みます。ここでは、1当日と次の 14 日のデータは別々に保存され、それぞれ Weather1.csv と Weather14.csv として保存されます。保存されたテーブルは次のとおりです。

写真

写真

2. 視覚的分析

当日の気温変化グラフ

matplotlib の plt.plot() メソッドを使用して 1 日 24 時間の温度変化曲線を描画し、plt.text() メソッドを使用して最高気温と最低気温を示し、平均気温の線を描画します。は温度変化曲線です: (コードは付録を参照)

写真

この日の最高気温は33℃、最低気温は28℃、平均気温は20.4℃程度であることが時間分析により分かりました。気温は5℃、早朝は気温が低く、昼から午後にかけて気温が高くなります。

当日の相対湿度変化曲線図

matplotlib の plt.plot() メソッドを使用して、1 日 24 時間の湿度変化曲線を描画し、平均相対湿度線を描画します。次の図は、湿度変化曲線です: (コードについては付録を参照)

写真

分析の結果、この日の最高相対湿度は 86%、最低相対湿度は 58°C、平均相対湿度は約 75% であることがわかります。時間分析すると、早朝の湿度は比較的高いですが、午後から夕暮れ時は湿度が比較的低くなります。

温湿度相関分析チャート

前の 2 つの図の分析を通じて、温度と湿度の間に関係があることがわかります。この関係をより明確かつ直感的に感じるために、plt.scatter() メソッドを使用して、横軸に温度を設定し、横軸を温度に設定します。湿度を縦軸とし、グラフ上で各瞬間の点をクリックし、相関係数を計算すると下図のようになります。

写真

分析の結果、1 日の温度と湿度の間には強い相関関係があることがわかりました。それらは負の相関関係にあり、時間と負の相関があることを意味します。さらに分析すると、温度が低いほど、空気中の水分が多くなり、湿度も自然に高く、温度が高くなると水が蒸発し、空気が乾燥して湿度が低くなりますが、これは通常の気象現象と一致します。

大気質指数棒グラフ

大気質指数AQIは大気の質の状態を定量的に表す指数で、値が大きいほど大気汚染が深刻であり、人の健康への被害が大きいことを示します。大気質指数は一般に6段階に分かれており、レベルが高いほど汚染が深刻であることを示しており、以下はplt.bar法を用いて1日24時間の大気質のヒストグラムを6段階に分けてグラフ化したものです。 , 対応するヒストグラム 色も明るい色から暗い色に変化し、汚染が徐々に増加していることも示し、汚染状況をより直感的に示します。最高および最低の大気質指数もマークされ、平均大気質指数は次のように描画されます。点線で描画した結果が下図です。

写真

上の写真は南部の珠海の管理品質チャートです.最大の空気品質指数も健全な範囲にあることがわかり、珠海の空気が非常に良好であることを示しています.分析により、空気品質指数が最も高いことがわかりましたこの日は35に達しましたが、最低はわずか14、平均は25程度でした。時間の経過とともに、基本的に早朝(4時から9時)の空気が最も良く、最も深刻な空気であることがわかります。汚染は午後に発生するため、通常は早朝に外に出て新鮮な空気を吸うことができます。

下の空気質地図は北部の都市のものですが、ここの環境が珠海よりもはるかに劣っていることがわかります。

写真

風向・レベルレーダーチャート

1 日の風力と風向を数えるには、極座標を使用した方が風力と風向を表示するのが適切であるため、その日の風力と風向の図を表示するには極座標法が使用されます。 8 つの部分に分かれており、各部分は風向と半径を表し、平均的な風力を表し、風レベルが増加するにつれて青色が濃くなり、最終的な結果は次のようになります。

写真

分析の結果、この日は南西の風が最も強く、平均風速は1.75に達しましたが、北東の風も1.0レベルと少量で、その他の空白の方向には風がありません。

今後14日間の最高気温と最低気温の変化曲線図

今後 14 日間の最高気温と最低気温の変化を数え、その変化曲線を描きます。点線を使用して平均気温の線を描きます。最終的な結果は次のようになります。

写真

分析の結果、今後 14 日間の平均最高気温は 30.5°C であることがわかりました。気温はまだ比較的高いですが、今後 8 日目には寒くなるでしょう。寒さへの備えが必要です。気温は安定傾向にあり、8日目から下がり始め、最高気温とともに全体的に気温が下がり、平均最低気温は27℃前後となりました。

今後 14 日間の風向とレベルのレーダー マップ

今後 14 日間の風向と平均風力を計算し、以前と同様に極座標を使用します。円を 8 つの部分に分割し、8 つの方向を表します。色が濃いほど、風レベルが高くなります。最終結果は次のようになります。

写真

分析の結果、今後 14 日間の主な風向は南東と南西の風で、最高風速レベルはレベル 5 に達し、最も低い平均西風レベルはレベル 3 であることがわかりました。

今後 14 日間の気候分布の円グラフ

今後 14 日間の気候を数え、各気候の合計日数を求め、最後に各気候の円グラフを描画します。結果は次のようになります。

写真

分析の結果、今後14日間の気候は基本的に「雨」「曇りから雨」「にわか雨」となり、雨の日が多くなることが分かり、先ほどの気温分布図と合わせると、気温が上昇することが分かります。 8日と9日は気温が下がり、その日は雨が降ったため気温が下がったと推測されています。

3. 結論

1. まず、クロールした温湿度データを分析すると、気温は朝低く、昼は高く、夜は低くなり、湿度と気温の傾向は逆であり、相関係数により、温度と湿度には強い負の相関関係があることが分かり、データを調べてみると、温度が上昇すると水蒸気の蒸発が増加し、空気中の水分が減少して湿度が低下することが分かりました。もちろん、湿度は気圧と雨の両方の影響を受け、雨が降ると湿度は大幅に上昇します。

2. データを確認すると、大気の質は工場や自動車などから排出される煙や排気ガスだけでなく、さらに重要なことに、気象要因とも関連していることがわかります。昼夜の温度差が顕著であるため、地表温度が高地の気温よりも高い場合には、空気が上昇し、汚染物質が高地まで運ばれて拡散しやすくなりますが、地表の温度が高地の気温より低い場合には、汚染物質が高地まで運ばれて拡散しやすくなります。一定の高さになると、上空に大きな覆いのような反転層が形成されます。地上の圧力により、地表大気中のさまざまな汚染物質が拡散しにくくなります。一般にその影響は夕方から早朝に大きく、太陽が顔を出すと地面が急激に加熱され、逆転層が徐々に消失するため、汚染された大気は拡散します。

3. 風は水平方向の気圧の不均一な分布によって発生します。風は、大気循環、地形、水域などのさまざまな要因によって総合的に影響を受け、モンスーン、地方の海風や陸風、谷風などさまざまな形態をとり、風向きも一日の中でさまざまに変化します。今後14日間の風向レーダー図によると、基本的に今後のすべての風向が関係しており、特定の風向がないことがわかります。あまり変化がないので、風向きもあまり変わりません。

4. 気象とは、短期間における、特定の地域の地表近くの大気の特定の状態を指します。これは、ある瞬間における大気中のさまざまな気象要素の分布を包括的に表現したものです。 14日間の天気や気温の変化から、その時点の気候を大まかに推測することができ、天気と気温には関連性もあります。

4. コードフレームワーク

コードは主に、weather.py: China Weather Network から気象データをクロールし、csv ファイルを保存する、data1_analysis.py: その日の気象情報を視覚化する、data14_analysis.py: 今後 14 日間の気象情報を視覚化する、に分かれています。コードの構造図は次のとおりです。

写真

ソースコードを添付しました 

天気.py

# weather.py
import requests
from bs4 import BeautifulSoup
import csv
import json
def getHTMLtext(url):     
 """请求获得网页内容"""
 try:         
  r = requests.get(url, timeout = 30)         
  r.raise_for_status()         
  r.encoding = r.apparent_encoding         
  print("成功访问")         
  return r.text     
 except:         
  print("访问错误")         
  return" " 

def get_content(html):
 """处理得到有用信息保存数据文件"""
 final = []          # 初始化一个列表保存数据
 bs = BeautifulSoup(html, "html.parser")  # 创建BeautifulSoup对象
 body = bs.body
 data = body.find('div', {<!-- -->'id': '7d'})    # 找到div标签且id = 7d
 # 下面爬取当天的数据
 data2 = body.find_all('div',{<!-- -->'class':'left-div'})
 text = data2[2].find('script').string  
 text = text[text.index('=')+1 :-2]   # 移除改var data=将其变为json数据
 jd = json.loads(text)
 dayone = jd['od']['od2']     # 找到当天的数据
 final_day = []           # 存放当天的数据
 count = 0
 for i in dayone:
  temp = []
  if count &lt;=23:
   temp.append(i['od21'])     # 添加时间
   temp.append(i['od22'])     # 添加当前时刻温度
   temp.append(i['od24'])     # 添加当前时刻风力方向
   temp.append(i['od25'])     # 添加当前时刻风级
   temp.append(i['od26'])     # 添加当前时刻降水量
   temp.append(i['od27'])     # 添加当前时刻相对湿度
   temp.append(i['od28'])     # 添加当前时刻控制质量
   #print(temp)
   final_day.append(temp)
  count = count +1
 # 下面爬取7天的数据 
 ul = data.find('ul')      # 找到所有的ul标签
 li = ul.find_all('li')      # 找到左右的li标签
 i = 0     # 控制爬取的天数
 for day in li:          # 遍历找到的每一个li
     if i &lt; 7 and i &gt; 0:
         temp = []          # 临时存放每天的数据
         date = day.find('h1').string     # 得到日期
         date = date[0:date.index('日')]   # 取出日期号
         temp.append(date)            
         inf = day.find_all('p')      # 找出li下面的p标签,提取第一个p标签的值,即天气
         temp.append(inf[0].string)

         tem_low = inf[1].find('i').string   # 找到最低气温

         if inf[1].find('span') is None:   # 天气预报可能没有最高气温
             tem_high = None
         else:
             tem_high = inf[1].find('span').string  # 找到最高气温
         temp.append(tem_low[:-1])
         if tem_high[-1] == '℃':
          temp.append(tem_high[:-1])
         else:
          temp.append(tem_high)

         wind = inf[2].find_all('span')  # 找到风向
         for j in wind:
          temp.append(j['title'])

         wind_scale = inf[2].find('i').string # 找到风级
         index1 = wind_scale.index('级')
         temp.append(int(wind_scale[index1-1:index1]))
         final.append(temp)
     i = i + 1
 return final_day,final
 #print(final)    
def get_content2(html):
 """处理得到有用信息保存数据文件"""
 final = []                # 初始化一个列表保存数据
 bs = BeautifulSoup(html, "html.parser")        # 创建BeautifulSoup对象
 body = bs.body
 data = body.find('div', {<!-- -->'id': '15d'})          # 找到div标签且id = 15d
 ul = data.find('ul')            # 找到所有的ul标签
 li = ul.find_all('li')            # 找到左右的li标签
 final = []
 i = 0                 # 控制爬取的天数
 for day in li:               # 遍历找到的每一个li
     if i &lt; 8:
         temp = []               # 临时存放每天的数据
         date = day.find('span',{<!-- -->'class':'time'}).string    # 得到日期
         date = date[date.index('(')+1:-2]        # 取出日期号
         temp.append(date)  
         weather = day.find('span',{<!-- -->'class':'wea'}).string    # 找到天气
         temp.append(weather)
         tem = day.find('span',{<!-- -->'class':'tem'}).text      # 找到温度
         temp.append(tem[tem.index('/')+1:-1])     # 找到最低气温
         temp.append(tem[:tem.index('/')-1])      # 找到最高气温
         wind = day.find('span',{<!-- -->'class':'wind'}).string    # 找到风向
         if '转' in wind:           # 如果有风向变化
          temp.append(wind[:wind.index('转')])
          temp.append(wind[wind.index('转')+1:])
         else:             # 如果没有风向变化,前后风向一致
          temp.append(wind)
          temp.append(wind)
         wind_scale = day.find('span',{<!-- -->'class':'wind1'}).string    # 找到风级
         index1 = wind_scale.index('级')
         temp.append(int(wind_scale[index1-1:index1]))
          
         final.append(temp)
 return final

def write_to_csv(file_name, data, day=14):
 """保存为csv文件"""
 with open(file_name, 'a', errors='ignore', newline='') as f:
  if day == 14:
   header = ['日期','天气','最低气温','最高气温','风向1','风向2','风级']
  else:
   header = ['小时','温度','风力方向','风级','降水量','相对湿度','空气质量']
  f_csv = csv.writer(f)
  f_csv.writerow(header)
  f_csv.writerows(data)

def main():
 """主函数"""
 print("Weather test")
 # 珠海
 url1 = 'http://www.weather.com.cn/weather/101280701.shtml'    # 7天天气中国天气网
 url2 = 'http://www.weather.com.cn/weather15d/101280701.shtml' # 8-15天天气中国天气网
 
 html1 = getHTMLtext(url1)
 data1, data1_7 = get_content(html1)  # 获得1-7天和当天的数据

 html2 = getHTMLtext(url2)
 data8_14 = get_content2(html2)   # 获得8-14天数据
 data14 = data1_7 + data8_14
 #print(data)
 write_to_csv('weather14.csv',data14,14) # 保存为csv文件
 write_to_csv('weather1.csv',data1,1)

if __name__ == '__main__':
 main()

データ1_分析.py:

# data1_analysis.py
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import math
def tem_curve(data):
 """温度曲线绘制"""
 hour = list(data['小时'])
 tem = list(data['温度'])
 for i in range(0,24):
  if math.isnan(tem[i]) == True:
   tem[i] = tem[i-1]
 tem_ave = sum(tem)/24     # 求平均温度 
 tem_max = max(tem)    
 tem_max_hour = hour[tem.index(tem_max)] # 求最高温度
 tem_min = min(tem)
 tem_min_hour = hour[tem.index(tem_min)] # 求最低温度
 x = []
 y = []
 for i in range(0, 24):
  x.append(i)
  y.append(tem[hour.index(i)])
 plt.figure(1)
 plt.plot(x,y,color='red',label='温度')       # 画出温度曲线
 plt.scatter(x,y,color='red')   # 点出每个时刻的温度点
 plt.plot([0, 24], [tem_ave, tem_ave], c='blue', linestyle='--',label='平均温度')  # 画出平均温度虚线
 plt.text(tem_max_hour+0.15, tem_max+0.15, str(tem_max), ha='center', va='bottom', fontsize=10.5)  # 标出最高温度
 plt.text(tem_min_hour+0.15, tem_min+0.15, str(tem_min), ha='center', va='bottom', fontsize=10.5)  # 标出最低温度
 plt.xticks(x)
 plt.legend()
 plt.title('一天温度变化曲线图')
 plt.xlabel('时间/h')
 plt.ylabel('摄氏度/℃')
 plt.show()

def hum_curve(data):
 """相对湿度曲线绘制"""
 hour = list(data['小时'])
 hum = list(data['相对湿度'])
 for i in range(0,24):
  if math.isnan(hum[i]) == True:
   hum[i] = hum[i-1]
 hum_ave = sum(hum)/24     # 求平均相对湿度 
 hum_max = max(hum)    
 hum_max_hour = hour[hum.index(hum_max)] # 求最高相对湿度
 hum_min = min(hum)
 hum_min_hour = hour[hum.index(hum_min)] # 求最低相对湿度
 x = []
 y = []
 for i in range(0, 24):
  x.append(i)
  y.append(hum[hour.index(i)])
 plt.figure(2)
 plt.plot(x,y,color='blue',label='相对湿度')       # 画出相对湿度曲线
 plt.scatter(x,y,color='blue')   # 点出每个时刻的相对湿度
 plt.plot([0, 24], [hum_ave, hum_ave], c='red', linestyle='--',label='平均相对湿度')  # 画出平均相对湿度虚线
 plt.text(hum_max_hour+0.15, hum_max+0.15, str(hum_max), ha='center', va='bottom', fontsize=10.5)  # 标出最高相对湿度
 plt.text(hum_min_hour+0.15, hum_min+0.15, str(hum_min), ha='center', va='bottom', fontsize=10.5)  # 标出最低相对湿度
 plt.xticks(x)
 plt.legend()
 plt.title('一天相对湿度变化曲线图')
 plt.xlabel('时间/h')
 plt.ylabel('百分比/%')
 plt.show()

def air_curve(data):
 """空气质量曲线绘制"""
 hour = list(data['小时'])
 air = list(data['空气质量'])
 print(type(air[0]))
 for i in range(0,24):
  if math.isnan(air[i]) == True:
   air[i] = air[i-1]
 air_ave = sum(air)/24     # 求平均空气质量 
 air_max = max(air)    
 air_max_hour = hour[air.index(air_max)] # 求最高空气质量
 air_min = min(air)
 air_min_hour = hour[air.index(air_min)] # 求最低空气质量
 x = []
 y = []
 for i in range(0, 24):
  x.append(i)
  y.append(air[hour.index(i)])
 plt.figure(3)
 
 for i in range(0,24):
  if y[i] &lt;= 50:
   plt.bar(x[i],y[i],color='lightgreen',width=0.7)  # 1等级
  elif y[i] &lt;= 100:
   plt.bar(x[i],y[i],color='wheat',width=0.7)   # 2等级
  elif y[i] &lt;= 150:
   plt.bar(x[i],y[i],color='orange',width=0.7)   # 3等级
  elif y[i] &lt;= 200:
   plt.bar(x[i],y[i],color='orangered',width=0.7)  # 4等级
  elif y[i] &lt;= 300:
   plt.bar(x[i],y[i],color='darkviolet',width=0.7)  # 5等级
  elif y[i] &gt; 300:
   plt.bar(x[i],y[i],color='maroon',width=0.7)   # 6等级
 plt.plot([0, 24], [air_ave, air_ave], c='black', linestyle='--')  # 画出平均空气质量虚线
 plt.text(air_max_hour+0.15, air_max+0.15, str(air_max), ha='center', va='bottom', fontsize=10.5)  # 标出最高空气质量
 plt.text(air_min_hour+0.15, air_min+0.15, str(air_min), ha='center', va='bottom', fontsize=10.5)  # 标出最低空气质量
 plt.xticks(x)
 plt.title('一天空气质量变化曲线图')
 plt.xlabel('时间/h')
 plt.ylabel('空气质量指数AQI')
 plt.show()

def wind_radar(data):
 """风向雷达图"""
 wind = list(data['风力方向'])
 wind_speed = list(data['风级'])
 for i in range(0,24):
  if wind[i] == "北风":
   wind[i] = 90
  elif wind[i] == "南风":
   wind[i] = 270
  elif wind[i] == "西风":
   wind[i] = 180
  elif wind[i] == "东风":
   wind[i] = 360
  elif wind[i] == "东北风":
   wind[i] = 45
  elif wind[i] == "西北风":
   wind[i] = 135
  elif wind[i] == "西南风":
   wind[i] = 225
  elif wind[i] == "东南风":
   wind[i] = 315
 degs = np.arange(45,361,45)
 temp = []
 for deg in degs:
  speed = []
  # 获取 wind_deg 在指定范围的风速平均值数据
  for i in range(0,24):
   if wind[i] == deg:
    speed.append(wind_speed[i])
  if len(speed) == 0:
   temp.append(0)
  else:
   temp.append(sum(speed)/len(speed))
 print(temp)
 N = 8
 theta = np.arange(0.+np.pi/8,2*np.pi+np.pi/8,2*np.pi/8)
 # 数据极径
 radii = np.array(temp)
 # 绘制极区图坐标系
 plt.axes(polar=True)
 # 定义每个扇区的RGB值(R,G,B),x越大,对应的颜色越接近蓝色
 colors = [(1-x/max(temp), 1-x/max(temp),0.6) for x in radii]
 plt.bar(theta,radii,width=(2*np.pi/N),bottom=0.0,color=colors)
 plt.title('一天风级图',x=0.2,fontsize=20)
 plt.show()

def calc_corr(a, b):
 """计算相关系数"""
 a_avg = sum(a)/len(a)
 b_avg = sum(b)/len(b)
 cov_ab = sum([(x - a_avg)*(y - b_avg) for x,y in zip(a, b)])
 sq = math.sqrt(sum([(x - a_avg)**2 for x in a])*sum([(x - b_avg)**2 for x in b])) 
 corr_factor = cov_ab/sq
 return corr_factor


def corr_tem_hum(data):
 """温湿度相关性分析"""
 tem = data['温度']
 hum = data['相对湿度']
 plt.scatter(tem,hum,color='blue')
 plt.title("温湿度相关性分析图")
 plt.xlabel("温度/℃")
 plt.ylabel("相对湿度/%")
 plt.text(20,40,"相关系数为:"+str(calc_corr(tem,hum)),fontdict={<!-- -->'size':'10','color':'red'})
 plt.show()
 print("相关系数为:"+str(calc_corr(tem,hum)))

def main():
 plt.rcParams['font.sans-serif']=['SimHei'] # 解决中文显示问题
 plt.rcParams['axes.unicode_minus'] = False  # 解决负号显示问题
 data1 = pd.read_csv('weather1.csv',encoding='gb2312')
 print(data1)
 tem_curve(data1)
 hum_curve(data1)
 air_curve(data1)
 wind_radar(data1)
 corr_tem_hum(data1)
if __name__ == '__main__':
 main()

データ14_分析.py:

# data14_analysis.py
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import math

def tem_curve(data):
 """温度曲线绘制"""
 date = list(data['日期'])
 tem_low = list(data['最低气温'])
 tem_high = list(data['最高气温'])
 for i in range(0,14):
  if math.isnan(tem_low[i]) == True:
   tem_low[i] = tem_low[i-1]
  if math.isnan(tem_high[i]) == True:
   tem_high[i] = tem_high[i-1]

 tem_high_ave = sum(tem_high)/14     # 求平均高温 
 tem_low_ave = sum(tem_low)/14     # 求平均低温 
 
 tem_max = max(tem_high)    
 tem_max_date = tem_high.index(tem_max)   # 求最高温度
 tem_min = min(tem_low)
 tem_min_date = tem_low.index(tem_min)   # 求最低温度

 x = range(1,15)
 plt.figure(1)
 plt.plot(x,tem_high,color='red',label='高温')    # 画出高温度曲线
 plt.scatter(x,tem_high,color='red')     # 点出每个时刻的温度点
 plt.plot(x,tem_low,color='blue',label='低温')    # 画出低温度曲线
 plt.scatter(x,tem_low,color='blue')     # 点出每个时刻的温度点
 
 plt.plot([1, 15], [tem_high_ave, tem_high_ave], c='black', linestyle='--')  # 画出平均温度虚线
 plt.plot([1, 15], [tem_low_ave, tem_low_ave], c='black', linestyle='--')  # 画出平均温度虚线
 plt.legend()
 plt.text(tem_max_date+0.15, tem_max+0.15, str(tem_max), ha='center', va='bottom', fontsize=10.5)  # 标出最高温度
 plt.text(tem_min_date+0.15, tem_min+0.15, str(tem_min), ha='center', va='bottom', fontsize=10.5)  # 标出最低温度
 plt.xticks(x)
 plt.title('未来14天高温低温变化曲线图')
 plt.xlabel('未来天数/天')
 plt.ylabel('摄氏度/℃')
 plt.show()
def change_wind(wind):
 """改变风向"""
 for i in range(0,14):
  if wind[i] == "北风":
   wind[i] = 90
  elif wind[i] == "南风":
   wind[i] = 270
  elif wind[i] == "西风":
   wind[i] = 180
  elif wind[i] == "东风":
   wind[i] = 360
  elif wind[i] == "东北风":
   wind[i] = 45
  elif wind[i] == "西北风":
   wind[i] = 135
  elif wind[i] == "西南风":
   wind[i] = 225
  elif wind[i] == "东南风":
   wind[i] = 315
 return wind


def wind_radar(data):
 """风向雷达图"""
 wind1 = list(data['风向1'])
 wind2 = list(data['风向2'])
 wind_speed = list(data['风级'])
 wind1 = change_wind(wind1)
 wind2 = change_wind(wind2)
 
 degs = np.arange(45,361,45)
 temp = []
 for deg in degs:
  speed = []
  # 获取 wind_deg 在指定范围的风速平均值数据
  for i in range(0,14):
   if wind1[i] == deg:
    speed.append(wind_speed[i])
   if wind2[i] == deg:
    speed.append(wind_speed[i])
  if len(speed) == 0:
   temp.append(0)
  else:
   temp.append(sum(speed)/len(speed))
 print(temp)
 N = 8
 theta = np.arange(0.+np.pi/8,2*np.pi+np.pi/8,2*np.pi/8)
 # 数据极径
 radii = np.array(temp)
 # 绘制极区图坐标系
 plt.axes(polar=True)
 # 定义每个扇区的RGB值(R,G,B),x越大,对应的颜色越接近蓝色
 colors = [(1-x/max(temp), 1-x/max(temp),0.6) for x in radii]
 plt.bar(theta,radii,width=(2*np.pi/N),bottom=0.0,color=colors)
 plt.title('未来14天风级图',x=0.2,fontsize=20)
 plt.show()

def weather_pie(data):
 """绘制天气饼图"""
 weather = list(data['天气'])
 dic_wea = {<!-- --> }
 for i in range(0,14):
  if weather[i] in dic_wea.keys():
   dic_wea[weather[i]] += 1
  else:
   dic_wea[weather[i]] = 1
 print(dic_wea)
 explode=[0.01]*len(dic_wea.keys())
 color = ['lightskyblue','silver','yellow','salmon','grey','lime','gold','red','green','pink']
 plt.pie(dic_wea.values(),explode=explode,labels=dic_wea.keys(),autopct='%1.1f%%',colors=color)
 plt.title('未来14天气候分布饼图')
 plt.show()

def main():
 plt.rcParams['font.sans-serif']=['SimHei'] # 解决中文显示问题
 plt.rcParams['axes.unicode_minus'] = False  # 解决负号显示问题
 data14 = pd.read_csv('weather14.csv',encoding='gb2312')
 print(data14)
 tem_curve(data14)
 wind_radar(data14)
 weather_pie(data14)

if __name__ == '__main__':
 main()

さらにエキサイティングなチュートリアルについては、ステーション B へようこそ。「Qianfeng Education」に注目してください。 

Qianfeng Education の Python ビデオ チュートリアルのフルセット。Excel、Word、PPT、電子メール、クローラー、オフィス オートメーションを簡単にマスターできます (Song Runing が講師)

おすすめ

転載: blog.csdn.net/GUDUzhongliang/article/details/134662717