マイクロチャネルバディデータ解析アプリケーション
1.クロールバディリスト、XLSX形式でファイル保存し、お友達のニックネーム、性別、地理的、署名を表示
2.統計フレンズ地理的分布を、地図上の単語の雲と視覚的に表示するために
、合併を3.すべての友人の頭を取得します。大きなマップへ
ライブラリのための第二に、必要
1、Pyecharts:echartsグラフを生成するためのライブラリは、百度が開いているechartsデータ可視化ライブラリ、大きなecharts図の可視化を使用して生成され、パイソン図pyechart echartsデータを用いて生成することができるライブラリ。
2、Itchat:個人番号へのオープンソースマイクロチャネルインタフェース、Pythonのコールマイクロチャネルを使用することは容易ではありませんでした。
3、Jieba:シンプルなワード操作ライブラリ。
4、numpyの:numpyのシステムは、数値Python拡張を計算するオープンソースです。このツールは、大規模な行列を格納し、処理するために使用することができます。
5、パンダ:numpyのは、ツールに基づいているパンダは、このツールは、データ分析タスクを解決するために作成されます。
図6に示すように、枕:画像処理。
7、wxpy:モジュールの使いやすさを向上させるために最適化されたインターフェイスの多数、および機能豊富な拡張によってでwxpy基底itchat。(それ自体は、マイクロチャネルを提供します)
注意:. Pyechartsは、バージョン0.5をインストールすることができ、より良いです*
ライブラリー上記の三者は、インストールのオペレータコマンド(CMD)で特定のコマンドを達成することができます。install PIP ***
もう一つ:マップデータパケットをインストールするには、地図上で視覚的に表示:
ピップecharts・中国・州・pypkgをインストール
echarts-国-pypkgをインストールPIP
第三に、動作環境:
アナコンダのためのスパイダーのエディタを使用してください。
第三に、ポイントが行進を行います
1、プログラムがマイクロ手紙を記録し、私の友人についての情報を取得することができます。
wxpyインポート*#インポートモジュールから ボット=ボット(cache_path = TRUE) #のロボットの初期化、選択スキャンコードログ friend_all = bot.friends()#取得友達マイクロチャネル情報
ログインコードは自動的に、図1に示す開放、2次元コードのページをポップアップ表示されます実行して、携帯電話のスキャンコードを使用した後、マイクロチャンネル入力することで合意し
たマイクロ手紙の友人の関連情報へのアクセスを。
2、)(私の情報を取得します
(1)取得した対話を使用して
in[2]:print(friend_all[0].raw)#friend_all[0]是我的微信昵称,.raw 则是获取我的全部信息 {'UserName': '@8c0c266b8a6e26de8ac633c1b8e9da89bc28c2b8f2ea97084f66518d2b5280ba', 'City': '', 'DisplayName': '', 'PYQuanPin': '', 'RemarkPYInitial': '', 'Province': '', 'KeyWord': '', 'RemarkName': '', 'PYInitial': '',
'EncryChatRoomId': '', 'Alias': '', 'Signature': '千帆过尽还是你',
'NickName': '杨宇平', 'RemarkPYQuanPin': '',
'HeadImgUrl': '/cgi-bin/mmwebwx-bin/webwxgeticon?seq=1697661224&username=@8c0c266b8a6e26de8ac633c1b8e9da89bc28c2b8f2ea97084f66518d2b5280ba&skey=@crypt_35dd26c8_6e6d15d86316931db6d7bbb2bfe9b2e8',
'UniFriend': 0, 'Sex': 2, 'AppAccountFlag': 0, 'VerifyFlag': 0,
'ChatRoomId': 0, 'HideInputBarFlag': 0, 'AttrStatus': 0, 'SnsFlag': 1, 'MemberCount': 0, 'OwnerUin': 0, 'ContactFlag': 0, 'Uin': 548324490, 'StarFriend': 0, 'Statues': 0, 'MemberList': [], 'WebWxPluginSwitch': 0, 'HeadImgFlag': 1}
(2)文件式获取
(在原来的三行代码上加上最后一行即可)
from wxpy import * bot=Bot(cache_path=True) friend_all = bot.friends() print(friend_all[0].raw)#friend_all[0]是我的微信昵称,.raw 则是获取我的全部信息
显示效果:
3、获取我的好友数量
(在原先的代码上加入此行即可,直接放在交互式,文件式都可以)
print(len(friend_all)) #好友的数量
结果:(显示博主177个好友)
4、把全部的好友信息转化为一个xlsx文件
获取好友信息
for a_friend in friend_all: NickName = a_friend.raw.get('NickName', None) #昵称 #Sex = a_friend.raw.get('Sex', None) Sex = {1: "男", 2: "女", 0: "其它"}.get(a_friend.raw.get('Sex', None), None) #性别(优化) City = a_friend.raw.get('City', None) #城市 Province = a_friend.raw.get('Province', None) #省份 Signature = a_friend.raw.get('Signature', None) #个性签名 HeadImgUrl = a_friend.raw.get('HeadImgUrl', None) #头像地址 HeadImgFlag = a_friend.raw.get('HeadImgFlag', None) #小Flag list_0=[NickName, Sex, City, Province, Signature, HeadImgUrl, HeadImgFlag] #存为一维数组 lis.append(list_0) #叠加数据
并存为xlsx文件
def lis2e17(filename,lis):#把数据存到表格中 import openpyxl wb = openpyxl.Workbook() sheet = wb.active sheet.title = 'list2excel17' file_name = filename +'.xlsx' title=['NickName','Sex','City','Province','Signature','HeadImgUrl','HeadImgFlag'] for i in range(0, len(lis)): for j in range(0, len(lis[i])): sheet.cell(row=i+1, column=j+1, value=str(lis[i][j])) wb.save(file_name) print("写入数据成功!") print(lis2e17('yyp',lis))
结果:
5、把好友的地区用词云统计
(1)给原先的yyp.xlsl加上行标题,例如:nickname sex city province signature headImgUrl headImgFlag(因为下面的词云运用,要用到city索引,才能调用city那一列),另存为yyp_1.xlsx文件
#对数据进行初步探索 #方法一 #粗略获取好友的统计信息 Friends = bot.friends() data = Friends.stats_text(total=True, sex=True,top_provinces=30, top_cities=500) print(data) from pandas import read_excel df = read_excel('yyp_1.xlsx',sheetname='list2excel17') #把yyp.xlsx加上列标题行,另存为yyp_1.xlsx,读取新的表格 df.tail(5) df.city.count() df.city.describe()
#把好友信息(地区)统计,词云 from wordcloud import WordCloud import matplotlib.pyplot as plt import pandas as pd from pandas import DataFrame word_list= df['city'].fillna('0').tolist() #将 dataframe 的列转化为 list,其中的 nan 用“0”替换 new_text = ' '.join(word_list) wordcloud = WordCloud(font_path='simhei.ttf', background_color="black").generate(new_text) #设计图背景颜色,字体 plt.imshow(wordcloud) plt.axis("off") plt.show()
(2)将词云图转为HTML的形
这需要用到pyecharts库的0.5版本,anaconde3原先的是1.0版本的,需要删了这个,安装0.5版本
具体操作可参考博文 https://www.jianshu.com/p/eaad92f6d9ee
代码实现如下:
#利用 pyechart 做词云 import pandas as pd #count = df.city.value_counts() #对 dataframe 进行全频率统计,排除了 nan city_list = df['city'].fillna('NAN').tolist()#将 dataframe 的列转化为 list,其中的 nan 用“NAN” 替换 count_city = pd.value_counts(city_list)#对 list 进行全频率统计 from pyecharts.charts.wordcloud import WordCloud #设置对象 name = count_city.index.tolist() value = count_city.tolist() wordcloud = WordCloud(width=1300, height=620) wordcloud.add("", name, value, word_size_range=[20, 100]) wordcloud.show_config() wordcloud.render(r'D:\Python\wechatcloud.html')
效果如下:
6、把好友的地区转为地图形式
要加入模块 import pandas as pd 在添加下面代码
province_list = df['province'].fillna('NAN').tolist() #将 dataframe 的列转化为 list,其中的 nan 用 “NAN”替换 count_province = pd.value_counts(province_list) #对 list 进行全频率统计 from pyecharts import Map value =count_province.tolist() attr =count_province.index.tolist() map=Map("各省微信好友分布", width=1300, height=700) map.add("", attr, value, maptype='china', is_visualmap=True,visual_text_color='#000',is_label_show = True) #显示地图上的省份 map.show_config() map.render(r'D:\Python\wechatProMap.html')
显示效果如下:
7、总代码:
# -*- coding: utf-8 -*- """ Created on Sun Jun 2 23:38:29 2019 @author: yyp """ from wxpy import * import pandas as pd #地图那要用到的模块 bot=Bot(cache_path=True) friend_all = bot.friends() print(friend_all[0].raw)#friend_all[0]是我的微信昵称,.raw 则是获取我的全部信息 a=len(friend_all)#输出好友个数 print(a) lis=[] for a_friend in friend_all: NickName = a_friend.raw.get('NickName',None) #Sex = a_friend.raw.get('Sex',None) Sex ={1:"男",2:"女",0:"其它"}.get(a_friend.raw.get('Sex',None),None) City = a_friend.raw.get('City',None) Province = a_friend.raw.get('Province',None) Signature = a_friend.raw.get('Signature',None) HeadImgUrl = a_friend.raw.get('HeadImgUrl',None) HeadImgFlag = a_friend.raw.get('HeadImgFlag',None) list_0=[NickName,Sex,City,Province,Signature,HeadImgUrl,HeadImgFlag] lis.append(list_0) def lis2e17(filename,lis):#把数据存到表格中 import openpyxl wb = openpyxl.Workbook() sheet = wb.active sheet.title = 'list2excel17' file_name = filename +'.xlsx' title=['NickName','Sex','City','Province','Signature','HeadImgUrl','HeadImgFlag'] for i in range(0, len(lis)): for j in range(0, len(lis[i])): sheet.cell(row=i+1, column=j+1, value=str(lis[i][j])) wb.save(file_name) print("写入数据成功!") print(lis2e17('yyp',lis)) #对数据进行初步探索 #方法一 #粗略获取好友的统计信息 #另存文件 Friends = bot.friends() data = Friends.stats_text(total=True, sex=True,top_provinces=30, top_cities=500) print(data) from pandas import read_excel df = read_excel('yyp_1.xlsx',sheetname='list2excel17') #把yyp.xlsx加上列标题行,另存为yyp_1.xlsx,读取新的表格 df.tail(5) df.city.count() df.city.describe() '''#把好友信息(籍贯)统计,词云(常规) from wordcloud import WordCloud import matplotlib.pyplot as plt import pandas as pd from pandas import DataFrame word_list= df['city'].fillna('0').tolist() #将 dataframe 的列转化为 list,其中的 nan 用“0”替换 new_text = ' '.join(word_list) wordcloud = WordCloud(font_path='simhei.ttf', background_color="black").generate(new_text) #设计图背景颜色,字体 plt.imshow(wordcloud) plt.axis("off") plt.show()''' '''#利用 pyechart 做词云(以HTML的形式显示) import pandas as pd #count = df.city.value_counts() #对 dataframe 进行全频率统计,排除了 nan city_list = df['city'].fillna('NAN').tolist()#将 dataframe 的列转化为 list,其中的 nan 用“NAN” 替换 count_city = pd.value_counts(city_list)#对 list 进行全频率统计 from pyecharts.charts.wordcloud import WordCloud #设置对象 name = count_city.index.tolist() value = count_city.tolist() wordcloud = WordCloud(width=1300, height=620) wordcloud.add("", name, value, word_size_range=[20, 100]) wordcloud.show_config() wordcloud.render(r'D:\Python\wechatcloud.html')''' #把好友的地区显示在地图上(以地图的形式呈现) province_list = df['province'].fillna('NAN').tolist()#将 dataframe 的列转化为 list,其中的 nan 用 “NAN”替换 count_province = pd.value_counts(province_list)#对 list 进行全频率统计 from pyecharts import Map value =count_province.tolist() attr =count_province.index.tolist() map=Map("各省微信好友分布", width=1300, height=700) map.add("", attr, value, maptype='china', is_visualmap=True,visual_text_color='#000',is_label_show = True)#显示地图上的省份 map.show_config() map.render(r'D:\Python\wechatProMap.html')