[Python Treasure Box] 소셜 미디어 데이터의 바다 탐험: 분석의 문을 여는 Python 도구

소셜 미디어 데이터의 큰 비밀: Python 도구 및 기술에 대한 완전한 분석

머리말

디지털 시대에 소셜 미디어는 세상을 연결하는 역할을 하며, 이 거대하고 복잡한 네트워크에 대한 깊은 이해는 현재의 트렌드와 사용자 행동을 해석하는 열쇠입니다. 이 기사에서는 소셜 미디어 데이터를 쉽게 활용하고 심층적인 통찰력을 드러내는 데 도움이 되는 일련의 강력한 Python 도구 및 기술을 살펴보겠습니다.

[Python Treasure Box] 챌린지 네트워크 분석: NetworkX, iGraph, Graph-tool, Snap.py 및 PyGraphviz에 대한 세부 평가

칼럼 구독을 환영합니다: Python 라이브러리 보물 상자: 프로그래밍의 마법의 세계 잠금 해제

기사 디렉토리

**소셜 미디어 데이터 공개: Python 도구 및 기술에 대한 전체 분석**

1. 트위피

1.1 API 인증 및 기본 사용법

Tweepy는 Twitter API에 액세스하기 위한 Python 라이브러리입니다. 먼저 API 인증을 수행하고 트위터 개발자 계정의 API 키와 액세스 토큰을 얻습니다. 그런 다음 Tweepy를 통해 기본 사용법 데모를 수행합니다.

import tweepy

# API认证
consumer_key = 'Your_Consumer_Key'
consumer_secret = 'Your_Consumer_Secret'
access_token = 'Your_Access_Token'
access_token_secret = 'Your_Access_Token_Secret'

auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret) 

api = tweepy.API(auth)

# 获取用户信息
user = api.get_user(screen_name='twitter_handle')
print(f"User: {
      
      user.screen_name}, Followers: {
      
      user.followers_count}")

# 发送一条推文
api.update_status("Hello, Twitter API!")

이 코드는 사용자 정보 획득 및 트윗 전송을 포함하여 Tweepy의 API 인증 및 기본 사용법을 보여줍니다.

1.2 데이터 수집 및 분석 기술

Tweepy는 사용자의 타임라인 획득, 특정 키워드가 포함된 트윗 검색 등 트위터 데이터를 수집하고 분석하는 다양한 방법을 제공합니다. 다음은 간단한 예입니다.

# 获取用户时间线
tweets = api.user_timeline(screen_name='twitter_handle', count=10)

for tweet in tweets:
    print(f"{
      
      tweet.user.screen_name}: {
      
      tweet.text}")

# 搜索关键词
search_results = api.search(q='python', count=5)

for result in search_results:
    print(f"{
      
      result.user.screen_name}: {
      
      result.text}")

이 코드는 Tweepy를 사용하여 사용자의 타임라인 및 검색 키워드에서 트윗을 얻는 방법을 보여줍니다.

1.3 실시간 데이터 스트림 획득

Tweepy는 실시간 데이터 스트림 획득도 지원하며 StreamListener를 통해 실시간으로 생성된 트윗을 처리할 수 있습니다. 다음은 간단한 예입니다.

from tweepy.streaming import StreamListener
from tweepy import Stream

class MyStreamListener(StreamListener):
    def on_status(self, status):
        print(f"{
      
      status.user.screen_name}: {
      
      status.text}")

# 创建Stream对象并启动实时数据流
my_stream_listener = MyStreamListener()
my_stream = Stream(auth=api.auth, listener=my_stream_listener)

# 过滤包含关键词'python'的推文
my_stream.filter(track=['python'])

위 코드를 사용하면 'python'이라는 키워드가 포함된 트윗을 실시간으로 받아볼 수 있습니다. 이는 Tweepy의 실시간 데이터 스트리밍 기능을 보여줍니다.

1.4 사용자 상호 작용 및 추세 분석

Tweepy는 사용자 정보와 트윗을 얻을 수 있을 뿐만 아니라 사용자 상호 작용과 관심 추세도 분석할 수 있습니다. 다음은 샘플 코드입니다.

# 获取用户关注者列表
followers = api.followers(screen_name='twitter_handle', count=5)

print(f"Followers of twitter_handle:")
for follower in followers:
    print(f"{
      
      follower.screen_name}")

# 分析用户的互动
interactions = api.user_timeline(screen_name='twitter_handle', count=100)

likes_count = 0
retweets_count = 0

for tweet in interactions:
    likes_count += tweet.favorite_count
    retweets_count += tweet.retweet_count

print(f"Total Likes: {
      
      likes_count}, Total Retweets: {
      
      retweets_count}")

이 코드는 Tweepy를 사용하여 사용자의 팔로어 목록을 가져오고 좋아요 및 리트윗을 포함한 사용자의 상호 작용 데이터를 분석하는 방법을 보여줍니다.

1.5 커서를 사용하여 대용량 데이터 처리

대량의 데이터를 처리하기 위해 Tweepy는 결과 세트를 쉽게 탐색할 수 있는 커서를 제공합니다. 다음은 사용자로부터 모든 트윗을 가져오는 예입니다.

# 使用Cursor获取用户所有推文
all_tweets = tweepy.Cursor(api.user_timeline, screen_name='twitter_handle').items()

for tweet in all_tweets:
    print(f"{
      
      tweet.user.screen_name}: {
      
      tweet.text}")

이 코드는 Tweepy's Cursor를 사용하여 사용자의 모든 트윗을 획득하여 대량의 데이터를 더 쉽게 처리하는 방법을 보여줍니다.

1.6 데이터 시각화 및 통찰력

Tweepy를 Matplotlib, Seaborn 등의 데이터 시각화 도구와 결합하면 분석 결과를 보다 직관적으로 제시할 수 있습니다. 다음은 간단한 예입니다.

import matplotlib.pyplot as plt

# 统计用户互动数据
labels = ['Likes', 'Retweets'] 
counts = [likes_count, retweets_count]

plt.bar(labels, counts, color=['blue', 'green'])
plt.title('User Interaction Analysis')
plt.xlabel('Interaction Type')
plt.ylabel('Count')
plt.show()

이 코드는 Matplotlib를 사용하여 사용자 상호 작용 데이터를 계산하고 간단한 데이터 시각화를 수행하는 방법을 보여줍니다.

2. 파이썬-트위터

2.1 인터페이스 호출 및 권한 구성

python-twitterTwitter API에 접근하기 위한 또 다른 라이브러리로, 사용하기 전에 API 인증과 권한 설정이 필요합니다. 다음은 기본 인터페이스 호출 및 권한 구성입니다.

import twitter

# API认证
api = twitter.Api(
    consumer_key='Your_Consumer_Key',
    consumer_secret='Your_Consumer_Secret',
    access_token_key='Your_Access_Token',
    access_token_secret='Your_Access_Token_Secret'
)

# 获取用户信息
user = api.GetUser(screen_name='twitter_handle')
print(f"User: {
      
      user.screen_name}, Followers: {
      
      user.followers_count}")

이 코드는 API 인증 및 기본 인터페이스 호출의 사용을 보여줍니다 python-twitter.

2.2 이용자 정보 및 게시물 데이터 취득

python-twitter사용자 정보 획득 및 게시 데이터를 위해 사용될 수 있습니다. 예는 다음과 같습니다.

# 获取用户信息
user = api.GetUser(screen_name='twitter_handle')
print(f"User: {
      
      user.screen_name}, Followers: {
      
      user.followers_count}")

# 获取用户的帖子
statuses = api.GetUserTimeline(screen_name='twitter_handle', count=5)

for status in statuses:
    print(f"{
      
      status.user.screen_name}: {
      
      status.text}")

이 코드는 사용자 정보를 얻고 데이터를 게시하는 방법을 보여줍니다 python-twitter.

2.2.1 데이터 정리 및 처리 기술

획득한 사후 데이터에는 데이터 정리 및 처리가 필요할 수 있습니다. 간단한 청소 팁은 다음과 같습니다.

import re

# 清洗推文文本
cleaned_tweets = [re.sub(r'http\S+', '', status.text) for status in statuses]

for tweet in cleaned_tweets:
    print(tweet)

이 코드는 정규식을 사용하여 트윗 텍스트를 정리하고 URL을 제거하는 방법을 보여줍니다.

2.3 출판 및 대화형 작업

python-twitter트윗과 대화형 작업도 지원됩니다. 다음은 트윗과 좋아요의 예입니다.

# 发布推文
new_status = api.PostUpdate("Hello, python-twitter!")

# 点赞帖子
api.CreateFavorite(status=new_status)

이 코드는 python-twitter트윗과 좋아요를 사용하는 기본 작업을 보여줍니다.

2.4 미디어 콘텐츠 처리

python-twitter이미지 및 비디오 업로드를 포함한 미디어 콘텐츠 처리를 지원합니다. 다음은 이미지 업로드의 예입니다.

# 上传图片
with open('path/to/image.jpg', 'rb') as file:
    media = api.UploadMediaChunked(file)

# 发布带有图片的推文
api.PostUpdate("Check out this image!", media=media.media_id)

python-twitter이 코드는 이미지를 업로드하고 트윗으로 공유하는 방법을 보여줍니다 .

2.5 라이브 트윗 스트리밍

python-twitter또한 클래스 Stream및 StreamListener. 다음은 키워드가 포함된 실시간 트윗을 듣는 예입니다.

class MyStreamListener(twitter.StreamListener):
    def on_status(self, status):
        print(f"{
      
      status.user.screen_name}: {
      
      status.text}")

# 创建Stream对象并启动实时推文流
my_stream_listener = MyStreamListener(api=api)
my_stream = twitter.Stream(auth=api.auth, listener=my_stream_listener)

# 过滤包含关键词'python'的实时推文
my_stream.filter(track=['python'])

이 코드를 사용하면 'python'이라는 키워드가 포함된 트윗을 실시간으로 받아볼 수 있습니다.

2.6 고급 검색 및 필터링

python-twitter다양한 요구를 충족시키기 위해 풍부한 검색 및 필터링 기능을 제공합니다. 다음은 고급 검색의 예입니다.

# 高级搜索
search_results = api.GetSearch(
    term='python',
    lang='en',
    result_type='recent',
    count=5
)

for result in search_results:
    print(f"{
      
      result.user.screen_name}: {
      
      result.text}")

python-twitter이 코드는 언어 및 결과 유형 지정을 포함하여 고급 검색을 수행하는 방법을 보여줍니다 .

3. 페이스북-SDK

3.1 인증 및 권한 관리

facebook-sdkFacebook Graph API에 액세스하려면 먼저 권한을 인증하고 구성해야 합니다. 다음은 인증 및 권한 관리의 간단한 예입니다.

import facebook

# 获取用户长期访问令牌
app_id = 'Your_App_ID'
app_secret = 'Your_App_Secret'
user_access_token = 'User_Access_Token'

graph = facebook.GraphAPI(access_token=user_access_token, version='v14.0')

이 코드는 권한을 인증하고 구성하는 방법을 보여줍니다 facebook-sdk.

3.2 사용자 정보 및 게시물 데이터 가져오기

facebook-sdk사용자 정보를 얻고 데이터를 게시하는 데 사용할 수 있습니다. 예는 다음과 같습니다.

# 获取用户信息
user_info = graph.get_object('me')
print(f"User: {
      
      user_info['name']}, ID: {
      
      user_info['id']}")

# 获取用户发布的帖子
user_posts = graph.get_connections('me', 'posts')

for post in user_posts['data']:
    print(f"{
      
      post['from']['name']}: {
      
      post['message']}")

이 코드는 사용자 정보를 얻고 데이터를 게시하는 방법을 보여줍니다 facebook-sdk.

3.3 데이터 분석 및 통찰력

facebook-sdk다른 데이터 분석 도구와 결합하여 더 깊은 통찰력을 얻을 수 있습니다. 다음은 간단한 예입니다.

import pandas as pd

# 将帖子数据转换为DataFrame
posts_df = pd.DataFrame(user_posts['data'])

# 分析帖子数据
post_analysis = posts_df.groupby('from')['message'].count().reset_index()
print(post_analysis)

facebook-sdk이 코드는 가져온 게시물 데이터를 사용하여 간단한 분석을 수행하는 방법을 보여줍니다 .

3.4 출판 및 대화형 작업

facebook-sdk게시물 게시 및 좋아요, 댓글 등과 같은 대화형 작업 수행을 지원합니다. 게시 및 좋아요 표시의 예는 다음과 같습니다.

# 发布帖子
post_message = "Hello, Facebook Graph API!"
graph.put_object(parent_object='me', connection_name='feed', message=post_message)

# 获取帖子ID
last_post_id = graph.get_connections('me', 'posts')['data'][0]['id']

# 点赞帖子
graph.put_like(object_id=last_post_id)

이 코드는 facebook-sdk게시물 및 좋아요 게시를 사용하는 기본 작업을 보여줍니다.

3.5 사진, 동영상, 파일 업로드

facebook-sdk사진, 동영상 등 멀티미디어 파일 업로드도 지원합니다. 다음은 이미지 업로드의 예입니다.

# 上传图片
with open('path/to/image.jpg', 'rb') as photo:
    graph.put_photo(image=photo, message='Check out this photo!')

이 코드는 이미지 업로드를 사용하는 방법을 보여줍니다 facebook-sdk.

3.6 데이터 시각화 및 보고서 생성

데이터 시각화 도구와 결합하면 facebook-sdk매력적인 차트와 보고서를 만들 수 있습니다. 다음은 간단한 예입니다.

import matplotlib.pyplot as plt

# 将帖子数据可视化
post_analysis.plot(kind='bar', x='from', y='message', legend=False)
plt.title('User Post Analysis')
plt.xlabel('User')
plt.ylabel('Post Count')
plt.show()

이 코드는 Matplotlib를 사용하여 게시물 데이터를 시각화하는 방법을 보여줍니다.

3.7 고급 기능 및 확장

facebook-sdk이벤트 관리, 광고 운영 등 다양한 고급 기능과 확장 옵션을 제공합니다. 다음은 간단한 예입니다.

# 获取用户的事件
user_events = graph.get_connections('me', 'events')

for event in user_events['data']:
    print(f"Event Name: {
      
      event['name']}, Location: {
      
      event.get('location', 'N/A')}")

facebook-sdk이 코드는 사용자 이벤트 정보를 얻는 방법을 보여줍니다 .

4. 인스타로더

4.1 사진, 동영상, 게시물 다운로드

Instaloader인스타그램 데이터를 다운로드하고 사진, 비디오, 게시물 다운로드를 지원하는 도구입니다. 다음은 간단한 예입니다.

from instaloader import Instaloader, Profile

# 创建Instaloader对象
loader = Instaloader()

# 获取用户信息
profile = Profile.from_username(loader.context, 'instagram_handle')
print(f"User: {
      
      profile.username}, Followers: {
      
      profile.followers}")

# 下载用户的图片和视频
loader.download_profile(profile.username, profile_pic_only=False)

Instaloader이 코드는 Instagram 사용자의 이미지와 비디오를 다운로드하는 방법을 보여줍니다 .

4.2 사용자 정보 및 상호작용 데이터 추출

Instaloader또한 사용자 정보 및 상호 작용 데이터 추출도 지원합니다. 예는 다음과 같습니다.

# 获取用户信息
profile = Profile.from_username(loader.context, 'instagram_handle') 
print(f"User: {
      
      profile.username}, Followers: {
      
      profile.followers}")

# 获取用户的互动数据
likes_count = 0
comments_count = 0

for post in profile.get_posts():
    likes_count += post.likes
    comments_count += post.comments

print(f"Total Likes: {
      
      likes_count}, Total Comments: {
      
      comments_count}")

이 코드는 Instagram 사용자 정보 및 상호 작용 데이터를 얻는 방법을 보여줍니다 Instaloader.

4.3 데이터 처리 및 표현 기술

다운로드한 데이터는 다른 라이브러리를 통해 처리하고 표시할 수 있습니다. 다음은 matplotlib간단한 데모의 예입니다.

import matplotlib.pyplot as plt

# 帖子类型分布展示
post_types = ['Image', 'Video'] 
post_counts = [profile.mediacount - profile.video_count, profile.video_count]

plt.bar(post_types, post_counts, color=['blue', 'orange'])
plt.title('Post Type Distribution')
plt.xlabel('Post Type')
plt.ylabel('Count')
plt.show()

matplotlib이 코드는 Show Download Instagram 게시물 유형 배포를 사용하는 방법을 보여줍니다 .

4.4 사용자 활동 패턴 분석

Instaloader데이터를 다운로드할 수 있을 뿐만 아니라 사용자 활동 패턴을 분석하는 데도 도움이 될 수 있습니다. 예는 다음과 같습니다.

# 获取用户的帖子
posts = list(profile.get_posts())

# 计算每个月的平均帖子数量
monthly_post_count = {
    
    }
for post in posts:
    month_year = post.date.strftime("%Y-%m")
    monthly_post_count[month_year] = monthly_post_count.get(month_year, 0) + 1

# 展示月均帖子数量
months = list(monthly_post_count.keys())
post_counts = list(monthly_post_count.values())

plt.plot(months, post_counts, marker='o', linestyle='-')
plt.title('Monthly Average Post Count')
plt.xlabel('Month')
plt.ylabel('Average Post Count')
plt.xticks(rotation=45)
plt.show()

Instaloader이 코드는 사용자의 게시물을 가져오고 월별 평균 게시물 수를 분석하는 방법을 보여줍니다 .

4.5 여러 사용자 데이터를 일괄 다운로드

Instaloader여러 사용자의 데이터 일괄 다운로드를 지원합니다. 다음은 사용자 이미지를 일괄 다운로드하는 예입니다.

users_to_download = ['user1', 'user2', 'user3'] 

for user in users_to_download:
    try:
        profile = Profile.from_username(loader.context, user)
        loader.download_profile(profile.username, profile_pic_only=True)
        print(f"Downloaded profile pictures for {
      
      profile.username}")
    except Exception as e:
        print(f"Error downloading data for {
      
      user}: {
      
      e}")

Instaloader이 코드는 여러 사용자의 아바타 이미지를 일괄 다운로드하는 방법을 보여줍니다 .

4.6 다운로드에 프록시 사용

일부 네트워크 환경에서는 다운로드를 위해 프록시를 사용해야 할 수도 있습니다. 다음은 프록시를 사용하여 다운로드하는 예입니다.

from  instaloader import InstaloaderContext

# 设置代理
context = InstaloaderContext(requests_session=requests.Session(), proxy="http://your_proxy_here")

# 创建带代理的Instaloader对象
loader_with_proxy = Instaloader(context=context)

# 下载用户的图片和视频
loader_with_proxy.download_profile(profile.username, profile_pic_only=False)

Instaloader이 코드는 데이터 다운로드에 프록시를 사용하는 방법을 보여줍니다 .

위의 내용은 Instaloader사용자 활동 분석, 일괄 다운로드 및 프록시 사용을 포함하여 쌍을 더욱 확장한 것입니다.

5. 소셜미디어마이너(SocialMediaMineR)

5.1 소셜 미디어 데이터 마이닝 도구 소개

SocialMediaMineR소셜 미디어 데이터 마이닝을 위한 도구이며 다양한 플랫폼을 지원합니다. 간략한 소개는 다음과 같습니다.

from SocialMediaMineR import SocialMediaMiner

# 创建SocialMediaMiner对象
miner = SocialMediaMiner(api_key='Your_API_Key')

# 获取Twitter上特定关键词的推文
tweets = miner.search_tweets(query='data mining', count=5)

for tweet in tweets:
    print(f"{
      
      tweet['user']['screen_name']}: {
      
      tweet['text']}")

SocialMediaMineR이 코드는 트위터에서 특정 키워드에 대한 트윗을 얻는 방법을 보여줍니다 .

5.2 데이터 캡처 및 분석 기능

SocialMediaMineR사용자 정보, 게시물 데이터 등 풍부한 데이터 수집 및 분석 기능을 제공합니다. 예는 다음과 같습니다.

# 获取用户信息
user_info = miner.get_user_info(screen_name='twitter_handle')
print(f"User: {
      
      user_info['screen_name']}, Followers: {
      
      user_info['followers_count']}")

# 获取用户的帖子
user_posts = miner.get_user_posts(screen_name='twitter_handle', count=5)

for post in user_posts:
    print(f"{
      
      post['user']['screen_name']}: {
      
      post['text']}")

이 코드는 사용자 정보를 얻고 데이터를 게시하는 방법을 보여줍니다 SocialMediaMineR.

5.3 데이터 시각화 및 활용 사례

데이터 시각화는 SocialMediaMineR채굴된 소셜 미디어 데이터를 표시하는 데 사용할 수 있는 강력한 기능입니다. 다음은 간단한 예입니다.

import matplotlib.pyplot as plt

# 统计推文来源
source_counts = miner.count_tweet_sources(query='data mining', count=100)

plt.pie(source_counts.values(), labels=source_counts.keys(), autopct='%1.1f%%')
plt.title('Tweet Sources Distribution')
plt.show()

SocialMediaMineR이 코드는 통계적 트윗 소스를 사용하고 시각화하는 방법을 보여줍니다 .

5.4 마이닝 사용자 관계 네트워크

# 获取用户的关注者和关注的用户
user_followers = miner.get_user_followers(screen_name='twitter_handle', count=10)
user_following = miner.get_user_following(screen_name='twitter_handle', count=10)

print(f"Followers: {
      
      user_followers}")
print(f"Following: {
      
      user_following}")

5.5 감정 분석 및 주제 식별

# 对推文进行情感分析
sentiment_analysis = miner.sentiment_analysis(query='data mining', count=50)

positive_tweets = sum(1 for sentiment in sentiment_analysis if sentiment == 'positive')
negative_tweets = sum(1 for sentiment in sentiment_analysis if sentiment == 'negative')

print(f"Positive Tweets: {
      
      positive_tweets}, Negative Tweets: {
      
      negative_tweets}")

5.6 예약된 작업 및 자동화

from apscheduler.schedulers.blocking import BlockingScheduler

# 创建定时任务
scheduler = BlockingScheduler()

# 定义定时任务函数
def scheduled_job():
    tweets = miner.search_tweets(query='automation', count=5)
    for tweet in tweets:
        print(f"{
      
      tweet['user']['screen_name']}: {
      
      tweet['text']}")

# 每天定时执行任务
scheduler.add_job(scheduled_job, 'interval', days=1)

# 启动定时任务
scheduler.start()

위의 내용은 SocialMediaMineR사용자 관계 네트워크 마이닝, 감정 분석, 예약된 작업 및 자동화를 포함하여 쌍을 더욱 확장한 것입니다.

6. LAWS(Python Reddit API 래퍼)

6.1 Reddit API 연결 및 사용방법

PRAWReddit API에 액세스하는 데 사용되는 Python 패키지로, 게시물 및 댓글과 같은 정보 획득을 지원합니다. Reddit API를 연결하고 사용하는 기본 방법은 다음과 같습니다.

import praw

# Reddit API认证
reddit = praw.Reddit(
    client_id='Your_Client_ID', 
    client_secret='Your_Client_Secret',
    user_agent='Your_User_Agent'
)

# 获取特定subreddit下的热门帖子
subreddit = reddit.subreddit('python')
hot_posts = subreddit.hot(limit=5)

for post in hot_posts:
    print(f"Title: {
      
      post.title}, Upvotes: {
      
      post.ups}")

PRAW이 코드는 Reddit API를 사용하여 특정 하위 레딧에서 인기 있는 게시물을 인증하고 얻는 방법을 보여줍니다 .

6.2 게시물 및 댓글 데이터 추출

PRAW게시물, 댓글 등의 데이터를 추출하는 데 사용할 수 있습니다. 예는 다음과 같습니다.

# 获取帖子信息
post = reddit.submission(id='post_id')
print(f"Title: {
      
      post.title}, Comments: {
      
      post.num_comments}")

# 获取帖子的评论
comments = post.comments.list()

for comment in comments:
    print(f"{
      
      comment.author.name}: {
      
      comment.body}")

이 코드는 게시물 정보와 댓글 데이터를 가져오는 방법을 보여줍니다 PRAW.

6.3 Reddit 데이터 분석 및 시각화 기술

획득한 PRAWReddit 데이터는 분석 및 시각화를 위해 다른 라이브러리와 결합될 수 있습니다. 다음은 간단한 예입니다.

import matplotlib.pyplot as plt

# 统计帖子类型分布
post_types = ['Link', 'Text', 'Image']
post_counts = [subreddit.link_karma, subreddit.comment_karma, subreddit.total_karma]

plt.bar(post_types, post_counts, color=['red', 'green', 'blue'])
plt.title('Post Type Distribution')
plt.xlabel('Post Type')
plt.ylabel('Karma')
plt.show()

matplotlib이 코드는 분석을 사용하고 Reddit 게시물 유형 분포를 시각화하는 방법을 보여줍니다 .

6.4 사용자 상호작용 분석

# 获取用户的帖子和评论
user = reddit.redditor('username')
user_posts = list(user.submissions.new(limit=5))
user_comments = list(user.comments.new(limit=5))

print(f"User: {
      
      user.name}, Total Posts: {
      
      len(user_posts)}, Total Comments: {
      
      len(user_comments)}")

6.5 여러 하위 레딧의 추세 탐색

# 定义Subreddit列表
subreddits = ['python', 'datascience', 'machinelearning']

# 统计各Subreddit的帖子数量
subreddit_post_counts = {
    
    subreddit: reddit.subreddit(subreddit).submissions.new(limit=10) for subreddit in subreddits}

for subreddit, posts in subreddit_post_counts.items():
    print(f"{
      
      subreddit} Posts:")
    for post in posts:
        print(f"  - {
      
      post.title}")

6.6 Reddit 봇과 자동화

# 创建Reddit机器人
reddit_bot = praw.Reddit(
    client_id='Bot_Client_ID',
    client_secret='Bot_Client_Secret',
    user_agent='Bot_User_Agent',
    username='Bot_Username',
    password='Bot_Password'
)

# 发送帖子
subreddit = reddit_bot.subreddit('test')
subreddit.submit(title='Automated Post', selftext='This post was created by a bot.')

PRAW이는 사용자 상호 작용 분석, 여러 하위 레딧에 대한 추세 탐색, Reddit 봇 및 자동화를 포함하도록 위의 기능을 더욱 확장한 것입니다 .

7. 페이스피

7.1 페이스북 그래프 API 사용 방법

Facepy사용자 정보, 게시물 및 기타 데이터 획득을 지원하는 Facebook Graph API에 액세스하는 데 사용되는 Python 라이브러리입니다. 다음은 간단한 예입니다.

from facepy import GraphAPI

# Facebook Graph API认证
access_token = 'Your_Access_Token'
graph = GraphAPI(access_token)

# 获取用户信息
user_info = graph.get('me')
print(f"User: {
      
      user_info['name']}, ID: {
      
      user_info['id']}")

Facepy이 코드는 Facebook Graph API를 사용하여 사용자 정보를 인증하고 얻는 방법을 보여줍니다 .

7.2 데이터 캡처 및 분석 기술

Facepy사용자 게시물 획득 등을 포함한 데이터 캡처 및 분석을 지원합니다. 예는 다음과 같습니다.

# 获取用户发布的帖子
user_posts = graph.get('me/posts', limit=5)

for post in user_posts['data']: 
    print(f"{
      
      post['from']['name']}: {
      
      post['message']}")

Facepy이 코드는 사용자의 게시물 데이터를 가져오는 방법을 보여줍니다 .

7.3 사용자 상호 작용 및 콘텐츠 게시 작업

Facepy사용자 상호 작용 및 콘텐츠 게시 작업도 지원됩니다. 게시 및 좋아요 표시의 예는 다음과 같습니다.

# 发布帖子
new_post = graph.post('me/feed', message='Hello, Facebook Graph API!')

# 点赞帖子
graph.post(f'{
      
      new_post["id"]}/likes')

Facepy이 코드는 게시물을 게시하고 좋아요를 누르는 기본 작업을 사용하는 방법을 보여줍니다 .

7.4 사용자의 친구 목록 가져오기

# 获取用户的朋友列表
friends = graph.get('me/friends')

for friend in friends['data']:
    print(f"Friend: {
      
      friend['name']}, ID: {
      
      friend['id']}")

7.5 사후 상호작용 데이터 분석

# 获取帖子的点赞和评论数量
post_id = 'post_id_here'
post_interactions = graph.get(f'{
      
      post_id}?fields=likes.summary(true),comments.summary(true)')

likes_count = post_interactions['likes']['summary']['total_count']
comments_count = post_interactions['comments']['summary']['total_count']

print(f"Likes: {
      
      likes_count}, Comments: {
      
      comments_count}")

7.6 데이터를 사용하여 사용자 관계 분석

# 获取用户的好友及其朋友列表
friends_and_friends_of_friends = []
for friend in friends['data']:
    friend_id = friend['id']
    friend_friends = graph.get(f'{
      
      friend_id}/friends')['data']
    friends_and_friends_of_friends.extend((friend_id, friend_friend['id']) for friend_friend in friend_friends)

print("User and Friends of Friends:")
for pair in friends_and_friends_of_friends:
    print(pair)

위의 내용은 Facepy사용자의 친구 목록을 얻고, 사후 상호 작용 데이터를 분석하고, 데이터를 사용하여 사용자 관계를 분석하는 것을 포함하는 추가 확장입니다.

8. 트위피 스트리밍

8.1 스트리밍 데이터 수집 및 처리

tweepy-streaming실시간으로 생성된 트윗을 처리하는 데 사용되는 Tweepy용 스트리밍 데이터 수집 확장입니다. 다음은 간단한 예입니다.

from tweepy.streaming import StreamListener
from tweepy import Stream

class MyStreamListener(StreamListener):
    def on_status(self, status):
        print(f"{
      
      status.user.screen_name}: {
      
      status.text}")

# 创建Stream对象并启动实时数据流
my_stream_listener = MyStreamListener()
my_stream = Stream(auth=api.auth, listener=my_stream_listener)

# 过滤包含关键词'python'的推文
my_stream.filter(track=['python'])

tweepy-streaming이 코드는 이를 사용하여 실시간으로 생성된 키워드 'python'이 포함된 트윗을 처리하는 방법을 보여줍니다 .

8.2 실시간 소셜미디어 데이터 분석

실시간 데이터 스트리밍과 분석 도구를 결합하면 실시간 소셜 미디어 데이터 분석이 가능해집니다. 다음은 간단한 예입니다.

from collections import Counter 

# 统计实时推文中关键词的频率
keyword_counter = Counter()

class MyStreamListener(StreamListener):
    def on_status(self, status):
        keywords = ['data', 'analysis', 'python']  # 示例关键词
        for keyword in keywords:
            if keyword.lower() in status.text.lower():
                keyword_counter[keyword] += 1

        print(f"Real-time Keyword Frequency: {
      
      keyword_counter}")

# 创建Stream对象并启动实时数据流
my_stream_listener = MyStreamListener()
my_stream = Stream(auth=api.auth, listener=my_stream_listener)

# 过滤包含关键词的实时推文
my_stream.filter(track=keywords)

이 코드는 실시간 데이터 스트림을 사용하여 키워드가 포함된 트윗의 빈도를 계산하는 방법을 보여줍니다.

8.3 실시간 감정 분석

from textblob import TextBlob

# 对实时推文进行情感分析
class MyStreamListener(StreamListener):
    def on_status(self, status):
        analysis = TextBlob(status.text)
        sentiment = 'Positive' if analysis.sentiment.polarity > 0 else 'Negative' if analysis.sentiment.polarity < 0 else 'Neutral'
        print(f"{
      
      status.user.screen_name}: {
      
      status.text}, Sentiment: {
      
      sentiment}")

# 创建Stream对象并启动实时数据流
my_stream_listener = MyStreamListener()
my_stream = Stream(auth=api.auth, listener=my_stream_listener)

# 过滤实时推文
my_stream.filter(track=['data science', 'machine learning'])

8.4 실시간 데이터 저장

import json

# 存储实时推文到文件
class MyStreamListener(StreamListener):
    def on_status(self, status):
        with  open('real_time_tweets.json', 'a') as f:
            tweet_data = {
    
    
                'user': status.user.screen_name,
                'text': status.text,
                'created_at': str(status.created_at)
            }
            f.write(json.dumps(tweet_data) + '\n')

# 创建Stream对象并启动实时数据流
my_stream_listener = MyStreamListener()
my_stream = Stream(auth=api.auth, listener=my_stream_listener)

# 过滤实时推文
my_stream.filter(track=['python', 'programming'])

위의 내용은 tweepy-streaming실시간 감정 분석 및 실시간 데이터 저장을 포함하여 쌍을 더욱 확장한 것입니다.

요약하다

이 글은 다양한 소셜 미디어 분석 도구를 체계적으로 소개하고 독자들에게 심층적인 학습을 위한 기초를 제공합니다. 이러한 도구를 학습함으로써 독자는 쉽게 소셜 미디어 데이터를 얻고, 사용자 행동을 분석하고, 실시간 데이터 스트림 처리를 수행하고, 데이터 시각화 도구의 도움으로 깊은 통찰력을 제시할 수 있습니다. 이는 마케팅, 여론 분석, 사회 동향 연구 및 기타 분야에 종사하는 전문가는 물론 소셜 미디어 데이터 마이닝에 관심이 있는 학습자에게 실질적인 가치가 있습니다.