【机器学习】利用K-means算法进行客户分群 - 代码天地

【机器学习】利用K-means算法进行客户分群

编程语言 2023-12-16 18:04:22 阅读次数: 0

利用K-means算法进行客户分群

在数据科学和机器学习领域，K-means聚类是一种常用的无监督学习方法，用于将数据分成预定义数量的群体。在这个例子中，我们将使用K-means算法对一个简化的销售数据集进行客户分群，以便更好地了解不同群体的消费行为。

1. 导入库和生成模拟数据

# 导入必要的库
import pandas as pd
from sklearn.cluster import KMeans
import matplotlib

matplotlib.use('TkAgg')  # 选择TkAgg或其他合适的后端
import matplotlib.pyplot as plt

# 生成模拟销售数据集
data = {
    
    
    'CustomerID': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],  # 客户ID
    'AnnualIncome (k$)': [15, 20, 25, 30, 35, 40, 50, 60, 70, 80],  # 年收入
    'SpendingScore (1-100)': [39, 81, 6, 77, 40, 76, 6, 94, 3, 72]  # 消费分数
}

df = pd.DataFrame(data)

2. 选择特征和应用K-means聚类

# 选择特征
X = df[['AnnualIncome (k$)', 'SpendingScore (1-100)']]

# 使用K-means聚类
kmeans = KMeans(n_clusters=3, random_state=42, n_init='auto')
df['Cluster'] = kmeans.fit_predict(X)

print(df.head())

3. 可视化聚类结果

# 可视化结果
# 绘制散点图，每个簇使用不同颜色表示
plt.scatter(X['AnnualIncome (k$)'], X['SpendingScore (1-100)'], c=df['Cluster'], cmap='viridis')
# 绘制聚类中心点，用红色表示
plt.scatter(kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:, 1], s=300, c='red')
# 添加轴标签
plt.xlabel('Annual Income (k$)')
plt.ylabel('Spending Score (1-100)')
# 添加标题
plt.title('Customer Segmentation using K-means')
# 显示图形
plt.show()

4. 分析和实际应用

在这个例子中，我们使用了一个包含顾客ID、年收入和消费得分的简化销售数据集。我们使用K-means算法将顾客分成三个群体，然后通过散点图可视化不同群体的年收入和消费得分。这个示例可能对一个零售企业有实际意义，可以根据不同顾客群体的特征制定个性化的营销策略。例如，高收入且高消费得分的群体可能是高价值顾客，可以针对他们提供更精细化的服务和促销活动。通过这样的客户分群，企业可以更好地理解其目标市场，从而优化销售和服务策略。

运行截图：

猜你喜欢

转载自blog.csdn.net/linjiuxiansheng/article/details/134903251

【机器学习】利用K-means算法进行客户分群

机器学习---算法---k-means算法

用K-Means聚类分析做客户分群

转：用K-Means聚类分析做客户分群

k-means实战-RFM客户价值分群

机器学习算法之K-means

K-means算法-机器学习入门

机器学习（十一）：K-Means算法

机器学习--K-means算法

机器学习算法（2）-K-means

机器学习(十五) K-means 算法

机器学习——K-means算法

如何利用 Python 进行客户分群分析（附源码）

机器学习——聚类算法之K-means与K-means++,K-meansⅡ

利用K-means算法进行图像分割

【机器学习】使用K-Means聚类细分客户

机器学习-----K-Means

机器学习 --- k-means

机器学习——K-means

机器学习之K均值(K-Means)算法

【机器学习算法推导】K均值（K-means）

机器学习 | 算法笔记- K均值（K-Means）

机器学习之K-Means（k均值）算法

机器学习实战(8) 利用K-means聚类算法对未标注数据分组

【机器学习七】利用K-means压缩图片

【机器学习】K-means算法和DBSCAN算法

机器学习算法（七）K-Means算法

机器学习——K-means算法（聚类算法）

机器学习 - 算法 - 聚类 K-MEANS 算法

python 实现k-means聚类算法银行客户分组画像实战（超详细，附源码）

今日推荐

数学建模Matlab之数据预处理方法

充电桩---ISO15118协议详细介绍

对话Kaldi之父、小米首席语音科学家Daniel Povey：开源环境比金钱和荣誉更吸引我 | AGI技术50人...

Hugging Face全攻略：轻松下载Llama 3模型，探索NLP的无限可能！【实操】

阅读送书抽奖？玩转抽奖游戏，js-tool-big-box工具库新上抽奖功能

百度发布Comate代码知识增强2.0，国内首个支持实时检索智能代码助手

黑客利用扫雷游戏 Python 克隆隐藏恶意脚本，攻击欧洲和美国金融机构

微软对开源字体 Cascadia Code 进行重大更新

好书推荐《ChatGPT原理与架构：大模型的预训练、迁移和中间件编程》

Baidu Comate 智能编码助手：编程新伙伴，效率新飞跃

AI时代：人工智能大模型引领科技创造新时代

百篇博客 · 千里之行

周排行

Python模块之shelve

勇于承担责任

Hikyuu 1.1.0 发布，量化交易研究框架

字节跳动Java3面“凉凉”~不负韶华，努力复习备战“金三银四”

Linux下静态链接库与动态链接库的区别

spring boot架构改造

怎么理解AOP

文件不同步 --本地和eclipse

在linux配置nginx负载均衡

Linux Shell基础命令

每日归档

更多

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)

2024-05-23(9)

2024-05-22(41)

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)