python+mysql 进行变量衍生 - 代码天地

python+mysql 进行变量衍生

其他 2018-09-05 12:09:13 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/jin_tmac/article/details/80064712

我们在建模时，需要对原始数据进行处理包括缺失值、变量衍生等操作。尤其是变量衍生，完全用Python有一定的难度。我之前的做法是将原始数据导入sas，所有的前期变量清洗、衍生操作全部都在sas里完成。现在想着如何在没有sas的情况下进行数据处理。于是就有了python+mysql：将数据导入mysql，所有的变量处理操作都在navicat进行，生成许多衍生变量表，pandas直接连接自定义的数据库。

具体过程如下：
1、安装mysql:我用的是5.7版本，直接官网下载，参考安装教程。另外安装的时候遇到require .net framework错误，在官网上下载安装就行。
2、安装navicat:数据库管理工具，网上搜索破解版本的，很好安装。
3、pymysql：用anaconda安装即可。

具体应用如下：

import pandas as pd
import pymysql

#查询中含有中文时需加入use_unicode=True, charset="utf8"。

conn = pymysql.connect(host='localhost',port=3306,user='root',passwd='*****',db='tianchi_data',use_unicode=True, charset="utf8")

sql = 'select * from test1'

df = pd.read_sql(sql, con=conn)

a.close()

/——————————–补充的分界线————————————/
在用mysql创建数据库时，会越到中文字符无法插入数据库创建不成功的情况，此时加上CREATE DATABASE `database` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci; ，其中那个字符是esc下面那个，非单引号，是一个转义字符；
DEFAULT CHARACTER SET utf8：数据库字符集。设置数据库的默认编码为utf8，这里utf8中间不要”-“；
COLLATE utf8_general_ci:数据库校对规则。

参考：
1、mysql

猜你喜欢

转载自blog.csdn.net/jin_tmac/article/details/80064712

python+mysql 进行变量衍生

python+mysql中数据库表名为变量处理方式

python+mysql

数据库编程（python+mysql）

Python+MySQL数据库操作

Python+Mysql实现登录验证程序

python+mysql：简单的数据库控制脚本

pc端扫码软件：python+mysql

Python+MySQL的坑之bit型数据

Python+Mysql学生选课系统（附下载链接）

Python+mysql数据库创建（八）

python+mysql搭建信息管理系统

基于Python+MySQL的飞机大战游戏包含用户登录

基于Python+MySQL所写的智慧校园考试系统设计

基于Python+MySQL所写的音乐网管理系统

基于Python+MySQL的图书管理系统

基于Python+MySQL所写的商城管理系统

在Windows上安装Python+MySQL 的常见问题及解决方法

分享一个简单的python+mysql网络数据抓取

Python+MySQL开发医院网上预约系统（课程设计）一

10分钟教你Python+MySQL数据库操作

python+mysql:实现一千万条数据插入数据库

基于中国天气网的数据库设计与开发(python+MySQL)

数据可视化之新型冠状病毒肺炎疫情地图(python+MySQL)

python+mysql练手小项目（增删改查手机信息）

基于python+mysql超市信息管理系统（附完整源代码）

数据库课设--基于Python+MySQL的餐厅点餐系统

PYTHON3 连接MYSQL并变量为条件进行查询

Python+mysql数据库+传感器（将传感器获得数据存入数据库）

基于Python+MySQL的图书销售管理系统课程论文+项目源码及数据库文件

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)