学习《python网络爬虫从入门到实践》中遇到以下错误:
Incorrect string value: '\xE7\xA8\x8B\xE5\xBA\x8F...' for column 'course' at row 1
出现这个错误的原因是,数据库的编码格式为latin1 而我要将utf8的中文插入到数据库中。
一开始修改 修改数据库的编码
alter table score default character set utf8;
但是插入中文依然出现错误。(注意运行上一行代码前先通过运行use scraping打开database,然后将上一行代码中的table score修改为table urls)
然后通过查看数据表编码(table score修改为table urls)
show create table score;
发现如下所示
注意 course 的编码仍然为 latin1 ,虽然此时表的编码已经是 utf8 , 但是不知道为什么 列的编码没有更改过来
下面就是更改列的编码即可(修改为alter table urls change content content varchar(4000) character set utf8;)
alter table score change score score varchar(50) character utf8;
修改成功之后
结果是列的编码已经修改成功
接下来插入utf8中文就没有问题了