爬虫常见问题。 - 代码天地

爬虫常见问题。

其他 2018-11-23 02:22:10 阅读次数: 0

1.如果遇到带有中文的url怎么办

如果URL中存在中文，而你却不对它做任何处理，他不会达到你所想的那样，因此我们需要将中文部分进行处理，要用到urllib.parse模块中的quote将中文转化成URL所需的编码，url中的中文要单独处理，不能中英文全部合在一起处理（因为一部分的特殊字符也会被处理掉）。

import urllib.parse
 
word='龙'
word=urllib.parse.quote(word)
url='https://baike.baidu.com/search/word?word=%s'%word
print(url)

2.新建文件夹

	def mkdir(path):  ##这个函数创建文件夹
		path = path.strip()
		isExists = os.path.exists(os.path.join("D:\\爬虫练习\\aa", path))
		if not isExists:
			print(u'建了一个名字叫做', path, u'的文件夹！')
			os.makedirs(os.path.join("D:\\爬虫练习\\aa", path))
			os.chdir(os.path.join("D:\\爬虫练习\\aa", path))  ##切换到目录
			return True
		else:
			print(u'名字叫做', path, u'的文件夹已经存在了！')
			os.chdir(os.path.join("D:\\爬虫练习\\aa", path))  ##切换到目录
			return False

猜你喜欢

转载自blog.csdn.net/qq_35962520/article/details/83962786

爬虫常见问题。

python爬虫常见问题（一）

爬虫常见问题与解答

Python爬虫常见问题总结

Python爬虫常见问题

爬虫常见问题汇总

Python爬虫面试常见问题

WAS常见问题

常见问题

关于前嗅Forespider爬虫的常见问题答疑

网络爬虫常见问题（个人总结）

scrapy爬虫及数据分析过程常见问题

python爬虫面试宝典(常见问题)

ArrayList常见问题

IDEA常见问题

crc 常见问题

ZooKeeper常见问题

MySQLdb常见问题

IIS 常见问题

eclipse 常见问题

PyMongo 常见问题

eclipse常见问题

常见问题总结

MQ常见问题

ubuntu常见问题

weblogic常见问题

Maven常见问题

PostgreSQL常见问题

elasticsearch常见问题

Storm 常见问题

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)