开奖网源码搭建与我用Python

很多读者一谈到“编程”、“代码”、“程序员”等词汇,再看到花花绿绿的代码,还没开始学习就先打了退堂鼓,大学时代受“C语言”虐待的恐惧感油然而生。开奖网源码搭建
QQ:2152876294 网址diguaym.com毕竟现在社会化分工越来越细,并不是每个专利信息从业人员都非得去学一门编程语言。但是,对于那些希望在专利信息领域深耕或对编程有浓厚兴趣的人,笔者认为是确有必要的。

为给大家打气,在介绍Python语言之前,先讲一个日本老太太的故事。老太太叫若宫雅子,今年已经82岁高龄,60岁退休后她购买了自己的第一台电脑并开始自学编程。2017年2月,她开发的第一款游戏「雏坛」(Hinadan)在 App Store 日本区上架,迄今下载量已超过4.2万次,她也成为全球年龄最大的 iOS 开发者。可见,只要有一颗想学习的心,任何时候开始都不算晚!
初识Python

Python语言是在八十年代末和九十年代初,由Guido van Rossum在荷兰国家数学和计算机科学研究所设计出来的。“Python”这个词实际是来自于作者喜欢的一个喜剧团体(Monty Python),也是“大蟒蛇”的意思,因此,Python语言的logo也是蟒蛇的形象。关于Python语言的标签一般有“简单易学”、“优雅”、“胶水语言”,还有“人生苦短、我用Python”的情怀标语。用专业一点的描述来说,Python是一种面向对象、动态的、强类型解释型语言。

Python本来是一个比较小众的语言,但是近年来随着机器学习及人工智能的兴起,Python在数据处理方面的优势,Python语言一下子就火热起来。根据2017年IEEE Spectrum 发布了第四届顶级编程语言交互排行榜,Python甚至荣登榜首[1]。在2018年1月HankerRank发布了2018年开发者技能调查报告中,在“最受雇主青睐的编程语言”中排名第三,而在爱恨指数排名中,Python 则赢得了全年龄段开发者的芳心[2]。

关于Python的基础知识,本文不打算展开,而是重点介绍Python与专利数据处理相关几个工具包:Pandas、NLTK和Scikit-learn。
数据处理工具包:Pandas
Pandas是python的一个数据分析包,最初由AQR Capital Management于2008年4月开发,并于2009年底开源出来。Pandas的名称来自于面板数据(panel data)和python数据分析(data analysis),从其名称就可以反映出,这个工具包就是专门来处理数据的。

对于首次接触Pandas的读者,可以用Excel来进行一个简单的类比。Pandas中提供了一种二维表格型数据结构:Dataframe,可以将其类比于Excel 中的一张表。这样所有Excel中的数据处理和数据分析的功能可以全部在DataFrame上来实现。

猜你喜欢

转载自blog.51cto.com/13914125/2156208
今日推荐