どのように単語の雲を描画するためのPythonを使用する:例えば、上向きの普及に?

より多くの企業が今より複雑な要件を持つデータ解析機能の側面のためのプロダクトマネージャーのポジションを持っているとして、製品マネージャーは、データ解析とのルート思考のためのデータ解析ツールを習得する必要があります。データ分析ツールは、主に以下のとおりです。SQLステートメントは、エクセル、ネットレッドパイソンに新しい言語をデータベースを操作します。

Python言語は、私は、入門書を読んだ後、使用Pythonはそれぞれ上記のコードワードクラウド「普及上向きの女王」の小説を行う行うにはいくつかのコードファイルの実際の筆跡を、プログラミング言語は非常に良い学校として歓迎、とされていますそれは、Pythonの学習チャット私の気持ちを通過した後、文の意味を説明し、このコードにコメントです。

はじめに説明

なぜに関しては言葉がそれを曇らせるされますか?

主な理由は2点:

  1. 私は最初の接触のワードクラウドを愛し、私たちは爬虫類やワードクラウドアイデアを行うにはPythonを使用している、力の武器にロードされるように表示されます。
  2. 「ワードクラウド」は、視覚的なフォームのテキストメッセージの多くフィルタリングする「レンダリングされたキーワード」「キーワード雲」またはを強調表示することが発生した「キーワード」のウェブテキストの高い周波数であり、限りとして、ウェブを閲覧テキストのスイープは、テキストの要旨を楽しむことができます。(Baiduの百科事典から解釈、「ワードクラウドは、」テキスト分析のために、まだ非常に重要です)

あなたがコードを読むことができるようにしたい場合は、持っている必要があります。

  1. Python言語の文法構造を理解します。
  2. Python言語の標準的なパッケージ、サードパーティ製のパッケージとの違いを学びます。
  3. Pythonのコードベースが英語で、ある程度、英語を理解し、それを行うには平均値を表す、コード感があります。

あなたが使用する演習を行うことができるようにしたい場合は、持っている必要があります。

  1. お使いのコンピュータは、Pythonをインストールされています。
  2. Pythonのためにあなたが開始している、あなたは、演習の例を取る必要があります。
  3. あなたは、さまざまなサードパーティ製のパッケージとPythonのピップに精通マウントすることができます。
  4. 簡単便利なコードコードは、コードエディタをすることができますインストール。
  5. ダウンロードは上向き小説txtファイルを広げます。

環境例

コンピュータシステム:Window10

Pythonのバージョン:Python3.7(Python2とのpython3差が比較的大きくなり、変更の除去後の文の多くは、その新しいバージョンを使用するようにしてください)

コード・エディタ:崇高テキスト3

テキストの例

次のスクリーンショットのサンプルコード(ここではプット・スクリーンショット、あなたがコードの能力をしたい場合、それは手動でのコードの気持ちを養う、ノックするのが最適です):

実施例で使用される上方画像(の画像検索から)次のように広げ。

这里需要注意的是,图片需要是白色背景,方便代码识别。这个图片是用PS去掉背景的,看着稍微糙一些。

例子中使用WordCloud的fitwords函数,根据词频绘制图片,取排名前1000个词,效果图如下:

从词云图中也可以看出了,主角是扶摇无疑,接下来是两个大大的“长孙”和“无极”,一个小的“元昭诩”,男主子位置稳固。“北野”、“宗越”、“云痕”等人物的名字大小都代表了在小说中出现的次数与分量,其中男主子宠物“元宝”丝毫不落下风,俨然仗着自己男一号萌宠的身份和可耐的形象力压群雄。

其他的词,大家也可以分析一番,像“眼神”、“目光”、“微笑”、“轻轻”等词很容易让人再次联想到剧中的浪漫情节,bulabula…

我的感触

在做这个实例的时候,是找的网络上的示例看着做的,但是代码并非直接拿过来就可以使用,在本地会出现不同的错误,网络上的示例代码本身也有小部分缺失,这时候需要根据bug的提示错误一边某度一边根据代码感觉进行更改试验调试,最终出来结果。

代码的神奇之处还在于:同样的代码换了个环境可能就出现不知名问题,所以要有耐心、怀着期待完成你自己的作品。

好了,实例到这里,那么此时本人对于Python的认识是怎么样的呢?真的是一部分人所说的“数据分析从入门到放弃”吗?

其实这是因人而异的,看你的目标和方法、希望掌握的程度了:

  1. Python入门还算比较容易,入门之后的深钻就需要下大功夫了;
  2. Pyhton很受欢迎,除了自带的标准库之外,还有众多第三方包,适用于不同场景,如果只是做数据分析的话,抓住其中的重点来看:numpy、pandas、matplotlib,其他的包用到的时候某度就好了;
  3. 语言功能很强大,本次实例中除去注释之后,真正用的语句并不多,一个包提供的函数就能够实现酷炫能力;
  4. Python学习的重难点是:第三方包众多、函数众多、不同函数参数不同,各个函数的作用与用法都需要琢磨理解,根据自己的需求找到使用的函数;
  5. 学习Pyhton要有好的心态,有目标地学,入门、掌握学习方法、根据实际场景运用;

对于数据分析,Python只是一个很重要的工具,有些情况下需要掌握,但数据分析最重要的还是思路和业务使用,根据用途使用工具,不能剑走偏锋,只是掌握了工具而没有思路理论支持的话,很容易就从产品经理学成数据分析师了。

在数据分析思路与数据分析工具之间一定要找一个很好的平衡点,让我们在产品路上一起努力吧。

发布了165 篇原创文章 · 获赞 45 · 访问量 4万+

おすすめ

転載: blog.csdn.net/u010199413/article/details/104342850