トップ「をクリックしてAI適切な方法」、「スター」公開番号を選択します
ヘビー乾燥品は、最初の時間をお楽しみいただけます
選択| TowardsDataScience
ほとんど人間|コンパイル
参加|悪魔
データ解析能力を向上するには?自分の経験によるとピーターNistrupは7つの便利なツールを示しています。
この記事では、いくつかの強化や日常のデータ分析技術を含む加速示しています:
1.パンダプロファイリング
2. Plotlyカフスと描画データパンダ
3. IPython魔法のコマンド
4. Jupyterフォーマット
5. Jupyterショートカット
6. Jupyter(又はIPython)複数の出力と同時に操作部
7.即座Jupyterノートブック用のスライドショーを作成
1.パンダプロファイリング
ツールの効果は明らかです。下図)は(この単純なメソッド呼び出しdf.profile_reportの結果を示しています。
唯一のツールをインストールするために使用し、パンダプロファイリングパッケージを導入します。
本論文では、より多くを学ぶためのツールを詳しく説明しませんが、お読みください:
https://towardsdatascience.com/exploring-your-data-with-just-1-line-of-python-4b35ce21a82d
2. Plotlyカフスと描画データパンダ
ほとんどの「経験」データ科学者やデータアナリストはmatplotlibのとパンダに精通しています。言い換えれば、あなたは、単に()メソッドを呼び出す.PLOT、すばやく簡単なpd.DataFrameまたはpd.Seriesを描くことができます。
掘削ビット?
これは非常に良いされているが、場合は、対話型、スケーラブルで拡張可能なパノラマそれを描くことができますか?カフス* *のために実行するための時間です!(Plotlyベースのカフスは、さらにパッケージを作りました。)
環境カフスに設置され、単にターミナルで実行!ピップは--upgradeができカフスボタンをインストールします。次の図を表示します。
効果は非常に良いです!
注意,上图唯一改变的是 Cufflinks cf.go_offline() 的导入和设置,它将 .plot() 方法变为 .iplot()。
其他方法如 .scatter_matrix() 也可以提供非常棒的可视化结果:
需要做大量数据可视化工作的朋友,可以阅读 Cufflinks 和 Plotly 的文档,发现更多方法。
3. IPython 魔术命令
IPython 的「魔术」是 IPython 基于 Python 标准语法的一系列提升。魔术命令包括两种方法:行魔术命令(line magics):以 % 为前缀,在单个输入行上运行;单元格魔术命令(cell magics):以 %% 为前缀,在多个输入行上运行。下面列举了 IPython 魔术命令提供的一些有用功能:
%lsmagic:
找出全部命令
如果你只记得一个魔术命令,那必须得是这一个。执行 %lsmagic 命令将提供所有可用魔术命令的列表:
%debug:
交互式 debug
这可能是我最常使用的魔术命令了。
大部分数据科学家都遇到过这种情况:执行的代码块一直 break,你绝望地写了 20 个 print() 语句,想输出每个变量的内容。然后,当你最终修复问题后,你还得返回并再次删除所有 print() 语句。
不过以后再也不用这样了。遇到问题后只需执行 %debug 命令,即可执行想要运行的任意代码部分:
上图中发生了什么?
我们有一个函数,它以列表为输入,并对所有的偶数取平方值。
我们运行函数,但是出了些问题。但是我们并不知道怎么回事!
对该函数使用%debug 命令。
让调试器告诉我们 x 和 type(x) 的值。
问题显而易见:我们把'6'作为字符串输入到函数中了!
这对于更复杂的函数非常有用。
%store:
在 notebook 之间传递变量
这个命令也很酷。假设你花了一些时间清洗 notebook 中的数据,现在你想在另一个 notebook 中测试一些功能,那么你是在同一个 notebook 中实现该功能,还是保存数据并在另一个 notebook 中加载数据呢?使用%store 命令后,这些操作都不需要!该命令将存储变量,你可以在其他任意 notebook 中检索该变量:
%who:
列出所有全局变量。
你是否遇到过,为变量赋值后却忘记变量名的情况?或者不小心删掉了负责为变量赋值的单元格?使用%who 命令,你可以得到所有全局变量的列表:
%%time:
计时魔法命令
使用该命令可以获取所有计时信息。只需对任意可执行代码应用%%time 命令,你就可以得到如下输出:
%%writefile:
向文件写入单元格内容
在 notebook 中写复杂函数或类,且想将其保存到专属文件中时,该魔法命令非常有用。只需为函数或类的单元格添加 %%writefile 前缀和想要保存到的文件名即可:
如上所示,我们可以将创建的函数保存到 utils.py 文件中,然后就可以随意导入了。在其他 notebook 中也可以这样,只要与 utils.py 文件属于同一个目录即可。
4. Jupyter 中的格式编排
这个工具很酷!Jupyter 考虑到 markdown 中存在 HTML / CSS 格式。以下是我最经常使用的功能:
蓝色、时尚:
<div class="alert alert-block alert-info">
This is <b>fancy</b>!
</div>
红色、轻微慌张:
<div class="alert alert-block alert-danger">
This is <b>baaaaad</b>!
</div>
绿色、平静:
<div class="alert alert-block alert-success">
This is <b>gooood</b>!
</div>
下图展示了它们的运行过程:
当你想以 Notebook 格式呈现一些发现时,这非常有用!
5. Jupyter 快捷键
キーボードショートカットを知っていて、勉強したい、あなたはコマンドパネルを使用することができます:Ctrlキーを押しながら+ Pシフト、すべてのノートブックの機能のリストを取得します。以下は、最も基本的なコマンドのいくつかを選択します:
コマンドモードでは:
編集モード:
Shift + Tabを:あなたは、現在のセルに入力したオブジェクトのドキュメンテーション文字列(文書)を提供する、ショートカットキーを使用し続けて、ドキュメントモードを再利用することができます。
Ctrl + Shiftキー+ - カーソルの位置に現在のセルを分割します。
Escキー+ F:(出力は含まない)コードを検索と置換。
Escキー+ O:セルの出力を切り替えます。
複数のセルを選択します:
あなたが複数のセルを選択した場合、あなたはバッチ操作を実行している/ /コピー/カット/ペーストを削除できます。
6. Jupyter(又はIPython)複数の出力と同時に操作部
.head()と.tail()のパンダのデータフレームを表示したいのですが、コードの原因ランニング.tailを作成する()メソッドの追加ユニットはあまりにも面倒ですし、この経験を持っていた場合、ドロップアウトしなければなりませんでしたか?今、恐れることはありません、あなたは、次のコード行を表示するようにしたい出力を使用することができます示しています。
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"
次の図は、出力された複数の結果を示しています。
7.即座Jupyterノートブック用のスライドショーを作成
RISEを使用して、あなただけの通過スライドにキーJupyterノートブックインスタントことができます。そして、ノートブックを使用すると、スライドショーながら、リアルタイム符号化を行うことができ、まだアクティブであります!
ツールを使用するには、単にcondaやピップでRISEをインストールすることができます。
conda install -c conda-forge rise
若しくは
さて、あなたはノートブックのための素晴らしいスライドを作成するには、Newボタンをクリックすることができます。
(読むためにジャンプするタイトルをクリックしてください)