日常生活の例では、カイ二乗検定であるかを理解します

カイ二乗検定、統計的手法、機械学習は現在、使用される変数を見て時間です。

多くの人は、すぐに思うだろう、この言葉を聞いて、知らない
ああ?また、それをテストするためにカードを取りますか?

実際には、英語はカイ二乗検定カイ2乗検定の同音異義語です。通常の変数(または機能)、かつ、価値のシーンで大規模なデータ操作は、大きなひずみ関係ではありません。

我常听到运营和分析师这样的对话,
分析师:“这个变量我做了卡方检验了,不显著,所以我没有放进模型。”

この時点で、あなたは慎重に運用管理者を観察する場合、それらの多くは、実際に理解していない、いくつかの勤勉は直接Baiduは密かに、カイ二乗検定で何面までのいくつかを聞いてきます、何カイ二乗検定はあるが、ほとんどの運用管理者彼はアナリストの勧告を受け入れました。
結局のところ、ビジネス、Operations Managerは結果重視、物事の細部である、彼らはもつれに自分自身を感じることはありません。

これを書いている目的は、運用管理者が実際にこれらの固有名詞、次の出会い、これらの状況を聞くと、アナリストと対話する方法を知っていることを恐れてはいけないものをカイ二乗検定がある、知ることができるようにすることですし、運用レベルからより多くを上げました貴重な提案変数。

アナリストは、平均的な人は言葉を理解するために聞くことができると言う方法を学び、時間及びその他の非技術部門が通信することを可能にします。

01カイ二乗検定とは何か:

カイ二乗検定は、2つの変数の間に関係がないテストです。
一例として動作するように:

  • カイ二乗検定は差がない生鮮食品を購入する男性または女性のラインをテストすることができます。
  • 都市部の消費者のさまざまなレベルがSUVを購入し、違いはありません。

有意差があるなら、私たちはモデルや分析、外出先にこれらの変数を検討します。

02コイン投げ

その後、我々は、最も単純な例の一つについて話し始めます。
1)硬貨を決定する回数に応じて、正および負のを観察するコイン投げは、平衡または不平衡です。
通常のコインが用意されました、私はあなたに50のショットをあげる、あなたは、いくつかの肯定的ないくつかのマイナスがあるだろうと思いますか?

 

あなたは、あなたの経験によると、最高の状況は確かにそう思うだろう25は、負、正の25
しかし、ほとんど、ああ、ちょうどであることは確かあまりよくない22負、28ポジティブそれ;
23ポジティブ、27尾も可能、
間違いなく不可能負正10、40、私は本当に幸運に起こる場合を除き、。

あなたの上にこの考え方は、すでに成果(コインのがバランスしている、誰もが手と足を行わなかった)知って取ることです、さまざまな現象の数を推測起こります。

カイ二乗検定は、結果を決定するために観察される現象(正または負の投票又は周波数の数を()ではないコインが平衡である)を取ることでした。

上記の例を続けると、
私はこのコインはバランスがとれていないです知らなかった場合、私が判断する正、負の周波数を使用したいと思い、私は50回、投票
28は、正と負の22そのうちを。どのように私はこのコインは、そのバランスまたはアンバランスであることを証明するためにカイ二乗検定を使用していますか?

ここで式のカイ二乗検定を誘発します:

 

この式は、我々が使用する、私たちはカイ二乗検定の値を見つけることができます

その中で、私たちは、自信を自由度を知ることができ、我々は我々自身の意志によると、一般的に、我々は90%または95%を選択します選択します。

次のようにこれらの3つの値が計算されます。

私たちは、ルックアップするために、テーブルを、0.72未満3.841ルックアップテーブルであるため、これら3つの情報を得たので、私たちは、このコインに来ることはバランスが取れているという結論。

ここでまた、仮説検証を伴うH0 H0を拒否するかしないかを拒否し、この記事では、詳細が起動しません。

如果你们查表后,还是不知道是该大于的时候说均衡,还是小于的时候说均衡,那么你们可以想一下具体这个例子,
如果硬币是均衡的话,你觉得卡方的值是越小越可能是均衡的,还是越大越可能是均衡的呢?

03 投筛子

接下来,我们再来看一个稍微难一点的例子,投骰子。
有一个筛子,我不知道它是不是均衡的,于是我打算投36次看一下。

按照投硬币的方式,我先要画出一个表格,然后计算出3个数值,

 

带着这3个值,我们去查表,于是我们得出这个现象不能判定他是个均衡的筛子。

现在你明白其实卡方检验一点都不深奥吧。

以后如果分析师说,这个变量不显著,我把这个变量去掉了,
你就可以反问他,那卡方值是多少?
你选了多大的置信度?

04 电商中消费者的性别和购买生鲜

最后讲个平时运营分析中的案例:

我们要观察性别和在线上买不买生鲜食品有没有关系,现实生活中,女性通常去菜市场买菜的比较多,那么在线上是不是也这样。

 

我们得出观察到数据,并且形成表格后,我们需要计算理论的数据,在上面的例子我们发现,我们发现有66%的人不在线上买生鲜(599除以907),34%的人会在线上买。 那如果,男的有733个人,女的有174个人,根据这些比例,我们可以得出的理论值是什么呢?

 

根据理论和实际值,我们可以算出卡方值,自由度,并且结合我们定义的置信度,查表得到性别和线上买生鲜是显著相关的。
所以我们如果下次看到一个女性来访问我们的网站,多投放一些广告,说不定会转化哦。

看了这几个例子,是不是觉得卡方检验一点都不复杂,其实和我们生活这么贴近,我们平时的思维方式,其实就隐含着卡方检验的道理。

链接:https://www.jianshu.com/p/807b2c2bfd9b

おすすめ

転載: www.cnblogs.com/wangleBlogs/p/11118465.html