野心的なデータ科学者のために、どのように彼らは雇用市場と関連する科学的データに目立ちますか?2019年には、十分なデータ科学関連の仕事があるだろうか?または縮小があるかもしれませんか?次に、私たちはデータ科学の傾向を分析し、ビッグデータと機械の将来に良い仕事を取得する方法を学習/ AIフィールドを探索してみましょう。"
1、あなたは、確率統計の固体把握を必要とし、学び、そのようなナイーブベイズ、ガウス混合モデル、隠れマルコフモデル、混同行列、ROC曲線、P-価値などなど、いくつかのアルゴリズムを、習得します。
これらのアルゴリズムは理解しますが、また、彼らがどのように動作するかを知ってはいけません。あなたは、関連する製品のアルゴリズムの方法を見つけ、それぞれの方法論ラング、二次計画、偏微分方程式を引っ張る、勾配降下、凸最適化の固体把握を必要とします。
あなたは高給の仕事を探している、だけでなく、K-NN、ナイーブベイズ、SVMと意思決定の森として、技術と機械学習アルゴリズムを習得する必要がある場合。
2、
今、ほとんどの機械学習は、大量のデータを必要とするので、あなたは、単一のマシン上で機械学習することはできません。だから、あなたはあなたがそうでApacheのHadoopや、Rackspaceの、アマゾンEC2、Googleのクラウドプラットフォーム、OpenStackのとMicrosoftのAzureなどのクラウドサービスの数をマスターする必要があると、クラスタを使用する必要があります。
あなたはまた、そのようなので、上のTRと、猫は、grepを、見つける、AWK、sedは、ソート、カットなどのUnixのさまざまなツールを持っている必要があります。機械学習は、基本的にUnixシステム上で実行されているので、あなたはこれらのツールを習得する必要があり、その役割とその使用方法を知っています。
図3は、同時にプログラミング言語やアルゴリズムの把握に、データの可視化の役割を見落とさないようにしてください。あなたが自分自身や他の人がデータを理解できるようにすることができない場合、それらは無意味になります。データの可視化は、彼らが値を導出するように、適切なタイミングで適切な人にデータを提示する方法を指します。含む一次データ可視化ツール:タブロー、QlikViewを、Somekaヒートマップ、FusionChartsの、Sisense、Plotly、Highcharts、Datawrapper、D3.jsは、好きggplot。
4、データ科学者になるためには、科学データの学位を取得する必要はありません。実際には、あなたは絶対にこれを実行する必要はありませんが、これは良いアイデアではありませんありません。あなたがコンピュータの学位、工学の学位、経済学の学位、数学、統計の学位の学位、学位をアクチュアリー、または自然科学(物理的、化学的または生物学)における金融の学位の学位を得ることができる場合も可能です。そして、(社会科学を含む)も、人文科学も可能です。
投機のセンターステージにAI技術のビッグデータは、データ科学と機械学習は、すべての人生の歩みに現れ始めました
機械学習は、データ分析上の問題を解決するために適用されるようになりました。機械学習、AIと予測分析は、2017年にホットな話題となっています。私たちは、科学的なデータプラットフォームを含め、技術革新の値に基づいて学習と機械学習クラウドサービスのいくつかの主要なベンダーだけでなく、機械の知能、規制分析、そして物事の行動分析の深さを、データを目撃しました。
AIは今、開発のペースを加速する、今年は今年再定義するAI技術と科学的なデータの復活となります。野心的なデータ科学者のために、どのように彼らは雇用市場と関連する科学的データに目立ちますか?2019年には、十分なデータ科学関連の仕事があるだろうか?または縮小があるかもしれませんか?次に、私たちはデータ科学の傾向を分析し、ビッグデータと機械の将来に良い仕事を取得する方法を学習/ AIフィールドを探索してみましょう。"
技術力を強化
プログラミング言語や開発ツール
365のデータ・サイエンス1001のデータはLinkedInのから情報を収集し、科学者が発見したR言語プログラミング言語はPython、およびSQLの最大の需要。また、MATLAB、Javaの、スカラ座やC / C ++の用語の知識が必要です。目立つために、我々はウェカとnumpyのようなツールを習得する必要があります。
確率統計、応用数学と機械学習アルゴリズム
あなたは、確率統計の固体把握を必要とする、というようにそのようないくつかの単純ベイズなどのアルゴリズム、ガウス混合モデル、隠れマルコフモデル、混同行列、ROC曲線、P-値とを学び、習得します。
これらのアルゴリズムは理解しますが、また、彼らがどのように動作するかを知ってはいけません。あなたは、関連する製品のアルゴリズムの方法を見つけ、それぞれの方法論ラング、二次計画、偏微分方程式を引っ張る、勾配降下、凸最適化の固体把握を必要とします。
あなたは高給の仕事を探している、だけでなく、K-NN、ナイーブベイズ、SVMと意思決定の森として、技術と機械学習アルゴリズムを習得する必要がある場合。
分散コンピューティングおよびUnixツール
现在大部分机器学习都需要海量数据,所以你无法在单台机器上进行机器学习。所以,你需要用到集群,需要掌握 Apache Hadoop 和一些云服务,如 Rackspace、Amazon EC2、Google Cloud Platform、OpenStack 和 Microsoft Azure 等。
你还需要掌握各种 Unix 工具,如 cat、grep、find、awk、sed、sort、cut、tr 等。因为机器学习基本上都是在 Unix 系统上运行的,所以需要掌握这些工具,知道它们的作用以及如何使用它们。
查询语言和 NoSQL 数据库
传统关系型数据库已经老去。除了 Hadoop 之外,你还需要掌握 SQL、Hive 和 Pig,以及 NoSQL 数据库,如 MongoDB、Casssandra、HBase。
基于 NoSQL 分布式数据库的基础设施已经成为大数据仓库的基础。原先在一个中心关系型数据库上需要 20 个小时才能处理完的任务,在一个大型的 Hadoop 集群上可能只需要 3 分钟时间。当然,你也可以使用 MapReduce、Cloudera、Tarn、PaaS、Chef、Flume 和 ABAP 这些工具。
数据可视化工具
在掌握编程语言和算法的同时,不要忽略了数据可视化的作用。如果无法让你自己或别人理解数据,那么它们就变得毫无意义。数据可视化就是指如何在正确的时间向正确的人展示数据,以便让他们从中获得价值。主要的数据可视化工具包括:Tableau、QlikView、Someka Heat Maps、FusionCharts、Sisense、Plotly、Highcharts、Datawrapper、D3.js、ggplot 等。
正确选择教育背景和专业
データ科学者になるためには、科学データの学位を取得する必要はありません。実際には、あなたは絶対にこれを実行する必要はありませんが、これは良いアイデアではありませんありません。あなたがコンピュータの学位、工学の学位、経済学の学位、数学、統計の学位の学位、学位をアクチュアリー、または自然科学(物理的、化学的または生物学)における金融の学位の学位を得ることができる場合も可能です。そして、(社会科学を含む)も、人文科学も可能です。
しかし、おそらくあなたは、このような経済学など他の分野、より良い開発を得るでしょう、数学やエンジニアリングが適用されます。まず、この道路は彼らのために適切ではない科学的なデータを決定します。2019年は、データ科学の分野に興味のある人は失望の人々を手放すことはありません。しかし、その後、再び、脳の分析能力、熟練したプログラミングのスキル、誠実な熱意と継続的な自己改善の忍耐を使用してデータ科学者はこれまで行く方法を決定します。
より多くの記事を見ます:
私は困難な大規模なデータの基礎を学びたいと思いませんでしたか?