データ サイエンス (ディープ ラーニング、データ マイニング) 用の Kotlin の基本ライブラリ

データ サイエンスのための Kotlin

データ パイプラインの構築から機械学習モデルの作成まで、Kotlin はデータを扱うための優れた選択肢となります。

  • Kotlin は簡潔で読みやすく、学習が簡単です。
  • 静的型付けと null 安全性は、信頼性が高く、保守しやすく、トラブルシューティングが簡単なコードを作成するのに役立ちます。
  • JVM 言語として、Kotlin は優れたパフォーマンスと、実証済みの Java ライブラリのエコシステム全体を活用する機能を提供します。

インタラクティブエディタ

Jupyter NotebookApache Zeppelinなどのノートブックは、データの視覚化や探索的研究に便利なツールを提供します。Kotlin はこれらのツールと統合して、データの探索、同僚との結果の共有、データ サイエンスと機械学習のスキルの構築に役立ちます。

Jupyter Kotlin カーネル

Jupyter Notebook は、コード、ビジュアライゼーション、およびマークアップされたテキストを含むドキュメント (「ノートブック」とも呼ばれる) の作成と共有を可能にするオープン ソース Web アプリケーションです。Kotlin-jupyter は、Kotlin サポートを Jupyter Notebook に提供するオープンソース プロジェクトです。

インストール手順、ドキュメント、例については、Kotlin カーネルのGitHub リポジトリを確認してください。

Zeppelin Kotlin インタープリター

Apache Zeppelin は、インタラクティブなデータ分析のための人気のある Web ベースのソリューションです。これは、データ エンジニアリングに特に役立つ Apache Spark クラスター コンピューティング システムの強力なサポートを提供します。バージョン 0.9.0以降、Apache Zeppelin には Kotlin インタープリターが組み込まれています。

クラスライブラリ

Kotlin コミュニティによって作成されたデータ関連タスク用のライブラリのエコシステムは急速に拡大しています。役に立つと思われるライブラリをいくつか示します。

Kotlin ライブラリ

  • kotlin-statistics は、探索統計と実稼働統計の拡張機能を提供するライブラリです。sum基本的な数値リスト/シーケンス/配列関数 (から)、スライス演算子 ( skewnessなど)、ビニング演算子、離散 PDF サンプリング、単純ベイジアン分類器、クラスタリング、線形回帰などがサポートされています。countBysimpleRegressionBy

  • kmathはNumPyからインスピレーションを得たライブラリですこのライブラリは、代数構造と演算、配列のような構造、数式、ヒストグラム、ストリーム演算、commons-mathkomaのパッケージ化などをサポートしています。

  • kranglは、 R のdplyrとPython のpandasからインスピレーションを得たライブラリです。このライブラリは、関数スタイル API を使用したデータ操作の関数を提供します。また、表形式データのフィルタリング、変換、集計、および再形成のための関数も含まれています。

  • lets-plot は、Kotlin で書かれた統計データ プロット ライブラリです。Lets-Plot は、JVM だけでなく、JS や Python にも対応したマルチプラットフォームです。

  • kravis は、 R のggplotからインスピレーションを得た、表形式のデータ視覚化のためのもう 1 つのライブラリです

Javaライブラリ

Kotlin は Java との相互運用性に対する最上級のサポートを提供するため、データ サイエンス用の Kotlin コードで Java ライブラリを使用することもできます。これらのライブラリの例をいくつか示します。

  • DeepLearning4J - Java 深層学習ライブラリ

  • ND4J - JVM 用の効率的な行列演算ライブラリ

  • Dex - Java ベースのデータ視覚化ツール

  • Smile - 包括的な機械学習、自然言語処理、線形代数、グラフ、補間および視覚化システム。Java API に加えて、Smile は機能的なKotlin API、Scala および Clojure API も提供します。
    • Smile-NLP-kt - Smile の自然言語処理部分の Scala インプリシットを Kotlin 拡張関数とインターフェイス形式で書き換えます。
  • Apache Commons Math - Java 用の共通数学、統計、機械学習ライブラリ

  • OptaPlanner - 最適化計画問題のソルバー ユーティリティ

  • Charts - 開発中の科学的な JavaFX グラフ作成ライブラリ

  • CoreNLP - 自然言語処理ツールキット

  • Apache Mahout - 回帰、クラスタリング、推奨のための分散フレームワーク

  • Weka - データ マイニング タスク用の機械学習アルゴリズムのセット

このリストが十分でない場合は、 Thomas Nield のKotlin データ サイエンス リソースの概要 でさらに多くのオプションを見つけることができます。

おすすめ

転載: blog.csdn.net/boonya/article/details/130315217