ナインは、推奨のgit / githubのプロジェクトデータ分析ツールを
任意の重要な決定は、だけでなく、プロジェクトやソフトウェア開発のためのデータ、情報に基づくべきです。今日、王jiongが草はあなたにいくつか与えるそれらを学ぶためのGit / GitHubのオープンソース解析ツールを。
1、GitHubのAPI
言ってまず最初は、ということです GitHubの公式APIは、これは詳細な倉庫のGitHub取得するための最良の方法です。APIは非常に使いやすいです、あなたはすべての情報リポジトリ(オンラインGitのその他の公共のホスティングプラットフォームまたは自作Gitlabが同様のAPIを持っている)を取得、カールライブラリや他の言語パックを使用することができます。しかしである、時間あたりの要求の数が限られている制限するために作られたのGitHub APIの呼び出しあなたは、大規模なプロジェクトを分析に使用したい場合は APIを。
ことで GitHubのAPI、あなたは基本的に、あなたはGitHubのリポジトリブラウザプロジェクトを訪問したときに表示が、内部情報のGitリポジトリ情報が限定されている全ての情報を取得し、あなたが必要とするのgitコマンドで完全な情報を取得するために、クローン倉庫を。
2、GHCrawler
GHCrawlerは、マイクロソフトで堅牢なのGitHub APIの爬虫類を開発している、とのメッセージがGitHubのエンティティ、その検索と追跡を横断することができます。あなたは、組織やプロジェクトの活動を分析したい場合は、GHCrawler特に有用です。リクエストの数を制限しますが、トークン・プールおよび回転によってトークンの使用GHCrawlerのAPIを最適化することによってもGHCrawlerのGitHub API。GHCrawlerまた、Webインタフェースの動作終了をサポートしているコマンドラインの呼び出しをサポートしています
3、GHアーカイブ
GHアーカイブは、プロジェクトのオープンソース、それをアーカイブ、記録するための公共GitHubのタイムラインで、さらなる分析のために、それは簡単にアクセスできるようにするため。GitHubのアーカイブGitHubのイベントは、すべての情報は、JSONファイルのセットに格納され、オフライン処理するために、必要に応じてダウンロードされる取得します。
また、 GitHubのアーカイブでは、Google BigQueryの上で使用される一般的なデータセットとして使用することができます。データセットは1時間ごとに自動的に更新され、SQLに似たクエリは、数秒でデータセット全体のいずれかで実行することができます。
4、GHTorren
そして GHアーカイブは同様に、GHTorrent GitHubのプロジェクトも公開イベントスケジュール情報を監視するために使用されます。各イベントのために、それは詳細と相互依存性にその内容を取得することができます。また、MySQLデータベース構造に抽出しながら、得られた情報は、次に、MongoDBのJSONデータベースに格納されます。
両方のGHアーカイブは時給周波数の情報を取得し、イベントのより詳細なセットを提供するように設計されていることを除いてGHTorrentとGHアーカイブやや似て、。GHトレント場所は、それが簡単にイベントに関連するすべてのイベントについての情報を得ることを可能にするために、より構造化ファッションイベントデータを提供し、データの取得頻度は毎月です。
5、キブル
Apacheのキブルは、プロジェクト活動のために収集、集計および可視化ソフトウェアへのツールのセットです。キブルキブルアーキテクチャは、中央サーバとキブルプッシュサーバコンパイル済みリソース・オブジェクトおよびデータの特定のタイプで使用するために設計されたアプリケーションをスキャンする複数から成ります。
これらのデータに基づいて、表示部材は、多くの小さなデータ項目を含み、ダッシュボードをカスタマイズすることも可能です。この意味で、キブルは、より多くのWebプロジェクトのデータを作成するためのツールの端を示しています。
6、CHAOSS
CHAOSSは健康的なオープンソースコミュニティを定義し、ヘルプにデータ分析と指標を作成するために、Linux Foundationのプロジェクト、です。CHAOSSプロジェクトは、プロジェクトを計算するために必要な指標やデータをタップすることができ、多くのツールがあります。
占い師があるオープンソースのソフトウェア開発プロジェクトに関連する健康と持続可能性指標を提供するためのPythonライブラリ、フラスコのWebアプリケーションとRESTサーバー。
Cregitは変化を可視化するためのビューを生成するためのソースコードに焦点を当てています
** GrimoireLab ** Bitergiaのこれまでで最も成熟し、野心的なツール。、自動データが豊富なクリーンアップやデータの可視化、上記のデータ収集を拡大するには、時間枠、プロジェクト、店によると、ほぼ自動および増分データのオープンソース開発に関連したツールのいずれかから収集することができます。GrimoireLabの目的は、オープンソースのプラットフォームを提供するために図書室、貢献者や他の検索フィルタ。
7、ソース化
ライフサイクルデータプラットフォームの開発のための主張調達。以前のツールと比較すると、それはより多くのプロジェクトのコードではなく、共同のコミュニティを懸念しています。共通ASTを使用してソースのプロジェクト、途中でコードベースのクエリの詳細の言語を行うには何を達成することはできません。
でソース化プロジェクト組織、あなたはいくつかの興味深いデータ分析ツールを見つけることができます。含みます:
git -ゴー:純粋な高度にスケーラブルなgitリポジトリを達成するためにGolang言語。
エルキュール: golangは、リポジトリ全体のために提出履歴解析ツールを実現します。
gitbase: GitのリポジトリGolang SQLデータベースインタフェースの実装。
8、ハッブル
ハッブル宇宙望遠鏡の可視化GitHubのエンタープライズ・コラボレーション、使用状況や健康データのため。それは、彼らの内部組織を理解するために大企業を支援し、そしてどのように一緒に貢献分布とコラボレーションを投影することに努めています。
ハッブルエンタープライズは、2つのコンポーネントで構成されています。更新コンポーネントは、GitHubのエンタープライズ・デバイス関連データから日照会Pythonスクリプトであり、Gitのリポジトリに格納し、結果。ドキュメントのコンポーネントは、GitHubのページをホストすることにより、収集したデータの可視化のためのWebアプリケーションです。
9、Onefetch
最後に、非常に強力な言及の下で、コマンドライン、50個の言語のためのGitプロジェクト情報の可視化ツール、サポートを、それは錆言語を浮上しているので、それを言及。