プロジェクトの紹介:
データセットには、GeeksforGeeks Web サイト上の 34,000 以上の記事データが含まれています。
データが示している
分野 | 説明する |
---|---|
タイトル | 記事のタイトル |
著者ID | 記事の著者 |
最終更新 | 記事が最後に更新された日付 |
リンク | GeeksforGeeks の記事へのリンク |
カテゴリー | 記事の分類 |
データソース
(97 メッセージ) マルチカテゴリ データセット マルチカテゴリ データセット リソース - CSDN ライブラリ
データのクリーニングと概要
pandas を pd としてインポート numpy を np として インポート matplotlib.pyplot を plt として sklearn.model_selection からインポート train_test_split を sklearn.naive_bayes からインポート MultinomialNB、ComplementNB、BernoulliNB を sklearn.metrics からインポート brier_score_loss を BS として sklearn.feature_extraction.text からインポート TfidfVectorizer を TFIDF として インポート pyechart s .options as opts from pyecharts.charts import WordCloud,Ta