Introdução do Projeto:
O conjunto de dados contém mais de 34 mil dados de artigos no site GeeksforGeeks.
os dados mostram
campo | ilustrar |
---|---|
título | título do artigo |
autor_id | autor do artigo |
Ultima atualização | A data em que o artigo foi atualizado pela última vez |
link | Links para artigos sobre GeeksforGeeks |
categoria | classificação do artigo |
Fontes de dados
Limpeza de dados e visão geral
importar pandas como pd importar numpy como np importar matplotlib.pyplot como plt de sklearn.model_selection importar train_test_split de sklearn.naive_bayes importar MultinomialNB, ComplementNB, BernoulliNB de sklearn.metrics importar brier_score_loss como BS de sklearn.feature_extraction.text importar TfidfVectorizer como TFIDF importar pyecharts .options as opts from pyecharts.charts import WordCloud,Ta