Trois lignes de code, générez automatiquement un résumé pour votre article

Trois lignes de code, générez automatiquement un résumé pour votre article

  • Ceux qui s'intéressent au code et à la programmation peuvent suivre l'ancien K pour lire du code et communiquer avec moi!

Trois lignes de code, générez automatiquement un résumé pour votre article

Trois lignes de code, générez automatiquement un résumé pour votre article

J'ai écrit un article sympa sur la réduction du poids du papier avant et j'ai reçu une bonne réponse.
L'arme magique pour les diplômés, la réduction du poids de la thèse en un clic ~!
Récemment, j'ai fait une statistique sur la question et la réponse de la thèse de fin d'études, et j'ai constaté qu'en plus de la réduction de poids, la préparation et la rédaction du "résumé" sont également un sujet de grande préoccupation pour les étudiants. Y a-t-il un raccourci vers le résumé?
Il y a en effet, l'ancien K vous présentera ici:

1. Importez d'abord la bibliothèque tierce requise


# encoding:utf-8
from gensim.summarization import summarize
import re
  • Puisque notre article est principalement composé de caractères chinois, afin d'éviter les problèmes de codage, écrivez maintenant l'instruction utf-8 en tête du script;
  • Ce que nous allons utiliser est une bibliothèque appelée gensim:
“gensim是一个用于自然语言处理的库,最早是用来生成给定文章相似内容的工具,gensim本身就是“generate similar”的合成词。
  • Par conséquent, gensim est une bibliothèque très appropriée si vous souhaitez implémenter des fonctions de résumé.
  • Les bibliothèques dépendantes qu'il utilisera sont numpy et smart_open.

    2. Prétraitez le texte


text = re.sub(r'。|?|!', '. ', text)
  • L'algorithme de gensim est basé sur des phrases.
  • Puisque gensim lui-même est pour le texte anglais, afin de permettre à gensim de reconnaître le concept de «phrase» en chinois. Nous avons effectué le traitement ci-dessus.
  • La fin avec "." Permet à gensim de déterminer qu'il s'agit du symbole de terminaison d'une phrase.

    3. Une ligne de résumé de la mise en œuvre du code


abstract = summarize(text)
  • Le module de résumé de gensim est une variante basée sur textrank.
  • Le textrank est la plus petite unité de phrase, qui calcule le degré de pertinence entre les phrases pour obtenir le texte le plus représentatif. Le texte le plus représentatif est lui-même la meilleure phrase pour résumer un long texte.

    ex. Résumé


# encoding:utf-8
from gensim.summarization import summarize
import re

def do_abstract(text):
    text = re.sub(r'。|?|!', '. ', text)
    abstract = summarize(text)
    return abstratc

Le code ci-dessus peut vous aider à obtenir le contenu principal de l'article le plus rapidement possible. Vous pouvez l'utiliser pour:

  • Obtenez rapidement le contenu de base de la référence pour déterminer si l'article convient à votre thème de thèse
  • Générez rapidement un brouillon du contenu abstrait de votre article, qui peut être modifié directement à partir du brouillon, réduisant ainsi les problèmes d'organisation de la langue à partir de zéro
“textrank是源于google的pagerank算法启发,应用到自然语言处理领域的结果。
  • Le module de synthèse a de nombreux paramètres qui peuvent être définis pour s'adapter à l'environnement réel où les besoins sont plus personnalisés.
  • Les amis qui s'intéressent à textrank peuvent en apprendre davantage sur le principe dans l'article "TextRank: Mettre de l'ordre dans les textes" écrit par Baidu Rada Mihalcea et Paul Tarau.
  • Les amis qui ne sont pas aptes à lire l'anglais peuvent également suivre mon compte public "Old K Play Code", et j'écrirai une analyse chinoise personnelle de cet article à l'avenir.
    Ce code ne peut que vous aider à résumer le contenu de base de l'article, mais il ne peut pas remplacer complètement le travail d'écriture abstraite.
    Old K a écrit cet article avec le partage de technologie comme intention initiale et encourage toujours les diplômés à créer une thèse de manière indépendante.

Précédentes recommandations merveilleuses:

Existe-t-il de bons projets Python pour la visualisation de données?
[Recommandé] Le livre d'introduction à Python recommandé par les grands est un aperçu de
l'apprentissage en profondeur. Quels forums communautaires voyez-vous?
[Recommandé] 10 projets d'apprentissage automatique Python gratuits pour
apprendre aux débutants comment installer Anaconda et configurer l'environnement de développement

Avantages du ventilateur:


  • Lisez et partagez "Apprenez les compétences de base de JavaScript, l'ancien K recommande ces livres", ayez une chance d'obtenir une copie de "Programmation avancée JavaScript"
  • Lisez et partagez "11 bibliographies incontournables recommandées aux débutants pour apprendre Python par eux-mêmes", et courez la chance d'obtenir 1 exemplaire de "Python Core Programming"
    Trois lignes de code, générez automatiquement un résumé pour votre article

Je suppose que tu aimes

Origine blog.51cto.com/15069443/2576231
conseillé
Classement