Verwenden Sie ChatGPT4, um beim Lesen der Anzahl verschiedener Wörter in der Datei zu helfen

Verwenden Sie ChatGPT4, um beim Lesen der Anzahl verschiedener Wörter in der Datei zu helfen

Verwenden Sie die ChatGPT4-Erkennung: Verwenden Sie Java, um die Anzahl der verschiedenen Wörter in der Datei zu lesen.

Parsen: Dieses Programm liest eine Datei mit dem Namen „file.txt“ und zählt, wie oft jedes einzelne Wort in der Datei vorkommt. Es verwendet einige String-Manipulationen, um die Wörter zu bereinigen, und eine HashMap, um die Häufigkeit des Vorkommens jedes Wortes zu speichern. Schließlich gibt das Programm die Gesamtzahl der unterschiedlichen Wörter aus.

//ChatGPT4完成的代码和我所需要的有点差异
import java.io.BufferedReader;
import java.io.FileReader;
import java.util.HashMap;
import java.util.Map;

public class CountDistinctWords {
    
    

    public static void main(String[] args) {
    
    

        try {
    
    
            BufferedReader reader = new BufferedReader(new FileReader("file.txt"));
            String line = reader.readLine();
            Map<String, Integer> wordCount = new HashMap<String, Integer>();
            while (line != null) {
    
    
                String[] words = line.split(" ");
                for (String word : words) {
    
    
                    String cleanedWord = word.replaceAll("[^a-zA-Z0-9]", "").toLowerCase();
                    if (!cleanedWord.isEmpty()) {
    
    
                        if (wordCount.containsKey(cleanedWord)) {
    
    
                            int count = wordCount.get(cleanedWord);
                            wordCount.put(cleanedWord, count + 1);
                        } else {
    
    
                            wordCount.put(cleanedWord, 1);
                        }
                    }
                }
                line = reader.readLine();
            }
            reader.close();
            System.out.println("Distinct words: " + wordCount.size());
        } catch (Exception e) {
    
    
            e.printStackTrace();
        }

    }

}

Die Verwendung von ChatGPT4 besteht darin, die Anzahl der aus der Datei entfernten und durch Leerzeichen getrennten chinesischen Buchstaben zu lesen.

Es unterscheidet sich ein wenig von der Anzahl der verschiedenen Chinesen in der gelesenen Datei, die ich dachte, aber die allgemeine Methode ist dieselbe.

Der Hauptprozess: Verwenden Sie den Pufferstrom, um die Datei zu lesen, verwenden Sie Hashmap, um das Chinesisch in jeder Zeile zu lesen, filtern Sie das Chinesisch durch reguläre Ausdrücke heraus, verwenden Sie jedes Chinesisch als Schlüssel und müssen schließlich nur noch die Größe der HashMap lesen um zu wissen, wie viele es Chinesen gibt.

//根据需求修改后的代码
import java.io.BufferedReader;
import java.io.FileReader;
import java.io.IOException;
import java.util.HashMap;
import java.util.Map;

public class readWordCount {
    
    
    public static void main(String[] args) {
    
    
        BufferedReader reader = null;
        try {
    
    
            reader = new BufferedReader(new FileReader("read_word_count/file.txt"));
            String line = null;
            Map<Character, Integer> wordCount = null;
            int count = 0;
            wordCount = new HashMap<Character, Integer>();
            while (true) {
    
    
                line = reader.readLine();
                if(line == null){
    
    
                    break;
                }
                line = line.replaceAll("[^\\u4E00-\\u9FA5]", "");
                char[] words = line.toString().toCharArray();
                for (char word : words) {
    
    
                    if (wordCount.containsKey(word)) {
    
    
                        count = wordCount.get(word);
                        wordCount.put(word, count + 1);
                    } else {
    
    
                        wordCount.put(word, 1);
                    }
                }
            }
            System.out.println("不同中文的个数: " + wordCount.size());
        } catch (Exception e) {
    
    
            e.printStackTrace();
        }finally {
    
    
            try {
    
    
                reader.close();
            } catch (IOException e) {
    
    
                throw new RuntimeException(e);
            }
        }
    }
}

Testbeispiel:

abcd dsvsdvsdvsdvdsvd Wang Wang Wang
Lu Xun „Vom Baicao-Garten zum Sanwei-Buchladen“ Didi Di

Ergebnis:

Anzahl verschiedener chinesischer Schriftzeichen: 13

记录每一个学习瞬间

Supongo que te gusta

Origin blog.csdn.net/qq_51601665/article/details/130516067
Recomendado
Clasificación