При использовании tf.keras.preprocessing.text_dataset_from_directory для чтения выборочных данных об ошибке сообщается следующим образом:
TypeError: Input 'filename' of 'ReadFile' Op has type float32 that does not match expected type of string.
Эта проблема вызвана тем, что пример структуры хранения данных не соответствует входной спецификации API, правильная структура выглядит следующим образом (выдержка из официального примера API):
main_directory/
...class_a/
......a_text_1.txt
......a_text_2.txt
...class_b/
......b_text_1.txt
......b_text_2.txt
Путь к входящему интерфейсу: main_directory
и class_a
являются class_b
подкаталогами, которые представляют категории.В каждой категории есть несколько файлов, и каждый файл содержит образец.
Обратите внимание, что в каждой категории один файл содержит один образец Я поместил все образцы в один файл, что не соответствовало входной спецификации API и вызвало ошибку.
Это отличие, которое я обнаружил после сравнения официального формата данных сэмпла.После настройки структуры хранения сэмпла данные читаются нормально.