Стандартизация и нормализация (интегрированный)

part1:

【】 转 https://blog.csdn.net/weixin_40165004/article/details/89080968

Данные Weka предварительной обработки (а)

Для анализа данных, мы, как правило, сосредоточены только на существенных алгоритмах интеллектуального анализа, такие как классификация, кластеризация, ассоциативные правила, игнорируя при этом качестве интеллектуального анализа данных, чтобы быть, но качество данных с целью получение высококачественных результатов добычи, в противном случае только " мусор в мусор «из. Обеспечение качества данных являются важным шагом является данными предварительных обработки (предварительной обработки данных), в реальной эксплуатации, фаза подготовки данных на протяжении всего процесса добычи часто может занять до 6-8 раз. В данной работе, данные предварительной обработки методы Weka инструмента для некоторого введения.

 

Данные Weka предварительную обработку, как известно, фильтрации данных, они могут быть найдены в weka.filters в. Свойства алгоритма фильтра можно разделить на подконтрольного (SupervisedFilter) и неконтролируемой (UnsupervisedFilter). Для первого, потребность фильтра, чтобы установить атрибут класса, рассмотрят распределение набора данных атрибутов и т.п., чтобы определить оптимальное количество и размер контейнера, атрибуты последнего класса могут отсутствовать. Между тем, фильтрации алгоритм в свою очередь, связано с атрибутом (на основе атрибута) и экземпляра на основе (например). Метод в основном базируется на колонке атрибутов для обработки, например, добавление или удаление столбцов, на основе примера способа для обработки основной линии, например, добавлять или удалять строки.

Данные фильтрации в основном рассматриваются следующие вопросы (шаблонных):

Данные отсутствуют значения, стандартизация и дискрети-.

Значение недостающего обработки данных: weka.filters.unsupervised.attribute.ReplaceMissingValues. Для числового атрибута, вместо отсутствующего значения со средним значением для номинальных атрибутов, с его РЕЖИМОМ (наиболее частое значения) для замены отсутствующих значений.

Стандартизация (Стандартизация): Класс weka.filters.unsupervised.attribute.Standardize. С учетом набором данных нормированных значений всех значений атрибутов к нулевому среднему и единичной дисперсии нормального распределения .

Нормализация (Nomalize): Класс weka.filters.unsupervised.attribute.Normalize. Нормализация данного набора данных для всех значений значений атрибутов, класс атрибута, за исключением. Результаты умолчанию значение в интервале [0,1], но с масштабирования и панорамирования параметров, мы можем приписать числовые значения любого интервала спецификации. Такие, как: Однако, масштаб = 2,0, перевод = -1,0, можно регулировать значение свойства в интервале [-1, + 1].

Дискретная (дискретизация): Класс weka.filters.supervised.attribute.Discretize и weka.filters.unsupervised.attribute.Discretize. Свойства численно контролируемые и неконтролируемые дискретизации, для некоторых числовой дискретизации набора данных для категорических атрибутов.


part2:

【】 转 https://blog.csdn.net/u014381464/article/details/81101551

Нормализация:
для базы данных
нормализации отношений для удовлетворения нормативных требований можно разделить на несколько этапов , чтобы удовлетворить требованиям самых низких в первой нормальной форме (1НФ), опять - таки вторая парадигма, третья парадигма, BC парадигма и 4НФ, 5NF и т.д., норма чем выше уровень, тем более жесткие ограничения набор условий.

Для получения данных
данных нормированных включает нормализацию стандартизацию регуляризации, это общий термин (как это была также стандартизация коллективно).

нормализации данных преобразования данных являются интеллектуальным анализом данных, преобразованием данных или данные преобразуются в форму, пригодный унифицированный интеллектуальным анализ данных, данные атрибутов выемки грунта будет масштабироваться объектом, он падает в пределах некоторого малого интервала , например, [-1, 1] или [0, 1]

Нормированные значения атрибутов обычно используются для классификации и кластеризации алгоритмов и алгоритм нейронной сети включает в себя среди расстояния метрики. При классификации алгоритма распространения добычи, таких как использование нейронных сетей, мера стоимости каждой собственности на стандартизированной обучение кортежей скорости помощи до фазовой скорости обучения. Способ несходства измерения на основе данных расстояния может быть нормирован так, что все атрибуты имеют одинаковое значение веса.

Данные Есть три распространенных способа нормализации: минимальная и максимальная нормализация, г-счет нормализации и стандартизации дробного масштабирования

 

Стандартизация (стандартизация):
Данные нормализованы данные масштабируется таким образом , что он падает в пределах небольшого интервала, нормализованные данные могут быть положительными или отрицательными, но абсолютная величина , как правило , не слишком велик, как правило , Z-оценка метод нормализации : после вычитания ожидаемого делится на стандартное отклонение.

 

Нормализация (нормализация):

Значение масштабирования к межсотовому 0-1 (отнести к категории цифровой обработки сигналов), общий метод является самыми крупными минимальными стандартными методами: мин-макс нормализация

 

 


 

Part.3

MATLAB функция на

 

 


Другое:

ВЕК исходного алгоритма код получает путь: https: //blog.csdn.net/renyiniki/article/details/79668870

1. Во- первых, скачать официальный источник сайта Weka, есть два пути, один, чтобы загрузить установочный файл, установка будет иметь ВЕКА-src.jar в каталоге установки, распаковывать после для источника, а другой загрузив SVN:  https://svn.cms.waikato.ac.nz/svn/weka/trunk/weka   инструменты , такие как необходимость SVN на машине: TortoiseSVN

2. Импорт MyEclipse

2.1 Создание рабочего каталога. Создать новый каталог WEKA.

2.2 Подготовить исходный код. Weka ВЕК-src.jar найдены в каталоге установки, экстракт просто каталог сборки.

2,3, чтобы создать проект. Откройте MyEclipse, File-> New-> Java Project, Project заполнения Имя WEKA, выберите создать проект из существующего источника, нажмите кнопку Далее, нажмите кнопку Готово.

2.4 компиляции и запуска. Weka выбрать проект, который вы только что создали, работает как Java Application, ожидая диалоговое окно всплывающего выберите главный класс, weka.gui.main (главный вход, чтобы увидеть). Вскоре Weka интерфейс.

 

 

 

 

 

 

 

рекомендация

отwww.cnblogs.com/rinroll/p/11986350.html