sklearn.svm.OneClassSVM User Manual (Chinese)

class sklearn.svm.OneClassSVM(kernel='rbf', degree=3, gamma='scale', coef0=0.0, tol=0.001, nu=0.5, shrinking=True, cache_size=200, verbose=False, max_iter=-1)

Detección de valores atípicos sin supervisión.
Estimar el soporte de distribución de alta dimensión.
Esta implementación se basa en libsvm. Puede obtener más información sobre la detección de anomalías
en el manual del usuario .

Parámetros (kernel, gamma, nu y tol son más importantes)

núcleo: Cadena, opcional (predeterminado = 'rbf'),
función del núcleo, tipo de cadena, opcional, el valor predeterminado es 'rbf', es decir, el núcleo gaussiano
especifica el tipo de núcleo que se utilizará en el algoritmo. Debe ser uno de "lineal", "poli", "rbf", "sigmoide", "precalculado" o invocable. Si no se proporciona, se usará "rbf". Si se proporciona un objeto invocable, se usa para calcular previamente la matriz del núcleo.

la licenciatura: int, opcional (predeterminado = 3)
orden, modelado, opcional.
El orden de la función del núcleo polinomial ("poli"). Ignorado por todos los otros núcleos

gama: {'Scale', 'auto'} o float, opcional (default = 'scale')
coeficiente del kernel, {'scale', 'auto'} o tipo de coma flotante, opcional, el valor predeterminado es 'scale'
"rbf" , Coeficientes de núcleo "poli" y "sigmoide".
Si se pasa gamma = 'scale' (el valor predeterminado), usará 1 / (n_features * X.var ()) como valor gamma,
si es 'auto', se usarán 1 / n_features.
Modificado en la versión 0.22: el valor predeterminado de gamma se cambia de 'automático' a 'escala'.

coef0: Flotante,
parámetro interno opcional (predeterminado = 0.0) , tipo de coma flotante, opcional, el
parámetro predeterminado es independiente en la función de kernel 0.0 . Solo tiene sentido para "poli" y "sigmoide".

peaje: Flotante,
parada opcional métrica estándar

no: Flotador,
límite superior opcional de puntuación de error de entrenamiento, límite inferior de puntuación de vector de soporte. Debe estar en el intervalo (0, 1). Por defecto, se toma 0.5.

contracción: Booleano,
valor booleano opcional , opcional
si se utiliza el método heurístico reducido.

tamaño del caché: Float, opcional
especifica el tamaño de la memoria caché del kernel (en MB).

verboso: Bool, predeterminado: False
habilita la salida detallada. Tenga en cuenta que esta configuración aprovecha la configuración de tiempo de ejecución de cada proceso en libsvm. Si esta configuración está habilitada, la configuración puede no funcionar correctamente en un contexto de subprocesos múltiples.

max_iter: Int, opcional (predeterminado = -1)
establece un límite estricto en la iteración dentro del solucionador, o -1 (sin límite).

Atributos

apoyo_:
Índice de vector de soporte de vector de columna (n_SV)

soporte_vectores_:
Vector de soporte de matriz (n_SV, n_features)

dual_coef_: Vector de línea, forma = [1, n_SV]
El peso asignado a la entidad (el coeficiente del problema original). Solo disponible en el caso de núcleos lineales.
coef_ es un atributo de solo lectura derivado de dual_coef_ y support_vectors_

interceptar_: Vector de fila, forma = [1,]
constante en la función de decisión.

compensar_: El
desplazamiento de punto flotante se utiliza para definir la función de decisión basada en la puntuación original. Tenemos la siguiente relación: Decision_function = score_samples-offset_. Este desplazamiento es opuesto a intercept_, y se proporciona para mantener la coherencia con otros algoritmos de detección de valores atípicos.

fit_status_: Entero
Si la instalación es correcta, es 0, de lo contrario es 1 (se emitirá una advertencia)

Ejemplos

from sklearn.svm import OneClassSVM
X = [[0], [0.44], [0.45], [0.46], [1]]
clf = OneClassSVM(gamma='auto').fit(X)
clf.predict(X)
##array([-1,  1,  1,  1, -1])
clf.score_samples(X)  # doctest: +ELLIPSIS
##array([1.7798..., 2.0547..., 2.0556..., 2.0561..., 1.7332...])

Método

decision_function (self, X):
Distancia al hiperplano de separación.
Si la muestra está dentro del hiperplano de separación, la distancia es positiva, de lo contrario, la distancia es negativa.
Parámetros:
X: shape (n_samples, n_features)
valor de retorno:
dec: shape (n_samples,)
función de decisión de retorno de muestra

ajuste (self, X, y = None, sample_weight = None, ** params): Parámetros de
límite suave
del conjunto de muestra de detección X :
X : conjunto de muestra de forma (n_samples, n_features)
, donde n_samples es el número de muestras y n_features es el número de características.

sample_weight : shape (n_samples,)
peso por muestra. Recalibrar C para cada muestra. Los pesos más altos obligan al clasificador a enfatizar más estos puntos.

y : ignorado,
no utilizado y coherencia API proporcionada por convención.

Volver
self: objeto

Nota
Si X no es una matriz continua en orden C, cópiela.

fit_predict (self, X, y = None):
Realice el ajuste en X y devuelva la etiqueta de X.
Devuelve -1 para valores atípicos y 1 para valores dentro del grupo.

Parámetro
X:
datos de entrada de forma (n_samples, n_features)

y: ignorar

get_params (self, deep = True):
Obtenga los parámetros de esta estimación.

Parámetro
profundo: valor booleano, el valor predeterminado es True.
Si es True, se devolverán el estimador y los parámetros del subobjeto que contiene el estimador.

Devuelve : el nombre del parámetro se asigna a su valor.

predecir (auto, X):
Realizar la clasificación de las muestras en X. Para un tipo de modelo, devuelve +1 o -1.

Parámetro
X: forma = (n_samples, n_features)
Para kernel = "precomputed", la forma esperada de X es [n_samples_test, n_samples_train]

Devuelve
la etiqueta de categoría de X

score_samples (self, X)
Función de puntuación original de la muestra.

Parámetro
X: (n_samples, n_features)

Retornar
Devuelve la función de puntuación (sin desplazamiento) de la muestra.

set_params (self, ** params):
Establece los parámetros de este estimador.
Este método es adecuado para estimadores simples y objetos anidados (como tuberías).

Parámetros
** params: parámetros del estimador

Devuelve
un ejemplo de un estimador.

Publicó 41 artículos originales · elogió 13 · visitas 6692

Supongo que te gusta

Origin blog.csdn.net/comli_cn/article/details/103898791
Recomendado
Clasificación