¿Hay alguna forma en I ignorar un "" en mis datos para el cálculo de media / DE / etc

Gregory Smith:

Tengo un gran conjunto de datos que necesito para calcular media / std dev / min / max y durante varias columnas. El conjunto de datos utiliza un "" para denotar cuando se pierde un valor para un sujeto. Cuando se ejecuta la función de media o SD Este causas R para volver NA. ¿Hay una manera sencilla de evitar esto?

mi código es sólo por esta

xCAL<-mean(longdata$CAL)
sdCAL<-sd(longdata$CAL)
minCAL<-min(longdata$CAL)
maxCAL<-max(longdata$CAL)

R pero volverá NA en todas estas variables. Obtuve el siguiente error

Mensaje de advertencia: En mean.default (longdata $ CAL): argumento no es numérico o lógico: regresar NA

Gregory Thomas:

Es necesario para convertir sus datos a numérico para ser capaz de hacer cualquier cálculo sobre el mismo. Cuando se ejecuta as.numeric, el .se convertirá en NA, que es la que R utiliza para los valores que faltan. Entonces, de la función que mencionan tener un argumento na.rmque se puede ajustar a TRUEeliminar (RM) los valores perdidos (NA).

Si los datos es una factor, es necesario convertirlo a characterprimera a la pérdida de información de evitar , como se explica en este FAQ .

En general, para estar seguro, intente lo siguiente:

longdata$CAL <- as.numeric(as.character(longdata$CAL))
xCAL <- mean(longdata$CAL, na.rm = TRUE)
sdCAL <- sd(longdata$CAL, na.rm = TRUE)
# etc

Ten en cuenta que na.rmes una propiedad de la función - no es magia que funciona en todas partes. Si nos fijamos en las páginas de ayuda para ?mean ?sd, ?min, etc., verá el na.rmargumento documentado. Si desea eliminar los valores que faltan en general, la na.omit()función funciona bien.

Supongo que te gusta

Origin http://10.200.1.11:23101/article/api/json?id=377651&siteId=1
Recomendado
Clasificación