Idioma Infraestructura R - estructura de datos R de las operaciones vectoriales y (b)

En primer lugar, la trama de datos

1. La trama de datos es una estructura de datos de un formato de tabla. trama de datos está diseñado para simular el conjunto de datos, el mismo concepto con otras SAS o software estadístico SPSS en el conjunto de datos. conjunto de datos es típicamente una matriz rectangular de datos que constituyen una fila representa la observación, la lista es variable.
2. Caja de datos es en realidad una lista. Es un vector de elementos en la lista, los vectores columna que constituyen la trama de datos, cada columna deben tener la misma longitud, la trama de datos es una estructura rectangular, y las columnas de bloques de datos debe ser llamado. Cada columna debe ser el mismo tipo de datos, la línea puede ser diferente.

1. Crear un bloque de datos, por ejemplo:

2. similares consulta de datos y la lista de los contenidos de la caja.

3. Dos formas de buscar el contenido de la columna

En segundo lugar, el factor

1. variables de clasificación

Las variables nominales
clasificadas variables
variables continuas

2. factor nominal de R y variables ordinales llamado factor variable, factor. Estos valores pueden ser conocidos como un nivel variable categórica. Vector compuesta de estos valores se llama factor horizontal.

3. Factor de aplicación

Cálculo de frecuencia, prueba de la independencia, la prueba de correlación, análisis de varianza, análisis de componentes principales, análisis factorial ...

El factor de conversión del vector:

En cuarto lugar, los datos que faltan
1 en R, que representa los valores que faltan NA, NA es un medio no disponibles para el almacenamiento de la información que falta.

2. En el cálculo de las siguientes propiedades:

3. Enfoque consulta valores de datos faltantes en los datos establecidos de sueño como un ejemplo:

4. Quitar los valores perdidos:

Si los datos rectangulares directos proceso de montaje que comprende NA Supresión de la fila.

5. Otros datos que faltan:

NaN, en nombre de los valores imposibles
INF para representar el infinito

En quinto lugar, el proceso de la cadena
1. Las estadísticas longitud de la cuerda

2. Elementos de char se fusionan

3. Extracto de cadena

4. Separar una cadena

El vector de caracteres combinados

En sexto lugar, la fecha y la hora
1. Las series de tiempo

Los datos de tiempos m
as.Date (m, el formato) Función
común: formato de Día Mes Año as.Date (m, format = "% B% d% Y")
se añadió semana as.Date (m, format = "% B% d% Y% A ")
la hora del sistema de salida Sys.time ()

2. cadena en formato de hora POSIXct / POSIXlt

as.POSIXct ( "March-17-2020 17:00:00", format = "% B-% d-% Y% H:% M:% S")

Supongo que te gusta

Origin www.cnblogs.com/nnadd/p/12503590.html
Recomendado
Clasificación