Eliminar NA en R

“Si falla un sensor de producción, solo puede obtener lecturas precisas de cuatro de los seis puntos de medición en la línea de montaje. Sin embargo, uno de los signos de la hoja de calidad es ilegible. Es posible que no tenga ensayos durante todo un turno. Por lo tanto, esto puede afectar sus cálculos estadísticos. Los datos que faltan no son manejados adecuadamente por múltiples procesos. En este artículo, veremos algunas técnicas diferentes para deshacernos de los valores de NA en R. Esto le permite limitar sus cálculos a filas de marcos de datos R que alcanzan una cierta etapa de finalización. Si los datos no están disponibles para uno o más módulos o para una unidad completa, se reconoce como datos perdidos. En los entornos cotidianos, los valores perdidos son una prioridad. Las entradas NA (no disponibles) se utilizan para representar los registros que faltan en R. Muchos registros ingresan a DataFrame con valores faltantes, ya sea porque existen pero no fueron capturados o porque nunca existieron”.

¿Cómo eliminar los valores de NA en el lenguaje de programación R en Ubuntu 20.04?

El símbolo NA se usa en R para indicar valores faltantes (no disponible). NA puede especificar valores vacíos en columnas DataFrame en el lenguaje de programación R. Veremos cómo eliminar filas NA en una columna en este artículo.

Ejemplo #1: Uso del método is.na para eliminar NA en R en Ubuntu 20.04

Podemos usar is.na para eliminar dichos valores de NA del vector. Los valores de na se obtienen con is.na() y el vector index. Todos los valores excepto na son devueltos por is.na().

En el ejemplo anterior, tenemos una representación vectorial que contiene algunos números aleatorios junto con los valores NA. La salida también generó el valor NA. Entonces queremos eliminarlos. Para hacer esto, llamamos al V1 dentro de la función is.na, que elimina cualquier valor NA existente en los vectores. La salida de esta función solo muestra el número.

Ejemplo #2: Uso del método na.rm para eliminar NA en R en Ubuntu 20.04

Al evaluar la suma, la media y la varianza, también podemos eliminar los valores de na. El na.rm es un método utilizado para deshacerse de na. Si na.rm=TRUE, se ignora na; si na.rm=FALSO, considere na.

Mira esto:Color CSS aleatorio

Entonces, comience creando la colección de vectores que contiene algunos números y valores NA. Esta colección de vectores se almacena en la variable Vec. Luego, esos valores NA se eliminan primero evaluando la varianza representada como var. Luego evaluamos la suma y quisimos eliminar los valores de NA en el Vec. Observe que establecemos na.rm en TRUE, lo que evita NA en el vector.

Ejemplo #3: Uso del método Omit para eliminar NA en R en Ubuntu 20.04

El método omit() elimina los valores de NA directamente y, como resultado, devuelve valores que no son de NA e índices de valores de NA descartados. Esta es la opción más fácil. El método na.omit() devuelve el resultado sin valores na en ninguna de las filas. En el lenguaje R, esta es la técnica más rápida para eliminar na filas.

Aquí hemos inicializado los enteros variables con los vectores. Luego creamos la salida de los vectores con el comando de impresión. Entonces, en la salida vimos algunos valores de NA. Para eliminar este NA del vector, tenemos la función na.omit que toma la variable entera como entrada para eliminar los valores de NA. Después de eso, verificamos si los valores de NA se eliminan de los vectores mediante la declaración de impresión. Cuando se genera el ID de salida, no muestra los valores de NA en los números enteros.

Ejemplo #4: Uso del método complete.cases para eliminar NA en R en Ubuntu 20.04

Para varios tipos de análisis de datos en el lenguaje informático R, se necesita un marco de datos detallado sin valores faltantes. El método complete.cases obtiene esto. Esta función r examina un marco de datos y devuelve un vector de resultados de valores faltantes en las filas.

Como en el ejemplo anterior, tenemos representaciones vectoriales. Ahora eliminamos los valores de NA de las tramas de datos. Para ello creamos el dataframe en el que ponemos unos valores de NA para cada columna. Luego llamamos a la función complete.case, que toma el marco de datos como una opción de entrada. El data2 contiene esta operación, que se imprime y muestra que se han eliminado los valores de NA.

Mira esto:comentarios YAML

Ejemplo #5: Uso del método rowSum para eliminar NA en R en Ubuntu 20.04

R tiene un método rowSums incorporado que genera las sumas para cada fila en la recopilación de datos en formato rowSums(x). Se pueden especificar parámetros adicionales, el más importante de los cuales es el argumento booleano de na.rm, que le dice a la función si omitir los valores de NA.

Después de crear el marco de datos dentro de los datos variables, aplicamos el método rowSums. Dentro de rowSum tenemos el método is.na y el método ncol. Observe que solo se eliminan los valores NA de la tercera fila. Porque las otras filas también contienen los valores NA.

Ejemplo #6: Uso del método de filtro para eliminar NA en R en Ubuntu 20.04

También podemos usar el paquete tidyvers dplyr para eliminar solo las filas donde faltan todos los valores. Entonces podemos usar una combinación de la función de filtro del paquete dplyr y la función is.na de Base R. Le mostraremos cómo eliminar solo las filas donde todas las entradas de datos son NA.

Usando el paquete dplyr para la función de filtro, creamos el marco de datos. Luego aplicamos la función de filtro de este marco de datos y mostramos la salida que eliminó los valores NA de la tercera fila.

Mira esto:Cómo instalar Terminator en Ubuntu 22.04

Conclusión

Hemos aprendido a eliminar del lenguaje R el na que aparece una o más veces en los vectores o dataframes en esta etapa de la sesión. Hemos cubierto seis métodos para ayudarnos a eliminar el na de los datos proporcionados. Estos métodos son bastante fáciles de implementar en el lenguaje de scripts R, que también puede eliminar los valores NA de las filas y columnas. Además, algunos métodos requerían el paquete R dplyr para eliminar el NA.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir