cuantil en R

Antes de que los algoritmos de aprendizaje automático se construyan en un conjunto de datos, el análisis estadístico inferencial es esencial. La extracción de conclusiones estadísticas a partir de los datos también forma parte de este proceso. En estadística, algunos conceptos clave describen la variabilidad de una variable numérica. Estos términos son IQR, cuartil, cuantil, media y mediana. Ayudan a identificar anomalías en la columna y la distribución de la columna. Esta entrada es para determinar el cuantil de la columna. La variabilidad de los datos se mide utilizando las funciones de cuantiles. Después de ordenar los datos, puede usar cuantiles para dividir los números en una distribución dada en subgrupos iguales. Podemos calcular fácilmente los cuantiles en R usando la función de cuantiles, que devuelve todos los cuantiles de 0 %, 25 %, 50 %, 75 % y 100 %.

Contenidos

Cuantiles en el lenguaje de programación R en Ubuntu 20.04

Cuantil es una función genérica que genera cuantiles de muestra para probabilidades dadas. Una probabilidad de 0 corresponde a la observación más pequeña, mientras que una probabilidad de 1 corresponde a la más grande. Ahí tenemos una sintaxis para los cuantiles utilizados en un lenguaje de programación R.

1 cuantil(x, probs = seq(0, 1, 1/4), na.rm = FALSO, nombres = VERDADERO, tipo = 5, dígitos = 5, …)

La siguiente es una descripción del argumento anterior pasado dentro de la función cuantil:
X: Un elemento de una categoría para el que se ha especificado una función, o un vector numérico que requiere cuantiles de muestra. Si na.rm no es TRUE, los valores NA y NaN no se pueden usar en vectores numéricos.
probar: La probabilidad con valores en un vector numérico; Los valores fuera de este rango hasta «2e-14» se reconocen y transmiten al punto final más cercano.
na.rm: Si es verdadero, todos los valores de NA y NaN en x se eliminan antes de evaluar los cuantiles.
nombres: si es verdadero, la característica contiene un atributo de nombre. Establézcalo en FALSO para reducir el tiempo que lleva resolver un problema con una gran cantidad de variables.
dígitos: si es verdadero, implemente precisión para usar porcentajes de formato. Internamente, esto se estableció en max(2, getOption(“dígitos”)) en las versiones de R anteriores a 4.0.x. En este artículo aprenderás qué son los cuantiles y cómo se calculan en R (cuartiles, octiles, deciles y percentiles). Para obtener cuantiles de muestra para un conjunto de datos, use la utilidad quantile() en R.

Ejemplo 1: uso de una función cuantil simple para conmutar vectores en R en Ubuntu 20.04

Veamos cómo funciona la función cuantil en R con un ejemplo simple que genera los cuantiles para la entrada de datos. Necesitamos crear datos para aplicar las funciones de cuantiles. Aquí hemos definido los datos variables dentro que contendrán los datos del vector. Luego se usa la función cuantil donde pasamos los datos dados previamente junto con la secuencia declarada. Ejecutando este comando de función de cuantiles, obtuvimos los cuantiles de los vectores como se muestra en el siguiente indicador de R:

En el siguiente indicador de R, nuevamente usamos la función cuantil para calcular los deciles. Para ello pasamos la secuencia 0, 1 y ¼.

Aquí evaluamos el interés por los cuantiles aleatorios. Ponemos los datos en el argumento probs mientras mostramos la salida del percentil. Tenga en cuenta que la función cuantil divide los datos en partes iguales, usando la mediana como el punto medio, la mitad inferior restante como el cuartil inferior y la mitad superior como el cuartil superior.

Ejemplo 2: Uso de la función Cuantiles para calcular la columna en un marco de datos en R en Ubuntu 20.04

También podemos encontrar el cuantil de la columna dada del marco de datos. Hemos definido los datos dentro de la función del marco de datos en el siguiente script R. Generamos listas denominadas «Lista1», «Lista2» y «Lista3» con valores numéricos aleatorios.

Después de eso, llame a la función cuantil e ingrese el nombre de la columna con el símbolo «$», tal como especificamos «$List3» para el cuantil. Como puede ver, la función cuantil ordena los valores de entrada en orden ascendente antes de devolver los percentiles requeridos.

Podemos usar la función sapply() como se muestra en el indicador R cuando queremos evaluar los cuantiles de numerosas columnas a la vez. Pasamos la opción function(x) dentro de la función sapply junto con la función quantile, que tiene parámetros x y probs. La salida de esta función muestra todos los cuantiles de las columnas a la vez.

Ejemplo 3: uso de la función Quantiles y manejo del error NaN en R en Ubuntu 20.04

Los NaN se pueden encontrar en casi cualquier situación. Estos NaN, también conocidos como valores perdidos, son cada vez más comunes en el mundo digital actual basado en datos. Si los datos contienen estos números que faltan, la salida puede contener NaN o errores. También tenemos datos vectoriales que contienen algunos valores NA llamados datos vectoriales en la función cuantil. La excepción la lanza el compilador R que se muestra a continuación:

Podemos deshacernos de este error usando el parámetro cuantil na.rm. Necesitamos establecer el valor na.rm en verdadero, lo que nos ayudará a deshacernos de esta excepción NaNs. Como puede ver en el resultado, obtuvimos los valores percentiles y eliminamos con éxito los valores NA.

Ejemplo 4: uso de la función Quantiles con el parámetro Probs en R en Ubuntu 20.04

También hay una opción de «probs» que le permite especificar los percentiles requeridos. El argumento probs, también conocido como argumento «Probabilidades», debe estar entre 0 y 1. En el siguiente script de R, usamos la opción probs con valores 33 y 66 dentro de la función cuantil. La salida incluye un mensaje de error que indica que las sondas están fuera de rango.

Si configura la opción probs dentro del rango de 0 y 1, se muestran los valores percentiles y no valores incorrectos.

Conclusión

Hemos tratado de hacer todo lo posible para describir y examinar la función R quantile() en múltiples dimensiones usando varios ejemplos. El formulario de cuantiles es la característica más valiosa en el análisis de datos porque muestra de manera eficiente datos adicionales sobre información específica. Hemos ilustrado algunos ejemplos que dejan claro cómo funciona la función cuantil. Espero que ahora entiendas mejor la función quantile() de R.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.