Diagrama de caja nacido en el mar
“Seaborn es un módulo de Python para crear visualizaciones numéricas. Se basa en la biblioteca Matplotlib e interactúa ampliamente con los archivos de encabezado de pandas. Seaborn ayuda a los usuarios a analizar y comprender los datos. Sus capacidades de visualización funcionan con matrices y estructuras de datos, incluidos conjuntos de datos completos, e internamente proporcionan el mapeo semántico y el conjunto de asociaciones necesarios para crear diagramas útiles. Su fuente de datos, la API explícita, permite a los usuarios centrarse en interpretar los gráficos en lugar de centrarse en los aspectos técnicos de su presentación. La interoperabilidad de la trama de Seaborn permite el acceso del usuario en varios escenarios, tales como: B. análisis exploratorio, interactividad real en aplicaciones gráficas y resultados archivados en una variedad de representaciones gráficas y vectoriales. Un diagrama de caja tiende a organizar los datos estadísticos para que el análisis sea más claro dentro de los parámetros o incluso en un rango de atributos. Si se especifica, los percentiles y los valores críticos para la mediana se muestran en el marco base del diagrama de caja. Los puntos de datos son líneas horizontales que pasan por el centro de cada cuadro, mientras que los bigotes representan líneas paralelas que se extienden hasta los conjuntos de datos más grandes, y las mayúsculas representan líneas dibujadas que pasan por los bordes de los bigotes. El diagrama de caja también se puede usar para encontrar valores atípicos en un marco de datos dado. En este artículo, aprendimos los métodos para dibujar diagramas de caja usando el módulo Seaborn”.
Contenidos
Usando el método boxplot()
La función boxplot() se usa para dibujar un diagrama de caja. El registro de inflorescencia del iris se importa en el siguiente caso. Finalmente, el gráfico de caja muestra los valores de percentil 1, 3 y 3, más bajo y más alto.
Al comienzo del programa necesitamos importar las bibliotecas. La biblioteca seaborn se importa como sns y la biblioteca matplotlib.pyplot se importó como plt. Luego declaramos una variable llamada «df». Queremos cargar los datos, así que usamos la función cargar conjunto de datos(). El registro de datos se almacena en la variable «df». Se utiliza la función head(). Para obtener las primeras n entradas, usamos esta función. Dependiendo de la posición del objeto, este método solo contiene los primeros n registros. Puede determinar efectivamente si el objeto contiene el tipo correcto de datos. El conjunto de entradas para seleccionar. Ahora usamos la función boxplot() y le hemos proporcionado el parámetro y a esta función. Un diagrama de caja es una técnica estándar para trazar datos multidimensionales que consta de cinco análisis: mínimo, primer percentil, media, tercer percentil y máximo. Para mostrar el gráfico final, se aplica el método plt.show().
Diagrama de caja horizontal
Una gráfica horizontal podría usarse como una gráfica de caja. Dibujaremos el diagrama de caja en el plano horizontal como se muestra en la figura. Usaremos el marco de datos Iris nuevamente. Los tonos que se muestran son los tonos estándar; Sin embargo, se pueden cambiar.
En primer lugar, hemos integrado dos archivos de encabezado. El archivo de encabezado seaborn y matplotlib.pyplot. El conjunto de datos se carga en el gráfico con load dataset(). En el siguiente paso agregamos el método head(). Esta función devuelve los primeros cinco marcos del conjunto de datos después de la configuración. Solo hay un parámetro de entrada: la serie de filas. Con este argumento podemos especificar el número de valores necesarios. Usemos la función boxplot() ya que puede mostrar más anomalías y valores asociados. Aquí le hemos dado a esta función el parámetro x y el parámetro y. La etiqueta del eje y del gráfico se toma como el nombre de la especie, y la etiqueta del eje x del gráfico se toma de sepal_length. Aplicamos la función show() para mostrar el gráfico resultante.
Ajustar los colores del diagrama de caja.
El sombreado del gráfico de diagrama de caja se puede personalizar. Podemos lograr esto especificando el atributo de la paleta. Había una variedad de paletas, y la paleta «Magma» incluye una amplia gama de magma.
Especificamos una variante llamada «df» después de introducir las bibliotecas seaborn y matplotlib en el programa. Luego usamos el método load dataset() para recuperar los datos. El registro de datos se guarda en la variable «df». Se aplica el método head(). Esta función se usaría para capturar los primeros n elementos. Ahora aplicamos el método boxplot() al que le asignamos los parámetros x e y. Junto con estos parámetros, especificamos el color de los diagramas de caja. En este código hemos configurado el color «Magma» en el parámetro «Paleta». El método plt.show() se usa para mostrar el gráfico formado.
Ajustar el tamaño del diagrama de caja
La opción de ancho se utiliza para cambiar el tamaño de los diferentes diagramas de caja. El ancho predeterminado es 1; por lo tanto, un poco menos hace que las cajas sean más cortas.
Las bibliotecas requeridas deben cargarse al principio del código. El conjunto de datos del gráfico se carga mediante el método load dataset(). El método head() se usó en el siguiente paso. De forma predeterminada, este método proporciona los primeros cinco segmentos de la oración. Usamos el método boxplot() para dibujar los diagramas de caja. A esta función se le ha asignado el parámetro x y el parámetro y ya se ha citado. También se especifica el ancho de los diagramas de caja. Así que le dimos a esta función un argumento de ancho. El eje y del gráfico está etiquetado con el nombre de la especie, mientras que el eje x del gráfico está etiquetado con la longitud del sépalo. Usamos el método show() para mostrar el gráfico de salida.
Conclusión
En este artefacto, vimos cómo dibujar diagramas de caja utilizando la biblioteca Seaborn. Hemos visto cómo cambiar el ancho y los colores de los diagramas de caja. La representación visual de cómo se presentan los conjuntos de información estadística por su percentil se denomina diagrama de caja. Encapsula efectivamente los datos recopilados con un cuadro y una barra y nos permite a todos calificar conjuntos directamente.