matplotlib.pyplot.boxplot #

matplotlib.pyplot. boxplot ( x , muesca = Ninguno , sym = Ninguno , vert = Ninguno , whis = Ninguno , posiciones = Ninguno , anchos = Ninguno , patch_artist = Ninguno , bootstrap = Ninguno , usermedians = Ninguno , conf_intervals = Ninguno , meanline = Ninguno , showmeans= ninguno _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _, zorder = Ninguno , capwidths = Ninguno , * , data = Ninguno ) [fuente] #

Dibuja un diagrama de caja y bigotes.

El cuadro se extiende desde el primer cuartil (Q1) hasta el tercer cuartil (Q3) de los datos, con una línea en la mediana. Los bigotes se extienden desde la caja en 1,5 veces el rango intercuartil (IQR). Los puntos voladores son aquellos que pasan del final de los bigotes. Consulte https://en.wikipedia.org/wiki/Box_plot como referencia.

     Q1-1.5IQR   Q1   median  Q3   Q3+1.5IQR
                  |-----:-----|
  o      |--------|     :     |--------|    o  o
                  |-----:-----|
flier             <----------->            fliers
                       IQR
Parámetros :
x Matriz o una secuencia de vectores.

Los datos de entrada. Si es una matriz 2D, se dibuja un diagrama de caja para cada columna en x . Si se trata de una secuencia de matrices 1D, se dibuja un diagrama de caja para cada matriz en x .

muesca bool, por defecto: Falso

Ya sea para dibujar un diagrama de caja con muescas ( True), o un diagrama de caja rectangular ( False). Las muescas representan el intervalo de confianza (IC) alrededor de la mediana. La documentación de bootstrap describe cómo se calculan las ubicaciones de las muescas de forma predeterminada, pero sus ubicaciones también pueden anularse configurando el parámetro conf_intervals .

Nota

En los casos en que los valores del IC sean menores que el cuartil inferior o mayores que el cuartil superior, las muescas se extenderán más allá de la caja, dándole una apariencia distintiva "invertida". Este es el comportamiento esperado y consistente con otros paquetes de visualización estadística.

cadena simb , opcional

El símbolo predeterminado para los puntos de volante. Una cadena vacía ('') oculta los volantes. Si None, entonces los volantes están predeterminados en 'b+'. El parámetro flierprops proporciona más control .

vert bool, por defecto: Verdadero

Si True, dibuja cajas verticales. Si False, dibuja cuadros horizontales.

whis float o (float, float), por defecto: 1.5

La posición de los bigotes.

Si es flotante, el bigote inferior está en el dato más bajo por encima de , y el bigote superior en el dato más alto por debajo de , donde Q1 y Q3 son el primer y tercer cuartil. El valor predeterminado de corresponde a la definición original de diagramas de caja de Tukey.Q1 - whis*(Q3-Q1)Q3 + whis*(Q3-Q1)whis = 1.5

Si un par de flotadores, indican los percentiles en los que dibujar los bigotes (p. ej., (5, 95)). En particular, establecer esto en (0, 100) da como resultado bigotes que cubren todo el rango de datos.

En el caso límite donde , whis se establece automáticamente en (0, 100) (cubre todo el rango de datos) si el rango automático es Verdadero.Q1 == Q3

Más allá de los bigotes, los datos se consideran valores atípicos y se trazan como puntos individuales.

bootstrap int, opcional

Especifica si se arrancan los intervalos de confianza alrededor de la mediana para diagramas de caja con muescas. Si bootstrap es None, no se realiza bootstrapping y las muescas se calculan mediante una aproximación asintótica basada en Gauss (consulte McGill, R., Tukey, JW y Larsen, WA, 1978 y Kendall y Stuart, 1967). De lo contrario, bootstrap especifica el número de veces que se arranca la mediana para determinar sus intervalos de confianza del 95 %. Se recomiendan valores entre 1000 y 10000.

usermedians 1D tipo matriz, opcional

Una matriz 1D de longitud len(x). Cada entrada que no lo es Nonefuerza el valor de la mediana para el conjunto de datos correspondiente. Para las entradas que son None, Matplotlib calcula las medianas de forma normal.

conf_intervals tipo matriz, opcional

Una matriz 2D de forma . Cada entrada que no sea None fuerza la ubicación de la muesca correspondiente (que solo se dibuja si la muesca es ). Para las entradas que son , las muescas se calculan mediante el método especificado por los otros parámetros (p. ej., bootstrap ).(len(x), 2)TrueNone

posiciones en forma de matriz, opcional

Las posiciones de las cajas. Los ticks y los límites se establecen automáticamente para que coincidan con las posiciones. El valor predeterminado es donde N es el número de cuadros que se dibujarán.range(1, N+1)

anchos flotantes o tipo matriz

Los anchos de las cajas. El valor predeterminado es 0,5 o , si es menor.0.15*(distance between extreme positions)

patch_artist bool, predeterminado: Falso

FalseProduce cajas con el artista Line2D . De lo contrario, las cajas se dibujan con los artistas de Patch.

secuencia de etiquetas , opcional

Etiquetas para cada conjunto de datos (una por conjunto de datos).

manage_ticks booleano , por defecto: Verdadero

Si es Verdadero, las ubicaciones de las marcas y las etiquetas se ajustarán para que coincidan con las posiciones del gráfico de caja.

autorango bool, predeterminado: Falso

Cuando Truey los datos se distribuyen de manera que los percentiles 25 y 75 sean iguales, whis se establece en (0, 100) de modo que los extremos de los bigotes estén en el mínimo y el máximo de los datos.

bool de línea media , predeterminado: falso

If True(y showmeans es True), intentará representar la media como una línea que abarque todo el ancho de la caja de acuerdo con meanprops (ver más abajo). No se recomienda si shownotches también es True. De lo contrario, las medias se mostrarán como puntos.

flotante zorder , por defecto:Line2D.zorder = 2

El zorder del diagrama de caja.

Devoluciones :
dictar

Un diccionario que asigna cada componente del diagrama de caja a una lista de las Line2Dinstancias creadas. Ese diccionario tiene las siguientes claves (suponiendo diagramas de caja verticales):

  • boxes: el cuerpo principal del diagrama de caja que muestra los cuartiles y los intervalos de confianza de la mediana, si están habilitados.

  • medians: líneas horizontales en la mediana de cada caja.

  • whiskers: las líneas verticales que se extienden hasta los puntos de datos no atípicos más extremos.

  • caps: las líneas horizontales en los extremos de los bigotes.

  • fliers: puntos que representan datos que se extienden más allá de los bigotes (voladores).

  • means: puntos o líneas que representan los medios.

Otros parámetros :
showcaps bool, por defecto: Verdadero

Muestre las gorras en los extremos de los bigotes.

showbox bool, por defecto: Verdadero

Muestra el cuadro central.

showfliers bool, por defecto: Verdadero

Muestre los valores atípicos más allá de las mayúsculas.

showmeans bool, por defecto: Falso

Muestra las medias aritméticas.

capprops dict, por defecto: Ninguno

El estilo de las gorras.

capwidths float o array, predeterminado: Ninguno

Los anchos de las tapas.

dictado de boxprops , predeterminado: Ninguno

El estilo de la caja.

whiskerprops dict, por defecto: Ninguno

El estilo de los bigotes.

dictado de flyerprops , predeterminado: Ninguno

El estilo de los volantes.

dictado de medianaprops , predeterminado: ninguno

El estilo de la mediana.

dictado de meanprops , predeterminado: Ninguno

El estilo de la media.

objeto indexable de datos , opcional

Si se proporciona, todos los parámetros también aceptan una cadena s, que se interpreta como data[s](a menos que esto genere una excepción).

Ver también

violinplot

Dibujar una estimación de la función de densidad de probabilidad.