Cuartil

¿Qué es un cuartil?

Un cuartil es un término estadístico que describe una división de observaciones en cuatro intervalos definidos en función de los valores de los datos y cómo se comparan con el conjunto completo de observaciones .

Trate de no confundir un cuarto con un cuartil.

ABAJO "Cuartil"

Para entender el cuartil, es importante entender la mediana como una medida de tendencia central. La mediana en las estadísticas es el valor medio de un conjunto de números. Es el punto en el que exactamente la mitad de los datos se encuentra por debajo y por encima del valor central. Entonces, dado un conjunto de 13 números, la mediana sería el séptimo número. Los seis números que preceden a este valor son los números más bajos en los datos, y los seis números después de la mediana son los números más altos en el conjunto de datos dado. Debido a que la mediana no se ve afectada por valores extremos o valores atípicos en la distribución, a veces se prefiere a la media.

Si bien la mediana es un estimador robusto de la ubicación, no dice nada acerca de cómo los datos en ambos lados de su valor se distribuyen o dispersan. El cuartil mide la dispersión de valores por encima y por debajo de la media dividiendo la distribución en cuatro grupos. Al igual que la mediana divide los datos a la mitad para que el 50% de la medición se encuentre por debajo de la mediana y el 50% se encuentre por encima, el cuartil descompone los datos en cuartos para que el 25% de la medición sea menor que el cuartil inferior, 50 % son menos que la media, y el 75% son menos que el cuartil superior.

Un cuartil divide los datos en tres puntos, un cuartil inferior, una mediana y un cuartil superior, para formar cuatro grupos del conjunto de datos. El cuartil inferior o el primer cuartil se denota como Q1, y es el número medio que se encuentra entre el valor más pequeño del conjunto de datos y la mediana. El segundo cuartil, Q2, también es la mediana. El cuartil superior o tercero designado como Q3 es el punto central que se encuentra entre la mediana y el número más alto de la distribución. Ahora, podemos mapear los cuatro grupos formados a partir de los cuartiles. El primer grupo de valores contiene el número más pequeño hasta Q1; el segundo grupo incluye Q1 a la mediana; el tercer conjunto es la mediana de Q3; y la cuarta categoría comprende Q3 al punto de datos más alto de todo el conjunto.

Cada cuartil contiene el 25% de las observaciones totales. En general, los datos se ordenan de menor a mayor con aquellas observaciones que caen por debajo del 25% de todos los datos analizados asignados dentro del primer cuartil, las observaciones caen entre 25.1% y 50% y se asignan en el segundo cuartil, luego las observaciones caen entre 51% y 75% asignados en el tercer cuartil, y finalmente las observaciones restantes asignadas en el cuarto cuartil.

Ejemplo cuartil

Trabajemos con un ejemplo.Supongamos que la distribución de los puntajes matemáticos en una clase de 19 estudiantes en orden ascendente es:

59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84 , 87, 90, 95, 98

Primero, marque la mediana, Q2, que en este caso es el décimo valor - 75.

Q1 es el punto central entre la puntuación más pequeña y la mediana. En este caso, Q1 cae entre el primer y el noveno puntaje - 68. [Tenga en cuenta que la mediana también se puede incluir al calcular Q1 o Q3 para un conjunto impar de valores. Si tuviéramos que incluir la mediana en cualquier lado del punto medio, entonces Q1 será el valor medio entre el primer y décimo puntaje, que es el promedio del quinto y sexto puntaje - (quinto + sexto) / 2 = (68 + 69) / 2 = 68. 5].

Q3 es el valor medio entre Q2 y el puntaje más alto - 84. [O si incluye la mediana, Q3 = (82 + 84) / 2 = 83].

Ahora que tenemos nuestros cuartiles, interpretemos sus números. Una puntuación de 68 (Q1) representa el primer cuartil y es el percentil 25 th . 68 es la mediana de la mitad inferior del puntaje establecido en los datos disponibles i. mi. la mediana de los puntajes de 59 a 75. Q1 nos dice que el 25% de los puntajes son menores a 68 y el 75% de los puntajes de clase son mayores. Q2 (la mediana) es el percentil 50 th y muestra que el 50% de los puntajes son inferiores a 75, y el 50% de los puntajes están por encima de 75. Finalmente, Q3, el 75 th < percentil, revela que el 25% de los puntajes son mayores y el 75% son menores que 84. Si el punto de datos para Q1 está más lejos de la mediana que Q3 es de la mediana, entonces podemos decir que hay una mayor dispersión entre los valores más pequeños del conjunto de datos que entre los valores más grandes. Se aplica la misma lógica si Q3 está más alejado de Q2 que Q1 de la mediana.

Si hay una cantidad par de puntos de datos, la mediana será el promedio de los dos números medios. En nuestro ejemplo anterior, si tuviéramos 20 estudiantes en lugar de 19, la mediana de sus puntajes será el promedio aritmético del décimo y undécimo número.

Los cuartiles se usan para calcular el rango intercuartílico que es una medida de la variabilidad alrededor de la mediana. El rango intercuartílico se calcula simplemente como la diferencia entre el primer y el tercer cuartil: Q3 - Q1. En efecto, es el rango de la mitad central de los datos el que muestra qué tan dispersos están los datos.

Para grandes conjuntos de datos, Microsoft Excel se puede usar para calcular cuartiles usando la función QUARTILE.