En estadística, los datos pueden organizarse de dos maneras principales: agrupados y no agrupados. La elección entre uno y otro depende del tamaño del conjunto de datos y del nivel de detalle que se requiera para su análisis.

1. Datos agrupados:
- Definición: Son datos que se organizan en intervalos o categorías (clases) para facilitar su análisis, especialmente cuando el conjunto de datos es grande.
- Características:
- Se utilizan cuando el número de datos es muy grande.
- Los datos se resumen en intervalos (clases) y se analizan mediante frecuencias.
- Se pierde cierto nivel de detalle, ya que los datos individuales se “agrupan” en intervalos.
- Ejemplo:
- Conjunto de datos: 5, 8, 12, 15, 20, 22, 25, 28, 30, 35.
- Datos agrupados en intervalos: 5-10, 11-15, 16-20, 21-25, 26-30, 31-35.
2. Datos no agrupados:
- Definición: Son datos que se presentan de manera individual, sin agrupar en intervalos o categorías. Cada valor se trata de forma independiente.
- Características:
- Se utilizan cuando el número de datos es pequeño.
- Permite un análisis detallado de cada valor.
- No se pierde información, ya que se trabaja con los datos originales.
- Ejemplo:
- Conjunto de datos: 5, 8, 12, 15, 20.
- Aquí cada valor se analiza por separado.
Distribución de frecuencias:
La distribución de frecuencias es una tabla que organiza un conjunto de datos en intervalos o categorías (clases) y muestra cuántas veces se repite cada valor o intervalo (frecuencia). Es una herramienta fundamental en estadística para resumir y analizar datos.
Elementos de la distribución de frecuencias
- Clase
- Se refiere a cada uno de los intervalos en los que se agrupan los datos en una distribución de frecuencias.
- Ejemplo: Si los datos están entre 10 y 50, se pueden formar clases como 10-19, 20-29, 30-39, etc.
- Límites de clase
- Son los valores que definen el comienzo y el final de cada clase.
- Límite inferior: Es el menor valor de la clase.
- Límite superior: Es el mayor valor de la clase.
- Ejemplo: En la clase 10 – 19, el límite inferior es 10 y el límite superior es 19.
- Amplitud de clase
- Es el tamaño de cada intervalo de clase y se obtiene restando el límite superior e inferior de la clase y sumando 1 (si los datos son enteros) o restando directamente (si los datos son continuos).
- Fórmula: Amplitud=Límite superior−Límite inferior
- Ejemplo: Para la clase 10-19, la amplitud es 19 – 10 = 9.
- Marca de clase
- Es el punto medio de cada clase y se obtiene promediando el límite inferior y el límite superior.
- Fórmula: Marca de clase=Límite superior−Límite inferior/2
- Ejemplo: Para la clase 10 – 19, la marca de clase es: (10+19)/2=14.5
- Frecuencias
- Frecuencia absoluta (fi): Es el número de datos que pertenecen a cada clase.
- Frecuencia relativa (fr): Es la proporción de datos en cada clase respecto al total de datos. Se calcula como: fr=fi/N donde N es el total de datos.
- Frecuencia relativa porcentual (fr%): Es la frecuencia relativa expresada en porcentaje: fr%=fr×100
- Frecuencia acumulada (Fi): Es la suma de las frecuencias absolutas desde la primera clase hasta la clase correspondiente.
Graficando los datos: