DISTRIBUCIÓN DE FRECUENCIA
En estadística, se le llama distribución de frecuencias a la agrupación de datos en categorías mutuamente excluyentes que indican el número de observaciones en cada categoría. Esto proporciona un valor añadido a la agrupación de datos. La distribución de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el número existente en cada clase.
Las frecuencias
pueden ser:
2.1 FRECUENCIA
ABSOLUTA (fi): Es el número de veces que se repite un determinado valor de la
variable (xi).
Se designa por
fi. PROPIEDAD: la suma de todas las frecuencias absolutas es igual al total de
observaciones (n).
2.2 FRECUENCIA
ACUMULADA (Fi): Las frecuencias acumuladas de una distribución de frecuencias
son aquellas que se obtienen de las sumas sucesivas de las fi que integran cada
una de las filas de una distribución de frecuencia, esto se logra cuando la
acumulación de las frecuencias se realiza tomando en cuenta la primera fila
hasta alcanzar la última.
Las frecuencias
acumuladas se designan con las letras Fi. Se calcula: ∑ = − +== i j i iij fFfF
1 1 PROPIEDAD: La última frecuencia acumulada absoluta es igual al total de
observaciones.
2.3 FRECUENCIA
RELATIVA (hi): Es aquella que resulta de dividir cada una de las frecuencias
absolutas entre el número total de datos. Las frecuencias relativas se designan
con las letras hi.
PROPIEDAD: la
suma de todas las frecuencias relativas es igual a la unidad.
2.4 FRECUENCIA RELATIVA ACUMULADA (Hi): Es
aquella que resulta de dividir cada una de las frecuencias acumuladas entre
número total de datos. Se designa con las letras Hi .
PROPIEDAD: La
última frecuencia relativa acumulada es la unidad.
DISTRIBUCIÓN DE FRECUENCIAS ABSOLUTAS
Es la
representación estructurada en forma de tabla de toda la información que se ha
recogido sobre la variable que se estudia, es decir, es una tabla que presenta
de manera ordenada los distintos valores de una variable y sus correspondientes
frecuencias.
DISTRIBUCIONES
DE FRECUENCIAS AGRUPADAS
Es aquella distribución en la que la
disposición tabular de los datos estadísticos se encuentran ordenados en clases
y con la frecuencia en cada clase; es decir, los datos originales de varios
valores adyacentes del conjunto se combinan para formar un intervalo de clase.
No existen normas establecidas para determinar cuándo es apropiado utilizar
datos agrupados o datos no agrupados; sin embargo, se sugiere que cuando el
número total de datos (N) es igual o superior 50 y además el rango o recorrido
de la serie de datos es mayor de 20, entonces, se utilizará la distribución de
frecuencia para datos agrupados, también se utilizará este tipo de distribución
cuando se requiera elaborar gráficos lineales como el histograma, el polígono
de frecuencia o la ojiva. La razón fundamental para utilizar la distribución de
frecuencia de clases es proporcionar mejor comunicación acerca del patrón
establecido en los datos y facilitar la manipulación de los mismos. Los datos
se agrupan en clases con el fin de sintetizar, resumir, condensar o hacer que
la información obtenida de una investigación sea manejable con mayor facilidad.
Al agrupar los datos en una distribución de frecuencia de clase se pierde parte
de la información. La reducción o agrupamiento a que son sometidos los datos de
una serie de valores cuando existen muchos valores diferentes, originan los
denominados errores de agrupamiento; sin embargo, estos errores son en general
muy pequeños, razón por la cual la distribución de frecuencia de clase tiene
una validez estadística práctica.
Para agrupar los
datos en intervalos de clase se deben seguir las siguientes reglas generales:
• El número de
intervalos de clase se toma entre 5 y 15 dependiendo de los datos.
• Cada
observación debe estar incluida en una y solo una clase o intervalo.
• El valor más
pequeño y más grande deben entrar en la clasificación.
• No deben
existir brechas o vacíos entre clases sucesivas.
• Los intervalos no se deben sobreponer.
• En la medida de lo posible, se debe utilizar
la misma amplitud para todos los intervalos.
COMPONENTES DE
UNA DISTRIBUCIÓN DE FRECUENCIAS DE CLASES
1.- Clase o Intervalo
de clase.- Son divisiones o categorías en las cuales se agrupan un conjunto de
datos ordenados con características comunes. Para organizar los valores de la
serie de datos hay que determinar un número de clases que sea conveniente. En
otras palabras, que ese número de intervalos no origine un número pequeño de
clases ni muy grande. Un número de clases pequeño puede ocultar la naturaleza
natural de los datos y un número muy alto puede provocar demasiados detalles
como para observar alguna información de gran utilidad en la investigación. A
las fronteras del intervalo, la llamaremos, límites inferior y superior de la
clase y los denotaremos por Li-1, Li.
2.- Punto medio
o Marca de clase ( X& ).- Es la semisuma del límite inferior y superior de
una clase.
3.- Amplitud,
Longitud o Tamaño del Intervalo.- Los intervalos de clases pueden ser de tres
tipos: Clases de igual tamaño, clases de tamaños desiguales y clases abiertas.
En términos generales, las clases de igual tamaño son los más utilizados y
recomendados para los cálculos estadísticos. Se designa por las letras Ic.
Nota: Al número
de observaciones de una clase se le llama frecuencia de clase, si dividimos
esta frecuencia por el número total de observaciones, se llama frecuencia
relativa de clase, y del mismo modo que lo hacíamos para datos sin agrupar
definiríamos Hi, y Fi.
PROCEDIMIENTO PARA CONSTRUIR UNA DISTRIBUCIÓN
DE FRECUENCIAS AGRUPADA EN INTERVALOS
1. Determinar el
máximo y mínimo entre los valores que tenemos en la muestra y calcular el
recorrido de la variable o rango.
2. Calcular el número de clases a utilizar.
Existen diversos criterios para determinar el número de clases, ante tanta
diversidad de criterios, se ha considerado que lo más importante es dar un
ancho o longitud de clases a todos los intervalos de tal manera que respondan a
la naturaleza de los datos y al objetivo que se persigue y esto se logra con la
práctica.
Existe una forma
para determinar el número de clases y la misma puede ilustrarse en el siguiente
cuadro: Numero de Datos Numero de Intervalos 10 - 100 De 4 a 8 100 - 1.000 De 8
a 11 1.000 - 10.000 De 11 a 14
Cuando se tenga
dudas en determinar el número de intervalos de clases, es de gran utilidad
utilizar el método sugerido por Hebert A. Sturges, el cual establece que: K=
1+3,322 log(n) = número de intervalos. En este curso se utilizará este método
siempre y cuando el mismo sea aplicable.
MÉTODOS GRÁFICOS
La forma de la distribución de frecuencias se
percibe más rápidamente si la representamos gráficamente. Se resume la
información de la muestra de forma gráfica con fines clarificadores o para
enfatizar y descubrir determinadas características que de otra manera seria muy
difícil de apreciar. Un gráfico siempre es más inmediato de comprender que un
conjunto de datos estadísticos. Las representaciones graficas varían según el
tipo de variable: a. Gráficos para variables Discretas y Categóricas DIAGRAMA
DE BARRAS: Es la representación gráfica usual para variables cuantitativas
discretas o para variables cualitativas. En el eje de ordenadas representamos
los diferentes valores de la variable (xi). Sobre cada valor levantamos una
barra de altura igual a la frecuencia (absoluta o relativa). Ejemplo: 0 20 40
60 80 100 120 140 160 180 1er trim. 2do trim. 3er trim. 4to trim.
DIAGRAMA DE
SECTORES O DE PASTEL:
Es el más usual en variables cualitativas. Se
representan mediante círculos. A cada valor de la variable se le asocia el
sector circular proporcional a su frecuencia. Ejemplo: Los siguientes datos
corresponden a una encuesta referente a elecciones locales de un partido
político: xi fi a favor 50% en contra 40% abstención 10% Para construir el
diagrama de sectores partimos del hecho de que un circulo encierra un total de
360 grados. Luego, mediante una regla de tres simple, repartimos los 360 grados
en distintos sectores, de acuerdo con cada porcentaje; tenemos así que para
determinar el sector correspondiente al 50%.
ASIMETRÍA
Es una medida de forma de una distribución que permite identificar y describir la manera como los datos tiende a reunirse de acuerdo con la frecuencia con que se hallen dentro de la distribución. Permite identificar las características de la distribución de datos sin necesidad de generar el gráfico.
TIPOS DE ASIMETRÍA
La asimetría presenta las siguientes formas:
Asimetría Negativa o a la Izquierda.- Se da cuando en una distribución la minoría de los datos está en la parte izquierda de la media. Este tipo de distribución presenta un alargamiento o sesgo hacia la izquierda, es decir, la distribución de los datos tiene a la izquierda una cola más larga que a la derecha. También se dice que una distribución es simétrica a la izquierda o tiene sesgo negativo cuando el valor de la media aritmética es menor que la mediana y éste valor de la mediana a su vez es menor que la moda, en simbolos
Nota: Sesgo es el grado de asimetría de una distribución, es decir, cuánto se aparta de la simetría.
Simétrica.- Se da cuando en una distribución se distribuyen aproximadamente la misma cantidad de los datos a ambos lados de la media aritmética. No tiene alargamiento o sesgo. Se representa por una curva normal en forma de campana llamada campana de Gauss (matemático Alemán 1777-1855) o también conocida como de laplace (1749-1827).También se dice que una distribución es simétrica cuando su media aritmética, su mediana y su moda son iguales, en símbolos Md=Mo
Asimetría Positiva o a la Derecha.- Se da cuando en una distribución la minoría de los datos está en la parte derecha de la media aritmética. Este tipo de distribución presenta un alargamiento o sesgo hacia la derecha, es decir, la distribución de los datos tiene a la derecha una cola más larga que a la izquierda.
También se dice que una distribución es simétrica a la derecha o tiene sesgo positivo cuando el valor de la media aritmética es mayor que la mediana y éste a valor de la mediana a su vez es mayor que la moda, en símbolos .
CURTOSIS O APUNTAMIENTO
La curtosis mide el grado de agudeza o achatamiento de una distribución con relación a la distribución normal, es decir, mide cuán puntiaguda es una distribución.
2.1) TIPOS DE CURTOSISLa curtosis determina el grado de concentración que presentan los valores en la región central de la distribución. Así puede ser:
Leptocúrtica.- Existe una gran concentración.
Mesocúrtica.- Existe una concentración normal.
Platicúrtica.- Existe una baja concentración.
2.1) TIPOS DE CURTOSISLa curtosis determina el grado de concentración que presentan los valores en la región central de la distribución. Así puede ser:
Leptocúrtica.- Existe una gran concentración.
Mesocúrtica.- Existe una concentración normal.
Platicúrtica.- Existe una baja concentración.
No hay comentarios.:
Publicar un comentario