• CONTÁCTANOS
  • 15 mar. 2011

    CARACTERÍSTICAS DE UNA DISTRIBUCIÓN DE FRECUENCIAS


    a) Media aritmética ( X )
    La media aritmética o simplemente media, que denotaremos por X , es el número
    obtenido al dividir la suma de todos los valores de la variable entre el numero total de
    observaciones, y se define por la siguiente expresión:


    b) Media geométrica:
    Sea una distribución de frecuencias (x i , n i ). La media geométrica, que denotaremos
    por G. se define como la raíz N-ésima del producto de los N valores de la distribución.

    Si los datos están agrupados en intervalos, la expresión de la media geométrica, es la
    misma, pero utilizando la marca de clase (Xi).

    El empleo más frecuente de la media geométrica es el de promediar variables tales como
    porcentajes, tasas, números índices. etc., es decir, en los casos en los que se supone
    que la variable presenta variaciones acumulativas.
    Ventajas e inconvenientes:
    - En su cálculo intervienen todos los valores de la distribución.
    - Los valores extremos tienen menor influencia que en la media aritmética.
    - Es única.
    - Su cálculo es más complicado que el de la media aritmética.
    Además, cuando la variable toma al menos un xi = 0 entonces G se anula, y si la
    variable toma valores negativos se pueden presentar una gama de casos particulares en
    los que tampoco queda determinada debido al problema de las raíces de índice par de
    números negativos.
    c) Media armónica
    La media armónica, que representaremos por H, se define como sigue:


    Obsérvese que la inversa de la media armónica es la media aritmética de los inversos
    de los valores de la variable. No es aconsejable en distribuciones de variables con
    valores pequeños. Se suele utilizar para promediar variables tales como productividades,
    velocidades, tiempos, rendimientos, cambios, etc.
    Ventajas e inconvenientes:
    - En su cálculo intervienen todos los valores de la distribución.
    - Su cálculo no tiene sentido cuando algún valor de la variable toma valor cero.
    - Es única.
    • Relación entre las medias:
    H ≤G≤ X
    d) Mediana ( Me )
    Dada una distribución de frecuencias con los valores ordenados de menor a mayor,
    llamamos mediana y la representamos por Me, al valor de la variable, que deja a su
    izquierda el mismo número de frecuencias que a su derecha.
    • Calculo de la mediana:
    Variara según el tipo de dato:
    a) Variables discretas no agrupadas:
    1º) Se calcula


    b) Variables agrupadas por intervalos
    En este caso hay que detectar en que intervalo está el valor mediano. Dicho intervalo se
    denomina “ intervalo mediano ”.
    Cada intervalo Ii vendrá expresado según la notación Ii = ( Li-1 , Li ]; observando la
    columna de las frecuencias acumuladas, buscaremos el primer intervalo cuya Ni sea
    mayor o igual que N/2 , que será el intervalo modal; una vez identificado dicho intervalo,
    procederemos al cálculo del valor mediano, debiendo diferenciar dos casos:

     671/2 = 335.5 ; Me estará en el intervalo (30 - 35 ]. Por tanto realizamos el cálculo:

    Ventajas e inconvenientes :
    - Es la medida más representativa en el caso de variables que solo admitan la escala
    ordinal.
    - Es fácil de calcular.
    - En la mediana solo influyen los valores centrales y es insensible a los valores
    extremos u “outliers ”.
    - En su determinación no intervienen todos los valores de la variable.

    e) Moda
    La moda es el valor de la variable que más veces se repite, y en consecuencia, en una
    distribución de frecuencias, es el valor de la variable que viene afectada por la máxima
    frecuencia de la distribución. En distribuciones no agrupadas en intervalos se observa la
    columna de las frecuencias absolutas, y el valor de la distribuci6n al que corresponde la
    mayor frecuencia será la moda. A veces aparecen distribuciones de variables con más de
    una moda (bimodales, trimodales, etc), e incluso una distribución de frecuencias que
    presente una moda absoluta y una relativa.
    En el caso de estar la variable agrupada en intervalos de distinta amplitud, se define el
    intervalo modal, y se denota por ( Li-1 , Li ], como aquel que posee mayor densidad de
    frecuencia ( hi ); la densidad de frecuencia se define como :

    Una vez identificado el intervalo modal procederemos al cálculo de la moda, a través de
    la fórmula:


    En el caso de tener todos los intervalos la misma amplitud, el intervalo modal será el
    que posea una mayor frecuencia absoluta ( ni ) y una vez identificado este, empleando la
    fórmula:






    Ventajas e inconvenientes:
    - Su cálculo es sencillo.
    - Es de fácil interpretación.
    - Es la única medida de posición central que puede obtenerse en las variables de tipo
    cualitativo.
    - En su determinación no intervienen todos lo valores de la distribución.

    2.2.2. Medidas de posición no central ( Cuantiles )
    Los cuantiles son aquellos valores de la variable, que ordenados de menor a mayor,
    dividen a la distribución en partes, de tal manera que cada una de ellas contiene el
    mismo número de frecuencias.
    Los cuantiles más conocidos son:
    a) Cuartiles ( Qi )
    Son valores de la variable que dividen a la distribución en 4 partes, cada una de las
    cuales engloba el 25 % de las mismas. Se denotan de la siguiente forma: Q1 es el
    primer cuartil que deja a su izquierda el 25 % de los datos; Q2 es el segundo cuartil que
    deja a su izquierda el 50% de los datos, y Q3 es el tercer cuartil que deja a su izquierda
    el 75% de los datos. (Q2 = Me)
    b) Deciles ( Di)
    Son los valores de la variable que dividen a la distribución en las partes iguales, cada
    una de las cuales engloba el 10 % de los datos. En total habrá 9 deciles. (Q2 = D5 = Me )
    c) Centiles o Percentiles ( Pi )
    Son los valores que dividen a la distribución en 100 partes iguales, cada una de las
    cuales engloba el 1 % de las observaciones. En total habrá 99 percentiles. (Q2 = D5 =
    Me = P50)
    • Cálculo de los cuantiles en distribuciones no agrupadas en intervalos
    Se calculan a través de la siguiente expresión: rN/q, siendo

    r = el orden del cuantil correspondiente
    q = el número de intervalos con iguales frecuencias u observaciones ( q = 4, 10, ó
    100 ).

    N = número total de observaciones
    - La anterior expresión nos indica que valor de la variable estudiada es el cuantil que nos piden, que se corresponderá
    con el primer valor cuya frecuencia acumulada sea mayor o igual a. rN/q
    2.3. Momentos potenciales
    Los momentos son medidas obtenidas a partir de todos los datos de una variable
    estadística y sus frecuencias absolutas. Estas medidas caracterizan a las distribuciones
    de frecuencias de tal forma que si los momentos coinciden en dos distribuciones, diremos
    que son iguales.
    2.3.1. Momentos respecto al origen
    Se define el momento de orden h respecto al origen de una variable estadística a la
    expresión:

     Particularidades:
    Si h = 1, a1 es igual a la media aritmética.
    Si h = 0, a0 es igual a uno ( a0 = 1 )

    2.3.2. Momentos centrales o momentos con respecto a la media aritmética
    Particularidades:

    - Si h = 1, entonces m1 = 0
    - Si h = 2, entonces m2 = S2

    2.4. Medidas de dispersión
    Las medidas de dispersión tratan de medir el grado de dispersión que tiene una variable
    estadística en torno a una medida de posición o tendencia central, indicándonos lo
    representativa que es la medida de posición. A mayor dispersión menor
    representatividad de la medida de posición y viceversa.
    2.4.1 Medidas de dispersión absoluta
    a) Recorrido ( Re )
    Se define como la diferencia entre el máximo y el mínimo valor de la variable:

     b) Desviación absoluta media con respecto a la media ( De )Nos indica las desviaciones con respecto a la media con respecto a la media aritmética
    en valor absoluto.

    c) Varianza
    La varianza mide la mayor o menor dispersión de los valores de la variable respecto a la
    media aritmética. Cuanto mayor sea la varianza mayor dispersión existirá y por tanto
    menor representatividad tendrá la media aritmética.
    La varianza se expresa en las mismas unidades que la variable analizada, pero elevadas
    al cuadrado.

    Propiedades:

    2.4.2. Medidas de dispersión relativa
    Nos permiten comparar la dispersión de distintas distribuciones.
    a) Coeficiente de variación de Pearson ( CVx )
    Indica la relación existente entre la desviación típica de una muestra y su media.




    Al dividir la desviación típica por la media se convierte en un valor excento de unidad de
    medida. Si comparamos la dispersión en varios conjuntos de observaciones tendrá
    menor dispersión aquella que tenga menor coeficiente de variación.
    El principal inconveniente, es que al ser un coeficiente inversamente proporcional a la
    media aritmética, cuando está tome valores cercanos a cero, el coeficiente tenderá a
    infinito.

    0 comentarios:

    Publicar un comentario

    CIVIL21. Con la tecnología de Blogger.