sábado, 23 de mayo de 2009





TABLAS DE DOBLE ENTRADA
En una tabla de doble entrada, los datos se muestran en columnas y filas al igual que en las tablas. Sin embargo, en comparación con las tablas, cada columna tiene por lo menos un encabezado y cada fila tiene por lo menos un encabezado de fila. Los datos correspondientes aparecen en la intersección de los encabezados de la columna y la fila: esta sección corresponde al "cuerpo".

El ejemplo de la tabla de doble entrada muestra el volumen de negocios por prestación y por trimestre. Los rótulos de las prestaciones son encabezados de fila y, los rótulos de trimestre son encabezados de columna. El volumen de negocios para cada prestación para cada trimestre aparece en el cuerpo.

Para entender la disposición de los elementos en una tabla de doble entrada, imagínese la tabla de doble entrada como un bloque terminado. Los objetos que se colocan en el cuadrante inferior izquierdo de la tabla de doble entrada proporcionan los datos para los encabezados de fila; los objetos colocados en el cuadrante superior derecho proporcionan los datos para los encabezados de columna, y los objetos del cuadrante inferior derecho proporcionan los datos para el cuerpo de la tabla. No puede colocar ningún objeto en el cuadrante superior izquierdo.


http://miayudante.upn.mx/docint/LM630077-02.jpg


http://miayudante.upn.mx/docint/LM587191-01.jpg




Varianza

La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística. La varianza se representa porsigno varianzavarianza

Varianza para datos agrupados

varianzavarianza
Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.
varianza varianza

Propiedades de la varianza

1 La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.

2 Si a todos los valores de la variable se les suma un número la varianza no varía.

3 Si todos los valores de la variable se multiplican por un número la varianza queda multiplicada por el cuadrado de dicho número.

4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede calcular la varianza total.

Si todas las muestras tienen el mismo tamaño:

varianzas

Observaciones sobre la varianza

1 La varianza, al igual que la media, es un índice muy sensible a las puntuaciones extremas.

2 En los casos que no se pueda hallar la media tampoco será posible hallar la varianza.

3 La varianza no viene expresada en las mismas unidades que los datos, ya que las desviaciones están elevadas al cuadrado.

http://www.dsostenible.com.ar/situacion-inter/clima/fig4-1.jpg

http://3.bp.blogspot.com/_DvSZ-aVDo9s/SbFh3Q0ubcI/AAAAAAAAAFQ/1ZuZbsD3dR4/s400/varianza.gifhttp://www.ugrj.org.mx/images/contenido/cipej/bacock/varianza.gif

Desviación estándar

La desviación estándar (o desviación típica) es una medida de dispersión para variables de razón (ratio o cociente) y de intervalo, de gran utilidad en la estadística descriptiva. Es una medida (cuadrática) que informa de la media de distancias que tienen los datos respecto de su media aritmética, expresada en las mismas unidades que la variable.

Para abordar las cuestiones que comentábamos en el párrafo anterior, nos valemos de herramientas como la varianza y la desviación estándar. Ambas medidas están estrechamente relacionadas ya que definimos una a partir de la otra.

Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer también la desviación que representan los datos en su distribución respecto de la media aritmética de dicha distribución, con objeto de tener una visión de los mismos más acorde con la realidad a la hora de describirlos e interpretarlos para la toma de decisiones.

Formulación

La varianza representa la media aritmética de las desviaciones con respecto a la media elevadas al cuadrado. Si atendemos a la colección completa de datos (la población en su totalidad) obtenemos la varianza poblacional; y si por el contrario prestamos atención sólo a una muestra de la población, obtenemos en su lugar la varianza muestral. Las expresiones de estas medidas son las que aparecen a continuación.

Expresión de la varianza muestral:


 {S_X^2} = \frac{ \sum\limits_{i=1}^n \left( X_i - \overline{X} \right) ^ 2 }{n-1}

Expresión de la varianza poblacional:
 {\sigma^2} = \frac{ \sum\limits_{i=1}^N \left( X_i - {\mu} \right) ^ 2 }{N}
Expresión de la desviación estándar poblacional:
 \sqrt{{\sigma^2}} =\sqrt{{\frac{ \sum\limits_{i=1}^N \left( X_i - {\mu} \right) ^ 2 }{N}}}
El término desviación estándar fue incorporado a la estadística por Karl Pearson en 1894.


http://perso.wanadoo.es/albertoxepa/Image8.gif
http://www.vagoneta.net/wp-content/uploads/2008/01/350px-iq_curve.jpg

http://www.razacarora.com/Comoselee/Grafico2.jpg


viernes, 22 de mayo de 2009

Medidas de posición no central

En estadística descriptiva, las medidas de posición no central permiten conocer otros puntos característicos de la distribución que no son los valores centrales. Entre las medidas de posición central más importantes están los cuantiles que son aquellos valores de la variable, que ordenados de menor a mayor, dividen a la distribución en partes, de tal manera que cada una de ellas contiene el mismo número de frecuencias.

Los tipos más importantes de cuantiles son:

  • Los cuartiles, que dividen a la distribución en cuatro partes;
  • Los quintiles, que dividen a la distribución en cinco partes;
  • Los deciles, que dividen a la distribución en diez partes;
  • Los percentiles, que dividen a la distribución en cien partes.

Cuartiles

Dados una serie de valores X1,X2,X3...Xn ordenados en forma creciente,

Definimos:

  • Primer cuartil (Q1) como la mediana de la primera mitad de valores.
  • Segundo cuartil (Q2) como la propia mediana de la serie.
  • Tercer cuartil (Q3) como la mediana de la segunda mitad de valores.

En estadística descriptiva los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales.

Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto (25%) de todos los valores de la sucesión (ordenada); el tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas partes (75%) de los datos.


Quintiles

  • Se representan con la letra K.
  • Es el primer quintil. Separa a la muestra dejando el 20% de los datos a su izquierda.
  • Es el segundo quintil. Es el valor que indica que el 40% de los datos son menores.
  • Es el tercer quintil. Indica que el 60% de los datos son menores que él.
  • Es el cuarto quintil. Separa al 80% de los datos del otro 20%.
  • Percentiles

  • Se representan con la letra C.
  • Es el percentil i-ésimo, donde la i toma valores del 1 al 99. El i % de la muestra son valores menores que él y el 100-i % restante son mayores.

Cuando los datos no están agrupados en intervalos, los cuartiles, así como el resto de las medidas de posición, tienen un valor claro. Sin embargo, cuando tenemos una agrupación de los datos ya no es tan sencillo realizar el cálculo. Sí que resulta claro ver en cuál de los intervalos está el cuartil (quintil, decil o percentil) buscado, pero para calcular su valor exacto necesitaremos usar una fórmula.

las medidas de posicion
señalan que porcentajes
de datos estan dentro
de cierto porcentaje de los valores

cuartiles
porcentajes de datos
en el 25% , 50% , 75% de los valores

deciles
porcentaje de datos
en el 10% , 20% ....90% de los valores

percentiles
porcentaje de datos
en el 1%, 2% ,...99 % de los valores

EJEMPLO:

El precio de un interruptor magentotérmico en 10 comercios de electricidad de una ciudad son : 25, 25, 26, 24, 30, 25, 29, 28, 26, y 27 Euros. Hallar la media, moda, mediana, (abrir la calculadora estadística, más abajo) diagrama de barras y el diagrama de caja.

SOLUCIÓN:

(Utilizar la calculadora de debajo)

[El diagrama de cajas: caja desde Q1 a Q3 (50% de los datos), bigotes el recorrido]






LA MODA
La moda es el dato más repetido, el valor de la variable con mayor frecuencia absoluta. En cierto sentido se corresponde su definición matemática con la locución "estar de moda", esto es, ser lo que más se lleva.

Su cálculo es extremadamente sencillo, pues sólo necesita de un recuento. En variables continuas, expresadas en intervalos, existe el denominado intervalo modal o, en su defecto, si es necesario obtener un valor concreto de la variable, se recurre a la interpolación.

Ejemplo

Número de personas en distintos carros en una carretera: 5-7-4-6-9-5-6-1-5-3-7. en este caso el número que más se repite es 5, entonces la moda es 5.

Hablaremos de una distribución bimodal de los datos, cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima. Cuando en una distribución de datos se encuentran tres o más modas, entonces es multimodal. Por último, si todas las variables tienen la misma frecuencia diremos que no hay moda.

Cuando tratamos con datos agrupados en intervalos, antes de calcular la moda, se ha de definir el intervalo modal. El intervalo modal es el de mayor frecuencia absoluta.

La moda, cuando los datos están agrupados, es un punto que divide al intervalo modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:



jueves, 21 de mayo de 2009

MEDIANA
La mediana es un valor de la variable que deja por debajo de sí a la mitad de los datos, una vez que estos están ordenados de menor a mayor.Por ejemplo, la mediana del número de hijos de un conjunto de trece familias, cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posición central es 2:







En caso de un número par de datos, la mediana no correspondería a ningún valor de la variable, por lo que se conviene en tomar como mediana el valor intermedio entre los dos valores centrales. Por ejemplo, en el caso de doce datos como los anteriores:



Se toma como mediana: Existen métodos de cálculo más rápidos para datos más númerosos.Del mismo modo, para valores agrupados en intervalos, se halla el "intervalo mediano" y, dentro de este, se obtiene un valor concreto por interpolacion.



la formula de la mediana es:

otra formula seria:

LA MEDIA ARITMETICA
La media aritmética es el valor obtenido sumando todas las observaciones y dividiendo el total por el número de observaciones que hay en el grupo.
La media resume en un valor las características de una variable teniendo en cuenta a todos los casos. Solamente puede utilizarse con variables cuantitativas.
Ejemplo:


Notas de 5 alumnos en una prueba:
Alumno Nota
1 6.0 ·entonces se suman las Notas:
2 5.4 6.0+5.4+3.1+7.0+6.1=27.6
3 3.1 ·Luego el total se divide entre la cantidad de alumnos:
4 7.0 27.6/5=5.52
5 6.1 ·LA MEDIA ARITMÉTICA EN ESTE PROBLEMA SERÍA 5.52



La media aritmética es, probablemente, uno de los parámetros estadísticos más extendidos.Se le llama también promedio o, simplemente, media.

Definición formal
Dado un conjunto numérico de datos, x1, x2, ..., xn, se define su media aritmética como



Esta definición varía, aunque no sustancialmente, cuando se trata de variables continuas, esto es, también puede calcularse para variables agrupadas en intervalos.

La estatura media como resumen de una población homogénea (abajo) o heterogénea (arriba).

CODIFICACION
la codificacion se utiliza para transformar datos cualitativos en cuantitativos... los datos cuantitativos son los codigos... los datos cualitativos deben tener homogeneidad y estar bien relacionados ... para lograr su integracion correcta ... por ejemplo ...
Supongamos que hemos preguntado, por medio de entrevistas estructuradas hechas a una muestra, la opinión que tienen las personas respecto a las Naciones Unidas. Si la pregunta ha sido abierta, cada responderte habrá expuesto sus opiniones en algunas breves frases. La codificación nos permitirá agrupar sus respuestas, para poder evaluar cuáles son las opiniones más salientes al respecto. Nuestros códigos, por ejemplo, pondrán ser:
1. Es una institución que garantiza (o protege) la paz mundial.2. Es una institución que debería ser reformada.3. Es útil por los servicios que presta a los países menos desarrollados.4. Es inoperante, ineficiente, etc.5. No sabe o no opina al respecto y bueno, asi con este ejemplo nos damos cuenta de la importancia de codificar, ya que facilita el trabajo, y ahora solo trabajamos con cinco numeros ...

martes, 19 de mayo de 2009

LA MEDIA ARMONICA
La media armónica , denominada H, de una cantidad finita de números es igual al recíproco, o inverso, de la media aritmética de los recíprocos de dichos números
Así, dados los números a1,a2, ... , an, la media armónica será igual a:

La media armónica resulta poco influida por la existencia de determinados valores mucho más grandes que el conjunto de los otros, siendo en cambio sensible a valores mucho más pequeños que el conjunto.
La media armónica no está definida en el caso de la existencia en el conjunto de valores nulos

domingo, 10 de mayo de 2009

Media cuadrática
En matemáticas, la media cuadrática, valor cuadrático medio o RMS (del inglés root mean square) es una medida estadística de la magnitud de una cantidad variable. Puede calcularse para una serie de valores discretos o para una función de variable continua. El nombre deriva del hecho de que es la raíz cuadrada de la media aritmética de los cuadrados de los valores.
Esta
media como medida de asociación tiene aplicaciones tanto en ciencias biológicas como en medicina.
A veces la variable toma valores positivos y negativos, como ocurre, por ejemplo, en los
errores de medida. En tal caso se puede estar interesado en obtener un promedio que no recoja los efectos del signo. Este problema se resuelve, mediante la denominada media cuadrática. Consiste en elevar al cuadrado todas las observaciones (así los signos negativos desaparecen), en obtener después su media aritmética y en extraer, finalmente, la raíz cuadrada de dicha media para volver a la unidad de medida original.
Otras medias
estadísticas son la media aritmética, la media ponderada, la media generalizada, media armónica
EL DIAGRAMA DE TALLO Y HOJA
Es una técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes. El o los dígitos principales forman el tallo y los dígitos secundarios las hojas. Los tallos están colocados a lo largo del eje vertical, y las hojas de cada observación a lo largo del eje horizontal.


Muestra
En estadística una muestra estadística (también llamada muestra aleatoria o simplemente muestra) es un subconjunto de casos o individuos de una población estadística.
Las muestras se obtienen con la intención de inferir propiedades de la totalidad de la población, para lo cual deben ser representativas de la misma. Para cumplir esta característica la inclusión de sujetos en la muestra debe seguir una
técnica de muestreo. En tales casos, puede obtenerse una información similar a la de un estudio exhaustivo con mayor rapidez y menor coste (véanse las ventajas de la elección de una muestra, más abajo).
Por otra parte, en ocasiones, el muestreo puede ser más exacto que el estudio de toda la población porque el manejo de un menor número de dato provoca también menos errores en su manipulación. En cualquier caso, el conjunto de individuo de la muestra son los sujeto realmente estudiado.
El número de sujetos que componen la muestra suele ser inferior que el de la población, pero suficiente para que la estimación de los parámetros determinados tenga un
nivel de confianza adecuado. Para que el tamaño de la muestra sea idóneo es preciso recurrir a su cálculo.

DIMENSIÓN DE LA POBLACIÓN ej. 222.222 habitantes
PROBABILIDAD DEL EVENTO ej. Hombre o Mujer 50%
NIVEL DE CONFIANZA ej. 96%
DESVIACIÓN TOLERADA ej. 5%
Resultado
TAMAÑO DE LA MUESTRA ej. 270

domingo, 3 de mayo de 2009

la tabla agrupados o simples

la tabla es una representacion de datos con cierto orden .
¿como se determina que tipo de tabla se va a utilizar?
si hay mas de 15 datos distintos se repitan o no se repitan son agrupados.
si hay menos de 15 datos distintos se repitan o no se repitan son simples.
Ej: Agrupar en una tabla 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 5
X F
1 2
2 4
3 3
4 1
5 1
11