.

Docente a cargo Ing. Mónica Mantilla de la Escuela Politécnica Nacional

..

El objetivo de este blog es crear un ambiente en el que se pueda transmitir conocimientos de Probabilidad y Estadística.

...

En un mundo globalizado compartir información es de vital importancia el aprendizaje.

....

Vacía tu bolsillo en tu mente, y tu mente llenará tu bolsillo.

.....

Abre tus brazos al cambio, pero no dejes ir tus valores.

miércoles, 14 de diciembre de 2016

Segunda Prueba

Aquí se dio acabo la segunda prueba del primer parcial

Probabilidad Condicional y independencia


Miércoles 30 de noviembre del 2016
PROBABILIDAD CONDICIONALES EN CONDICIONES DE INDEPENDENCIA ESTADÍSTICA


La probabilidad condicional simbólicamente expresa de la siguiente manera:



P (B / A) = P (B)

La probabilidad de B, si ocurre el evento A es decir, la probabilidad condicional esta sujeta a que ocurra un segundo evento, si el primero a tenido lugar. Por lo tanto la probabilidad condicional del evento B si ocurrió; el evento A es simplemente la probabilidad de B.

Aparentemente puede resultar contradictorio ya que es por definición los eventos independientes son aquellos cuya probabilidad no se afecta en absoluto por la ocurrencia de uno de ellos.

Continuando con nuestro ejemplo de la moneda, la pregunta pudiera se cual es la probabilidad de que el segundo lanzamiento de una moneda legal produzca el lado A si este ya salio en el primer lanzamiento.

P (H2 / H1) = H2
P (H2 / H1) = .5

PROBABILIDAD EN CONDICIONES DE INDEPENDENCIA ESTADÍSTICA

La dependencia estadística existe cuando la probabilidad de un evento depende de la ocurrencia de otro o este último influye en la probabilidad.

Aquí un vídeo de lo que es una probabilidad condicionada:














Muestras Bivariadas

Viernes 18 de noviembre del 2016

Correlación bivariada

La correlación bivariada es una técnica estadística destinada a averiguar: 
  • a) si dos variables tienen relación entre sí
  • b) si la relación es fuerte-moderada-o débil y
  • c) qué dirección tiene la relación

Las coincidencias muchas veces esconden asociaciones entre fenómenos. La correlación es la técnica más usada para medir asociación lineal en todas las ciencias. Indica asociación o relación entre dos variables, no implica causalidad.

Qué es la correlación bivariada

La correlación está basada en la asociación lineal, es decir, que cuando los valores de una variable aumentan los valores de la otra variable pueden aumentar o disminuir proporcionalmente. Por ejemplo, la altura y el peso tienen una relación lineal positiva, a medida que aumenta la altura aumenta el peso. Si realizamos un gráfico de puntos con ambas variables la nube de puntos se asemejará a una diagonal si hay correlación entre las variables.



La covarianza de una variable bidimensional es la media aritmética de los productos de las desviaciones de cada una de las variables respecto a sus medias respectivas.
La covarianza se representa por sxy o σxy.





domingo, 11 de diciembre de 2016

Espacio Muestral


Miércoles 23 de noviembre del 2016

Espacio Muestral

La Estadística, y por tanto el Cálculo de Probabilidades, se ocupan de los denominados fenómenos o experimentos aleatorios.

El conjunto de todos los resultados posibles diferentes de un determinado experimento aleatorio se denomina Espacio Muestral asociado a dicho experimento y se suele representar por Ω. A los elementos de Ω se les denomina sucesos elementales.

Así por ejemplo, el espacio muestral asociado al experimento aleatorio consistente en el lanzamiento de una moneda es Ω= {Cara, Cruz}; el espacio muestral asociado al lanzamiento de un dado es Ω={1, 2, 3, 4, 5, 6}, siendo Cara y Cruz los sucesos elementales asociados al primer experimento aleatorio y 1, 2, 3, 4, 5 y 6 los seis sucesos elementales del segundo experimento aleatorio.

A pesar de la interpretación que tiene el espacio muestral, no es más que un conjunto abstracto de puntos (los sucesos elementales), por lo que el lenguaje, los conceptos y propiedades de la teoría de conjuntos constituyen un contexto natural en el que desarrollar el Cálculo de Probabilidades.

Aquí se presenta un ejemplo:



Diagrama del árbol

Un diagrama de árbol es una representación gráfica que muestra los resultados posibles de una serie de experimentos y sus respectivas probabilidades; consta de r pasos, donde cada uno de los pasos tiene un número finito de maneras de ser llevado a cabo. 

Para la construcción de un diagrama en árbol se partirá poniendo una rama para cada una de las posibilidades, acompañada de su probabilidad. En el final de cada rama parcial se constituye a su vez, un nudo del cual parten nuevas ramas, según las posibilidades del siguiente paso, salvo si el nudo representa un posible final del experimento (nudo final). Hay que tener en cuenta: que la suma de probabilidades de las ramas de cada nudo ha de dar 1.


Tabla de doble entrada



Tablas de doble entrada: También llamadas tablas de contingencias, son aquellas tablas de datos referentes a dos variables, formada, en las cabeceras de las filas, por las categorías o valores de una variable y en las de las columnas por los de la otra, y en las casillas de la tabla, por las frecuencias o numero de elementos que reúnen a la vez las dos categorías o valores de las dos variables que se cruzan en cada casilla. Para la tabulación de un material agrupado de observaciones simultaneas de dos variables aleatorias necesitaremos una tabla descrita como anteriormente lo describimos, las reglas para agrupar son las mismas que en el caso de una sola variable.






Descripción
En una tabla de doble entrada, los datos se muestran en columnas y filas al igual que en las tablas. Sin embargo, en comparación con las tablas, cada columna tiene por lo menos un encabezado y cada fila tiene por lo menos un encabezado de fila. Los datos correspondientes aparecen en la intersección de los encabezados de la columna y la fila: esta sección corresponde al "cuerpo".






viernes, 9 de diciembre de 2016

Eventos Independientes

Miércoles 07 de diciembre del 2016
Eventos Independientes:


Algunas situaciones de probabilidad implican más de un evento. Cuando los eventos no se afectan entre sí, se les conoce como eventos independientes. Los eventos independientes pueden incluir la repetición de una acción como lanzar un dado más de una vez, o usar dos elementos aleatorios diferentes, como lanzar una moneda y girar una ruleta. Muchas otras situaciones también pueden incluir eventos independientes. Para calcular correctamente las probabilidades, necesitamos saber si un evento influye en el resultado de otros eventos.


La principal característica de una situación con eventos independientes es que el estado original de la situación no cambia cuando ocurre un evento. Existen dos maneras de que esto suceda:

Los eventos independientes ocurren ya sea cuando:

·         el proceso que genera el elemento aleatorio no elimina ningún posible resultado o
·         el proceso que sí elimina un posible resultado, pero el resultado es sustituido antes de que suceda una segunda acción. (A esto se le llama sacar un reemplazo.)

Cuando A y B son dos eventos con probabilidades positivas, hemos visto que en general la probabilidad condicional del evento B dado el evento A es diferente de la probabilidad del evento B. Sin embargo, cuando se tiene la igualdad: P(B/A) = P(B) es de especial importancia porque esto quiere decir que el evento B no depende o es independiente del evento A. Es decir, no importa si ocurrió o no el evento A puesto que la ocurrencia o no de A no afecta al evento B.

Proposición 3.6: Si B es independiente de A, entonces A es independiente de B.

Demostración: De la definición de probabilidad condicional se tiene

 y 



Despejando    
 [3.3]

Como B es independiente de A, se tiene: P(B/A) = P(B) y sustituyendo en [3.3] nos conduce a la expresión

Por lo tanto
 de donde
lo que nos indica que A es independiente de B.



Proposición 3.7: A y B son independientes si y sólo si 




Demostración: Si A y B son independientes, entonces

P(B/A) = P(B) y P(A/B) = P(A) [3.4]

De la definición de probabilidad condicional se derivó la ecuación [3.5]


 [3.5]

Sustituyendo [3.4] en [3.5] se tiene:




Por otra parte, si

entonces

y



De donde A es independiente de B y B es independiente de A.



Actividad corazón

Se realizo la actividad corazón

Datos individuales

Miércoles 16 de noviembre del 2016
Datos Individuales

DIAGRAMA CIRCULAR


Es de especial utilidad para mostrar proporciones ( porcentajes ) relativas de una variable. Se crea marcando una porción del círculo correspondiente a cada categoría de la variable .






DIAGRAMA DE BARRAS

Es una forma gráfica de representar datos cualitativos que se han resumido en una distribución de frecuencias, de relativas o de porcentuales. Hay varios tipos de gráficos de barras, como son :



GRÁFICA SIMPLE DE BARRAS VERTICALES

Para respuestas categóricas cualitativas en el que solo interviene una barra para cada clase. Su trazo se realiza ubicando en el eje horizontal   de la gráfica los nombres que identifican cada una de las clases. En el eje vertical  se usa una escala de frecuencias, una de frecuencias relativas o una de porcentuales. Luego, con una barra de un ancho fijo trazada sobre cada indicador de clase llegamos a la altura que corresponde al tipo de frecuencia escogido. Las barras se separan a fin de señalar que cada clase es una categoría independiente. Los espacios entre las barras deben corresponder a la mitad del ancho de una barra.






Datos agrupados en intervalo de clase 



Las distribuciones de frecuencias son tablas que resumen los datos originales en frecuencias.
Los tipos de frecuencia pueden ser:

  • Frecuencia Absoluta (f).- Es el número de veces que se repite el valor de cada variable. La suma de frecuencias absolutas es siempre al total de datos observados.
  • Frecuencia Relativa (fr).- Indica la proporción con que se repite un valor. Es el cociente entre la frecuencia absoluta y el número total de datos. La suma de las frecuencias relativas es siempre .
  • Frecuencia Acumulada (fa).- Indica el número de valores que son menores o iguales que el valor dado. Es la suma de la frecuencia absoluta primera con la segunda, este valor con la tercera, y así sucesivamente.
  • Frecuencia Porcentual (f%).- Llamada también frecuencia relativa porcentual. Se obtiene multiplicando la frecuencia relativa por 100. La suma de las frecuencias porcentuales es siempre 100%. Se calcula así:
  • Frecuencia Relativa Acumulada (fra).- Es la suma de la frecuencia relativa primera con la segunda, este valor con la tercera, y así sucesivamente.
  • Frecuencia Relativa Acumulada Porcentual (fra%).- Indica el número de valores que son menores o iguales que el valor dado. Se obtiene multiplicando la frecuencia relativa acumulada por 100. Se calcula así:

REGLAS GENERALES PARA FORMAS DISTRIBUCIONES DE FRECUENCIAS PARA DATOS AGRUPADOS EN INTERVALOS

1) Calcule el Rango (R).- También se llama recorrido o amplitud total. Es la diferencia entre el valor mayor y el menor de los datos.

2) Seleccione el Número de Intervalos de Clase (ni).- No debe ser menor de 5 y mayor de 12, ya que un número mayor o menor de clases podría oscurecer el comportamiento de los datos. Para calcular el número de intervalos se aplica la regla de Sturges:


Siendo n el tamaño de la muestra.
3) Calcule el Ancho del Intervalo (i).- Se obtiene dividiendo el Rango para el número de intervalos





Diagrama de cajas

Diagrama de Caja y Bigotes

Los diagramas de Caja-Bigotes  son una presentación visual que describe varias características importantes, al mismo tiempo, tales como la dispersión y simetría.

Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los datos, sobre un rectángulo, alineado horizontal o verticalmente.


  • ORDENAR LOS DATOS
  • CALCULO DE CUARTILES
  • DIBUJAR LA CAJA Y LOS BIGOTES
El bigote de la izquierda representa al colectivo de edades ( Xmín, Q1)
La primera parte de la caja a (Q1, Q2),
La segunda parte de la caja a (Q2, Q3) 
El bigote de la derecha viene dado por (Q3, Xmáx)



  • INFORMACIÓN DEL DIAGRAMA
Podemos obtener abundante información de una distribución a partir de estas representaciones. Veamos alguna: 
La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las edades comprendidas entre el 25% y el 50% de la población está más dispersa que entre el 50% y el 75%.
El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; por ello el 25% de los más jóvenes están más concentrados que el 25% de los mayores.
El rango intercuartílico = Q3 - Q1 


  Medidas de Forma

Comparan la forma que tiene la representación gráfica, bien sea el histograma o el diagrama de barras de la distribución, con la distribución normal.

MEDIDA DE A SIMETRÍA

Diremos que una distribución es simétrica cuando su mediana, su moda y su media aritmética coinciden.

Diremos que una distribución es asimétrica a la derecha si las frecuencias (absolutas o relativas) descienden más lentamente por la derecha que por la izquierda.

Si las frecuencias descienden más lentamente por la izquierda que por la derecha diremos que la distribución es asimétrica a la izquierda.

Existen varias medidas de la a simetría de una distribución de frecuencias. Una de ellas es el Coeficiente de A simetría de Pearson:


Su valor es cero cuando la distribución es simétrica, positivo cuando existe a simetría a la derecha y negativo cuando existe a simetría a la izquierda.


Medidas de Centralización

Viernes 11 de noviembre del 2016
 Medidas de Centralización

Nos dan un centro de la distribución de frecuencias, es un valor que se puede tomar como representativo de todos los datos. Hay diferentes modos para definir el "centro" de las observaciones en un conjunto de datos. Por orden de importancia, son:

 MEDIA : (media aritmética o simplemente media). es el promedio aritmético de las observaciones, es decir, el cociente entre la suma de todos los datos y el numero de ellos. Si xi es el valor de la variable y ni su frecuencia, tenemos que:




Si los datos están agrupados utilizamos las marcas de clase, es decir ci en vez de xi.


  MEDIANA (Me):es el valor que separa por la mitad las observaciones ordenadas de menor a mayor, de tal forma que el 50% de estas son menores que la mediana  y el otro 50% son mayores. Si el número de datos es impar la mediana será el valor central, si es par tomaremos como mediana la media aritmética de los dos valores centrales.





 MODA (M0): es el valor de la variable que más veces se repite, es decir, aquella cuya frecuencia absoluta es mayor. No tiene porque ser única.





 Medidas de Dispersión

Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersión nos dicen hasta que punto estas medidas de tendencia central son representativas como síntesis de la información. Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la distribución respecto al valor central. Distinguimos entre medidas de dispersión absolutas, que no son comparables entre diferentes muestras y las relativas que nos permitirán comparar varias muestras.


MEDIDAS DE DISPERSIÓN ABSOLUTAS

  VARIANZA ( s^2 ): es el promedio del cuadrado de las distancias entre cada observación y la media aritmética del conjunto de observaciones.

   


Haciendo operaciones en la fórmula anterior obtenemos otra fórmula para calcular la varianza:



Si los datos están agrupados utilizamos las marcas de clase en lugar de Xi.

 DESVIACIÓN TÍPICA (s): La varianza viene dada por las mismas unidades que la variable pero al cuadrado, para evitar este problema podemos usar como medida de dispersión la desviación típica que se define como la raíz cuadrada positiva de la varianza



Para estimar la desviación típica de una población a partir de los datos de una muestra se utiliza la fórmula (cuasi desviación típica):


RECORRIDO O RANGO MUESTRAL (Re). Es la diferencia entre el valor de las observaciones mayor y el menor.  Re = xmax - xmin



Resumen Estadístico


Miércoles 09 de noviembre del 2016

Diagrama de Puntos


Un diagrama de puntos es una gráfica utilizada para ilustrar un número reducido de datos, la cual permite identificar con facilidad dos características:
1.       La localización de los datos.
2.       La dispersión o variabilidad de los datos.
Este diagrama muestra cada uno de los elementos de un conjunto de datos numéricos por encima de una recta numérica (eje horizontal), facilita la ubicación de los espacios vacíos y los agrupamientos en un conjunto de datos, así como la manera en que estos datos se distribuyen a los largo del eje horizontal.


Cada diagrama tiene que tener:
  1. Titulo
  2. Numeración
  3. Titulo en los ejes
  4. Escalas adecuadas en los ejes
  5. Descripción gráfica
  6. Interpretación





Escalas de medición, Valores atipicos y Resumen Estadistico

Miércoles 26 de octubre del 2016
Escalas de medición


  • Escala nominal
 Una escala de medición es nominal si los datos son etiquetas o categorías que se usan para definir un atributo de un elemento. Los datos nominales pueden ser numéricos o no numéricos.

  • Escala ordinal
Una escala de medición es ordinal si los datos pueden usarse para jerarquizar u ordenar las observaciones. Los datos ordinales pueden ser numéricos o no numéricos
  • Escala de intervalo
Una escala de medición es de intervalo si los datos tienen las propiedades de los datos ordinales y los intervalos entre observaciones se expresan en términos de una unidad de medición fija. Los datos de intervalo tienen que ser numéricos.


  • Escala de razón
Una escala de medición es de razón si los datos tienen las propiedades
de los datos de intervalo y el cociente (o razón) entre dos medidas tiene sentido. Los datos de razón tienen que ser numéricos.

Valores atípicos o inusuales

Son observaciones cuyos valores son muy diferentes a las otras observaciones del mismo grupo de datos. Los datos atípicos son ocasionados por:

  • Errores de procedimiento.
  • Acontecimientos extraordinarios.
  • Causas no conocidas.
  • Valores extremos. Por ejemplo, una muestra de datos del número de cigarrillos consumidos a diario contiene el valor 60 porque hay un fumador que fuma sesenta cigarrillos al día.
Los datos atípicos distorsionan los resultados de los análisis, y por esta razón hay que identificarlas y tratarlos de manera adecuada, generalmente excluyéndolos del análisis.


Resumen Estadístico

  • Es una serie de cantidades calculadas para caracterizar la muestra.
  • Se pretende describir las características de los individuos de la muestra.
  • La media indica el centro de los datos.
  • La distribución  indica la distribución de los datos .

Estadistica

Viernes 14 de octubre del 2016
Muestreo

En la referencia estadística se conoce como muestreo a la técnica para la selección de una muestra a partir de una población estadística.

Al elegir una muestra aleatoria se espera conseguir que sus propiedades sean extrapolables a la población. Este proceso permite ahorrar recursos, y a la vez obtener resultados parecidos a los que se alcanzarían si se realizase un estudio de toda la población. En las investigaciones llevadas por empresarios y de la medicina se usa muestreo extensivamente en recoger información sobre poblaciones


  • Estadística Descriptiva o Deductiva


Es un proceso mediante el cual se recopila, organiza, presenta, analiza e interpreta datos de manera tal que describa fácil y rápidamente las características esenciales de dichos datos mediante el empleo de métodos gráficos, tabulares o numéricos, así por ejemplo:
Supóngase que un docente de Matemática calcula la calificación promedio de uno de sus cursos a su cargo. Como solo se está describiendo el desempeño del curso pero no hace ninguna generalización acerca de los diferentes cursos, en este caso el maestro está haciendo uso de la Estadística Descriptiva.


  • Estadística Inferencial o Inductiva


Llamada también inferencia estadística, la cual consiste en llegar a obtener conclusiones o generalizaciones que sobrepasan los límites de los conocimientos aportados por un conjunto de datos. Busca obtener información sobre la población basándose en el estudio de los datos de una muestra tomada a partir de ella, así por ejemplo:
Supóngase ahora que el docente de Matemática utiliza el promedio de calificaciones obtenidas por uno de sus cursos para estimar la calificación promedio de los 5 cursos a su cargo. Como se está realizando una generalización acerca los diferentes cursos, en este caso el maestro usa la Estadística.

Definiciones Básicas


  • Unidad muestral(individuo)
  • Muestra: Tamaño de la muestra
  • Población: También llamado universo


Tipos de datos

Numéricos


  • Discretos 
  • Continuos


Categóricos o Cualitativos


Indicaciones Generales

Miércoles 12 de octubre del 2016
En la introducción nos planteamos valores iniciales como:


Respeto
Responsabilidad
Solidaridad en este punto se enfatizo en los que es el compañerismo y la honestidad.



Evaluación:

La nota de cada bimestre se calculara en base a 10 puntos, de los cuales el examen equivale al 40%, las pruebas equivalen otro 40% y los deberes, portafolio estudiantil conforman el 20% restante.

Formato de deberes:

Se indico la forma mas adecuada de presentar un deber con un formato especifico que consta de un encabezado y un margen respectivo en cada pagina.