Sobre variables en estadística

Variable aleatoria: característica de interés asociada a cada uno de los elementos de la población o muestra considerada. Ejemplos: (a) la edad de cada estudiante; (b) el número de visitas diarias que recibe cada periódico en línea; (c) el factor de impacto de cada revista, etc.

Variable cualitativa o categórica: variable que categoriza o describe cualitativamente un elemento de la población. Suele ser de tipo alfanumérico, pero incluso en el caso en que sea numérica no tiene sentido usarla en operaciones aritméticas. Ejemplos: (a) el teléfono o el correo electrónico de un estudiante; (b) la dirección IP de un periódico en línea; (c) el ISSN de una revista, etc.

(más…)

Continuando sobre estadística

Para su estudio, la estadística se divide en: Estadística Descriptiva e Inferencia Estadística.

La Primera se encarga de la recopilación, organización, resumen y presentación de los datos numéricos obtenidos de la observación de un fenómeno; mientras que la Segunda tiene por objeto, obtener conclusiones probables sobre el comportamiento general del fenómeno, a partir de algunas observaciones particulares del mismo.

(más…)

Ejercicios de Distribución de Poisson

Ejercicio 1

El recuento de leucocitos de un individuo sano puede presentar en promedio un valor mínimo de hasta 6000 por mm3 de sangre. Para detectar una deficiencia de leucocitos, se toma una gota de sangre de 0.001 mm3 y se halla el número X de leucocitos.
¿Cuántos leucocitos cabe esperar en un individuo sano? Si a lo sumo se encuentran dos, ¿hay signos de una deficiencia de leucocitos? Este experimento puede considerarse un proceso de Poisson. El suceso discreto de interés es encontrar un leucocito, el intervalo continuo es una gota de sangre. Sea el mm3 la unidad de medida; así, s = 0.001 y λ, la media de veces que tendremos un suceso por cada unidad, es 6000. Por lo tanto, X es una variable aleatoria de Poisson con P[X] = λ = 6000(0.001) = 6. Para una persona con buena salud, esperaríamos observar un promedio de, por lo menos, seis leucocitos. ¿Sería extraño encontrar dos células como máximo? ¿Lo expresaremos por P[ X ≤ 2 | λ = 6 ] ? R= 0.062


Ejercicio 2

En el estudio del sueño en los seres humanos se reconocen cinco fases (somnolencia, ligero, intermedio, profundo, REM) por medio del electroencefalograma. El sueño intermedio se caracteriza por la presencia de ondas de gran amplitud, que aparecen en un promedio de alrededor de dos ondas por segundo.

  • ¿Cuál es la probabilidad de que, durante un sueño intermedio, no se presente ninguna de estas ondas durante un período de cinco segundos?
  • ¿Cuál es la probabilidad de que aparezca un máximo de 15 de tales
  • ondas en un período de cinco segundos?
  • Si aparecieran 20 ó más de tales ondas durante un período de cinco segundos, ¿podría sospecharse que el sujeto no está en la etapa de sueño intermedio? Razonar sobre la base de la probabilidad implícita.

Instrucciones de entrega

Resolver en cualquier medio que les sea más cómodo(cuaderno, hoja blanca, word, excel, etc), en caso de hacerlo físicamente en hojas blancas o cuaderno, fotografiar o escanear.

Una vez resueltos los ejercicios, crear una carpeta con sus datos y comprimirla en rar o zip. P. ej.

Enviar al correo lsaucedoh@utrng.edu.mx

Ejercicios de Distribución Binomial

Ejercicio 1

Se va a construir una planta nuclear y se quiere conocer la opinión de los vecinos de la localidad. Se selecciona una muestra aleatoria de 20 individuos y se realiza un sondeo. Se piensa que el 60 % de los habitantes del lugar estará a favor del proyecto. Si esto es verdad, ¿cuántos piensa usted que expresarían una opinión favorable? Si sólo nueve o menos son de tal opinión, ¿piensa usted que es razón de peso para poner en duda la cifra 60 %? Explicarlo sobre la base de la probabilidad implícita.


Ejercicio 2

Para estudiar la regulación hormonal de una línea metabólica, se inyecta a ratas albinas un fármaco que inhibe la síntesis de proteínas del organismo. En general, 4 de cada 20 ratas mueren a causa del fármaco antes de que el experimento haya concluido. Si se trata a 10 animales con el fármaco, ¿cuál es la probabilidad de que al menos 8 lleguen vivos al final del experimento?


Instrucciones de entrega

Resolver en cualquier medio que les sea más cómodo(cuaderno, hoja blanca, word, excel, etc), en caso de hacerlo físicamente en hojas blancas o cuaderno, fotografiar o escanear.

Una vez resueltos los ejercicios, crear una carpeta con sus datos y comprimirla en rar o zip. P. ej.

Enviar al correo lsaucedoh@utrng.edu.mx

Ejercicios del Teorema de Bayes

Ejercicio 1.

Supongamos que en una determinada población se conoce de antemano que el 5% padecen diabetes tipo II. A través de una muestra, en la cual la mitad de los pacientes eran diabéticos y la otra mitad no, se estimó mediante la tabla de contingencia que la proporción de hipertensos era de un 60% entre los diabéticos y de un 15% entre los no diabéticos. Comprobar los resultados propuestos:

  • (a) Estima la proporción de hipertensos en la población. R = 37.5%
  • (b) Estima también la proporción de hipertensos que son diabéticos. R= 30%
  • (c) Estima la proporción de diabéticos entre los hipertensos y compárala con la proporción de diabéticos entre los no hipertensos. R = 30% vs 20% o 6 de cada 10 diabéticos son Hipertensos
  • (d) Representa las cuatro posibilidades del estudio mediante un diagrama de Venn.

Ejercicio 2.

Se cree que la distribución de los grupos sanguíneos en Estados Unidos en
la Segunda Guerra Mundial era: tipo A, 41 %; tipo B, 9 %; tipo AB, 4 %; y tipo 0,46 %. Se estima que en esa época, el 4 % de las personas pertenecientes al tipo 0 fue clasificado como del tipo A; el 88 % de los del tipo A fue correctamente clasificado; el 4 % de los del tipo B se clasificó como del tipo A, y el 10 % de los del tipo AB fue, igualmente, clasificado como del tipo A. Un soldado fue herido y conducido a la enfermería. Se le clasificó como del tipo A. ¿Cuál es la probabilidad de que tal grupo sea ciertamente el suyo?

A1: Es del tipo A.
A2: Es del tipo B.
A3: Es del tipo AB.
A4: Es del tipo 0.
B: Es clasificado como del tipo A.

Trayectorias de Probabilidades

Ejercicio 3

Las estadísticas indican que en Estados Unidos la probabilidad de que una madre muera durante el parto es 0.00022. Si no es de raza negra, la probabilidad de muerte es 0.00017, mientras que si lo es, esta probabilidad aumenta a 0.00064. Supongamos que el 10 % de los partos corresponde a mujeres negras.

  • Dibujar un diagrama de árbol describiendo las probabilidades dadas, y hallar las probabilidades correspondientes a las trayectorias en cada uno de los cuatro casos. (Sea D el suceso que denota que la madre muere y B el que alude a que es de raza negra.)
  • Utilizar el árbol del inciso a) para calcular la probabilidad de que una madre que muere en el parto sea de raza negra.
  • Haciendo uso del teorema de Bayes, hallar la probabilidad de que una madre que muere en el parto sea de raza negra, y comparar el resultado con el obtenido en el inciso b).

Ejercicio 4

Un test diseñado para diagnosticar el cáncer de cuello uterino tiene un coeficiente de falsos negativos y falsos positivos de 0.05, cada uno. De una cierta población de mujeres, el 4 % está afectado por este tipo de cáncer. ¿Cuál es la probabilidad de que una mujer de la población elegida aleatoriamente tenga cáncer de cuello uterino, dado que su resultado
con el test es positivo?


Instrucciones de entrega

Resolver en cualquier medio que les sea más cómodo(cuaderno, hoja blanca, word, excel, etc), en caso de hacerlo físicamente en hojas blancas o cuaderno, fotografiar o escanear.

Una vez resueltos los ejercicios, crear una carpeta con sus datos y comprimirla en rar o zip. P. ej.

Enviar al correo lsaucedoh@utrng.edu.mx

Distribución de Poissón

Es una distribución de variable discreta, Los sucesos son independientes y ocurren durante un intervalo de tiempo dado ( segundos , minutos , horas, etc) o en una región específica

Ejemplos

  • El número de coches que pasan a través de un cierto punto en una carretera
  • El número de errores de ortografía que uno comete al escribir en una página
  • El número de llamadas telefónicas en una central telefónica por minuto ( día , hora, etc)
  • El número de enfermos que llegan por hora (Día , mes) a un hospital
  • El número de clientes que llegan a una oficina por hora (Día , semana)
  • El número de defectos por metro cuadrado de tela.
  • El número de estrellas en un determinado volumen de espacio.
(más…)

Teorema de Bayes

El teorema de Bayes es utilizado para calcular la probabilidad de un suceso, teniendo información de antemano sobre ese suceso.

Si A1, A2, … , Anson:

Sucesos incompatibles 2 a 2.

Y cuya unión es el espacio muestral (A 1 ∪ A 2 ∪… ∪ A n = E).

Y B es otro suceso.

Resulta que:

Para calcular la probabilidad tal como la definió Bayes en este tipo de sucesos, necesitamos una fórmula. La fórmula se define matemáticamente como:


Donde B es el suceso sobre el que tenemos información previa y A(n) son los distintos sucesos condicionados. En la parte del numerador tenemos la probabilidad condicionada, y en la parte de abajo la probabilidad total. En cualquier caso, aunque la fórmula parezca un poco abstracta, es muy sencilla

o



Las probabilidades p(A1) se denominan probabilidades a priori.
Las probabilidades p(Ai/B) se denominan probabilidades a posteriori.
Las probabilidades p(B/Ai) se denominan verosimilitudes.

(más…)

Distribución Binomial

Un experimento sigue el modelo de la distribución binomial o de Bernoulli si:

1. En cada prueba del experimento sólo son posibles dos resultados: el suceso A (éxito) y su contrario

2. La probabilidad del suceso A es constante, es decir, que no varía de una prueba a otra. Se representa por p.

(más…)

Ejercicios

Ejercicio 1

Sea una distribución estadística que viene dada por la siguiente tabla, Noten que la muestra es de n=100:

xvariablefabsolutaFAcumulada
61 5 5
641823
674265
712792
738100
(más…)

Intervalo de Confianza

Ya sabemos que los valores típicos estudiados anteriormente constituyen estimaciones o aproximaciones de los correspondientes parámetros poblacionales, que serán más certeros cuanto mayor sea la muestra.

No obstante, suponiendo que la muestra sea aleatoria, estamos en condiciones de acotar el error con un cierto grado de confianza, es
decir, de aportar un intervalo en el cual esperamos que se encuentre el valor desconocido del parámetro poblacional.

Intervalo de confianza para la media: el intervalo al 95% de confianza para la media poblacional µ de una variable numérica a partir de una muestra de tamaño n con media y desviación típica s es, según

Así pues, el margen máximo de error de la estimación con una confianza del 95% es:

(más…)

Calificaciones UTRNG

Links de Descargas

cdlibre.org
- Página de Software Libre
PixaBay
- Imágenes libres de alta calidad
DistroWatch
- Todas las ditribuciones de Linux
Python
IDLE de Python
LinuxMint
- Ditribución de Linux altamente recomendable
YUMI
- Creador de USB Booting
Code Blocks
- Para programar con C/C++
-

Links Interesantes

Pilar Baselga
- Blog "No morir idiota". Investigaciones de interés general
-