Distribución binomial y Distribución hipergeometrica

Distribución binomial
En estadística, la distribución binomial es una distribución de probabilidad discreta que cuenta el número de éxitos en una secuencia de n ensayos de Bernoulli independientes entre sí, con una probabilidad fija p de ocurrencia del éxito entre los ensayos. Un experimento de Bernoulli se caracteriza por ser dicotómico, esto es, solo dos resultados son posibles. A uno de estos se denomina y tiene una probabilidad de ocurrencia p y al otro, «fracaso», con una probabilidad q = 1 - p. En la distribución binomial el anterior experimento se repite n veces, de forma independiente, y se trata de calcular la probabilidad de un determinado número de éxitos. Para n = 1, la binomial se convierte, de hecho, en una distribución de Bernoulli.

Para representar que una variable aleatoria X sigue una distribución binomial de parámetros n y p, se escribe:

X\sim B(n,p)\,

La distribución binomial es la base del test binomial de significación estadística.

Su función de probabilidad es

\!f(x)={n \choose x}p^{x}(1-p)^{n-x},\,\,\,\,0\leq p\leq 1

donde

x=\{0,1,2,\dots ,n\},

siendo

\!{n \choose x}={\frac {n!}{x!(n-x)!}}\,\!

las combinaciones de

n\,\!

x\,\!

(

x\,\!

elementos tomados de

n\,\!

x\,\!

)

Distribución hipergeométrica

La distribución hipergeométrica es una distribución discreta que modela el número de eventos en una muestra de tamaño fijo cuando usted conoce el número total de elementos en la población de la cual proviene la muestra. Cada elemento de la muestra tiene dos resultados posibles (es un evento o un no evento). Las muestras no tienen reemplazo, por lo que cada elemento de la muestra es diferente. Cuando se elige un elemento de la población, no se puede volver a elegir. Por lo tanto, la probabilidad de que un elemento sea seleccionado aumenta con cada ensayo, presuponiendo que aún no haya sido seleccionado.

Utilice la distribución hipergeométrica para muestras obtenidas de poblaciones relativamente pequeñas, sin reemplazo. Por ejemplo, la distribución hipergeométrica se utiliza en la prueba exacta de Fisher para probar la diferencia entre dos proporciones y en muestreos de aceptación por atributos cuando se toman muestras de un lote aislado de tamaño finito.

La distribución hipergeométrica se define por 3 parámetros: tamaño de la población, conteo de eventos en la población y tamaño de la muestra.

La función de probabilidad de una variable aleatoria con distribución hipergeométrica puede deducirse a través de razonamientos combinatorios y es igual a

P(X=x)={\frac {{d \choose x}{N-d \choose n-x}}{N \choose n}},

donde

N

es el tamaño de población,

n

es el tamaño de la muestra extraída,

d

es el número de elementos en la población original que pertenecen a la categoría deseada y

x

es el número de elementos en la muestra que pertenecen a dicha categoría. La notación

{a \choose x}

hace referencia al coeficiente binomial, es decir, el número de combinaciones posibles al seleccionar

x

elementos de un total

a

El valor esperado de una variable aleatoria X que sigue la distribución hipergeométrica es

E[X]={\frac {nd}{N}}

y su varianza,

Var[X]={\bigg (}{\frac {N-n}{N-1}}{\bigg )}{\bigg (}{\frac {nd}{N}}{\bigg )}{\bigg (}1-{\frac {d}{N}}{\bigg )}.

En la fórmula anterior, definiendo

p={\frac {d}{N}}

q=1-p\,,

se obtiene

Var[X]=npq{\frac {N-n}{N-1}}.

La distribución hipergeométrica es aplicable a muestreos sin reemplazo y la binomial a muestreos con reemplazo. En situaciones en las que el número esperado de repeticiones en el muestreo es presumiblemente bajo, puede aproximarse la primera por la segunda. Esto es así cuando N es grande y el tamaño relativo de la muestra extraída, n/N, es pequeño.

Distribucion de probabilidad de variables aleatorias discretas y continuas

En teoría de la probabilidad y estadística, la distribución de probabilidad de una variable aleatoria es una función que asigna a cada suceso definido sobre la variable la probabilidad de que dicho suceso ocurra. La distribución de probabilidad está definida sobre el conjunto de todos los sucesos y cada uno de los sucesos es el rango de valores de la variable aleatoria. También puede decirse que tiene una relación estrecha con las distribuciones de frecuencia. De hecho, una distribución de probabilidades puede comprenderse como una frecuencia teórica, ya que describe cómo se espera que varíen los resultados.

La distribución de probabilidad está completamente especificada por la función de distribución, cuyo valor en cada x real es la probabilidad de que la variable aleatoria sea menor o igual que x.

Existen 3 tipos de variables

Variable aleatoria: Es aquella cuyo valor es el resultado de un evento aleatorio. Lo que quiere decir que son los resultados que se presentan al azar en cualquier evento o experimento.
Variable aleatoria discreta: Es aquella que solo toma ciertos valores (frecuentemente enteros) y que resulta principalmente del conteo realizado.
Variable aleatoria continua: Es aquella que resulta generalmente de la medición y puede tomar cualquier valor dentro de un intervalo dado.

Dada una variable aleatoria

\scriptstyle X

, su función de distribución,

\scriptstyle F_{X}(x)

, es

$F_{X}(x)=\mathrm {Prob} (X\leq x)=\mu _{P}\{\omega \in \Omega |X(\omega )\leq x\}$

Por simplicidad, cuando no hay lugar a confusión, suele omitirse el subíndice

\scriptstyle X

y se escribe, simplemente,

\scriptstyle F(x)

. Donde en la fórmula anterior:

\mathrm {Prob} \,

, es la probabilidad definida sobre un espacio de probabilidad y una medida unitaria sobre el espacio muestral.

\mu _{P}\,

es la medida sobre la σ-álgebra de conjuntos asociada al espacio de probabilidad.

\Omega \,

es el espacio muestral, o conjunto de todos los posibles sucesos aleatorios, sobre el que se define el espacio de probabilidad en cuestión.

X:\Omega \to \mathbb {R}

es la variable aleatoria en cuestión, es decir, una función definida sobre el espacio muestral a los números reales.

MAPA

Esperanza matemática

La esperanza matemática, también llamada valor esperado, es igual al sumatorio de las probabilidades de que exista un suceso aleatorio, multiplicado por el valor del suceso aleatorio. O, dicho de otra forma, el valor medio de un conjunto de datos. Teniendo en cuenta, eso sí, que el término esperanza matemática está acuñado por la teoría de la probabilidad. Mientras que en matemáticas, se denomina media matemática al valor promedio de un suceso que ha ocurrido. En distribuciones discretas con la misma probabilidad en cada suceso la media aritmética es igual que la esperanza matemática.

La esperanza matemática se calcula utilizando la probabilidad de cada suceso. La fórmula que formaliza este cálculo se enuncia como sigue:

Dónde x es el valor del suceso, P la probabilidad de que ocurra, i el periodo en el que se da dicho suceso y N el número total de periodos u observaciones.

No siempre la probabilidad de que ocurra un suceso es la misma, como con las monedas. Existen infinidad de casos en que un suceso tiene más probabilidad de salir que otro. Por eso utilizamos en la fórmula la P. Además, al calcular número matemáticos debemos multiplicar por el valor del suceso.

La esperanza matemática se utiliza en todas aquellas disciplinas en las que la presencia de sucesos probabilísticos es inherente a las mismas. Disciplinas tales como, la estadística teórica, la física cuántica, la econometría, la biología o los mercados financieros. Una gran cantidad de procesos y sucesos que ocurren en el mundo son inexactos. Un ejemplo claro y fácil de entender, es el de la bolsa de valores.

Distribución normal

En estadística y probabilidad se llama distribución normal, distribución de Gauss, distribución gaussiana o distribución de Laplace-Gauss, a una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece en estadística y en la teoría de probabilidades.

La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto de un determinado parámetro estadístico. Esta curva se conoce como campana de Gauss y es el gráfico de una función gaussiana.

La importancia de esta distribución radica en que permite modelar numerosos fenómenos naturales, sociales y psicológicos. Mientras que los mecanismos que subyacen a gran parte de este tipo de fenómenos son desconocidos, por la enorme cantidad de variables incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada observación se obtiene como la suma de unas pocas causas independientes.

De hecho, la estadística descriptiva sólo permite describir un fenómeno, sin explicación alguna. Para la explicación causal es preciso el diseño experimental, de ahí que al uso de la estadística en psicología y sociología sea conocido como método correlacional.

La distribución normal también es importante por su relación con la estimación por mínimos cuadrados, uno de los métodos de estimación más simples y antiguos.

La distribución normal también aparece en muchas áreas de la propia estadística. Por ejemplo, la distribución muestral de las medias muestrales es aproximadamente normal, cuando la distribución de la población de la cual se extrae la muestra no es normal. Además, la distribución normal maximiza la entropía entre todas las distribuciones con media y varianza conocidas, lo cual la convierte en la elección natural de la distribución subyacente a una lista de datos resumidos en términos de media muestral y varianza. La distribución normal es la más extendida en estadística y muchos tests estadísticos están basados en una "normalidad" más o menos justificada de la variable aleatoria bajo estudio.

En probabilidad, la distribución normal aparece como el límite de varias distribuciones de probabilidad continuas y discretas.

Parámetros	$\mu \in \mathbb {R} \,\!$ $\sigma >0\,\!$
Dominio	$x\in \mathbb {R} \,\!$
Función de densidad (pdf)	${\frac {1}{\sigma {\sqrt {2\pi }}}}\;e^{-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}}\,\!$
Función de distribución (cdf)	${\frac {1}{2}}\left[1+\operatorname {erf} \left({\frac {x-\mu }{\sigma {\sqrt {2}}}}\right)\right]$
Media	$\mu \,\!$
Mediana	$\mu \,\!$
Moda	$\mu \,\!$
Varianza	$\sigma ^{2}\,\!$
Coeficiente de simetría	0
Curtosis	0
Entropía	$\ln \left(\sigma {\sqrt {2\,\pi \,e}}\right)\,\!$
Función generadora de momentos (mgf)	$M_{X}(t)=e^{\mu \,t+{\frac {\sigma ^{2}t^{2}}{2}}}\,\!$
Función característica	$\chi _{X}(t)=e^{\mu \,i\,t-{\frac {\sigma ^{2}t^{2}}{2}}}\,\!$