3.1- ¿Qué es una probabilidad y para que nos sirve?
Se podría pensar cual es la necesidad de revisar las probabilidades, si estamos desarrollando una introducción al análisis de los datos. Pues precisamente, necesitamos entender que son y como se aplican para poder tomar decisiones. Con los datos que obtenemos, al transformarlos en información podemos encontrar explicaciones a situaciones de la finca que nos generan ineficiencias técnicas o económicas y de igual manera podemos ser realistas en cuanto a las expectativas en los proyectos que emprendamos para solucionarlas. Por eso las probabilidades son una perfecta introducción al análisis de datos.
Podríamos definir una probabilidad como la medición de la posibilidad de
que un evento ocurra en una situación cuyo resultado no se puede
predecir hasta que sea observado (experimento aleatorio). La
probabilidad se cuantifica como un número entre 0 y 1, donde 0 indica
imposibilidad y 1 certitud
(Radke, 2017). Un ejemplo típico sería el sexo al nacer (XX o XY). En teoría la
probabilidad debería ser 50% de que nazca macho y 50% de que sea hembra
(enc condiciones naturales). El clásico ejemplo de una probabilidad es
al tirar al aire una moneda cuales son las probabilidades de obtener
cara o sello. Entonces otra manera de definir la probabilidad es un
cálculo matemático que evalúa las posibilidades de que una cosa suceda
cuando interviene el azar
(Molina, 2021).
Conocer de probabilidades nos ayuda a entender cuales son las reales posibilidades de que un evento suceda de una manera calculada y evitar o reducir el riesgo. Por ejemplo, suponga que se desea analizar si debe cambiar el técnico inseminador de sus vacas, para ello uno de los criterios mas importantes seria calcular el porcentaje de éxito del técnico actual (animales preñados/animales inseminados) frente a los posibles candidatos. Además habria que ver el valor adicional que se estaría dispuesto a pagar por los servicios del nuevo técnico. Si el técnico A tiene un record del 60%, el B tiene un record del 58% y el C del 65% seria fácil escoger el C. Sin embargo, hay que tener aquí en cuenta otros factores, como las instalaciones de la finca, la calidad del semen utilizado y la condición de las vacas entre otras. Recapitulando entonces, la probabilidad es medir la posibilidad de que un evento ocurra. Para el evento aún no conocemos el resultado, pero basados en la información previa podemos determinar cual es la posibilidad real que tenemos de obtener el resultado esperado.
La fórmula general de la probabilidad es:
Donde la probabilidad de que ocurra el evento X es igual al número de veces en que ocurrió el evento que esperábamos (X) sobre el total de veces en que se intentó el ensayo o experimento (espacio muestral).
- Ensayo: observar la ocurrencia del evento y registrar el
resultado. Por ejemplo el nacimiento de una ternera y registrarlo o
registrar en una incubadora la cantidad de pollitos machos y hembras
nacidos en el mismo lote.
- Experimento: es un grupo de uno o múltiples ensayos. Por
ejemplo, registrar el sexo de los terneros en 1000 nacimientos.
Recordemos que el experimento es aleatorio porque no podemos predecir el
resultado hasta tanto no es observado.
- Probabilidad experimental: la probabilidad que asignamos a un evento
basados en el experimento conducido. Ejemplo, luego de haber registrado el
sexo de 1000 terneros al nacer, basados en los resultados esperamos que haya
un 50.4% de posibilidades de que sea hembra.
- Valor esperado: el resultado especificado que esperamos cuando conducimos
un experimento. En este caso el valor esperado del experimento será el número
de hembras o machos que esperamos después de 1000 nacimientos.
- El espacio muestral es la cantidad de posibles resultados de un
experimento aleatorio. Es decir, la cantidad de veces en que corremos el
experimento.
Dos eventos son independientes si el resultado del segundo evento NO es afectado por el resultado del primer evento y viceversa. Si A y B son eventos independientes, la probabilidad de que el evento ocurra es el producto (multiplicación) de la probabilidad de cada evento individual. Donde la probabilidad de A no es igual a 0 y la probabilidad de B no es igual a 0.
Función de dos eventos independientes
Donde la probabilidad de A dado B es igual a la probabilidad de A
y la probabilidad de B dado A es igual a la probabilidad de B
Para entender un poco mas las probabilidades independientes, vamos a desarrollar un ejemplo. Supongamos que tenemos dos corrales completamente separados y en cada corral hay cuatro vacas cada una de diferente color (blanca, negra, pintada, parda). Si vamos a seleccionar un animal de cada corral ¿Cual es la posibilidad de que salgan un animal blanco del corral A y un animal blanco del corral B?
Fórmula para calcular la probabilidad de dos eventos independientes
Probabilidad de sacar un animal blanco del corral A y un animal blanco del corral B
Donde la probabilidad de A y B es igual a la probabilidad de A multiplicada por la probabilidad de B
Probabilidad de sacar un animal blanco del corral A y un animal blanco del corral B
Donde la probabilidad de A y B es igual a la probabilidad de A multiplicada por la probabilidad de B
1 of 2
En este caso el espacio muestral es 16, pues hay un total de 16 combinaciones posibles. Sin embargo, si vemos el cuadro la posibilidad de que en cada corral sea seleccionada la ternera blanca al tiempo, es 1 en 16 (cuadro verde). En otras palabras la probabilidad de sacar una novilla blanca del corral 1 es 1/4 y del corral dos igualmente 1/4 entonces la probabilidad de que de ambos corrales se escoja un animal blanco es 1/4 * 1/4 = 1/16
También nos puede interesar cuál es posibilidad de que el animal elegido del corral A sea de color blanco blanco, mientras que del segundo corral el animal elegido sea de cualquier color?
Como vemos el espacio muestral es 16, si observamos el recuadro superior podemos deducir que la posibilidad de que el animal elegido en el primer corral sea blanco y el del segundo corral sea de cualquier color es 1/4 (espacios en azul). Matematicamente esto está dado por 1/4 para un animal blanco en el primer corral y 4/4 para el corral dos, por tanto tendremos (1/4)*(4/4) = 4/16, es decir la probabilidad de A y B será de 1/4
¿que posibilidad de que los animales elegidos en ambos corrales sean de cualquier color diferente al blanco?
Si contamos las celdas amarillas del cuadro, podemos deducir que La probabilidad de escoger un animal de cualquier color diferente al blanco en ambos corrales es de 9/16. Entonces para cada corral la probabilidad de no seleccionar blanco es 3/4, por tanto tendremos (3/4)*(3/4) = 9/16, es decir la probabilidad de A y B será de 9/16.
Dos eventos son dependientes si el resultado del primer evento afecta la probabilidad del segundo evento así que la probabilidad cambia. Sin embargo al igual que en las probabilidades independientes, la probabilidad de que ambos eventos ocurran es el producto de las probabilidades de los eventos individuales.
Por ejemplo, estamos trabajando en otro corral y tenemos 10 novillas, 6 blancas y 4 negras. ¿Si la primera novilla en salir es negra, cual es la probabilidad de que la segunda novilla sea blanca? La probabilidad de que la primera novilla sea negra era 4/10 (cuatro novillas negras de un total de 10 novillas). Sin embargo, para el segundo animal ya las probabilidades han cambiado pues no tenemos 10 sino 9 animales en total, por tanto, el segundo evento es dependiente del primero. Como la primera novilla fue negra, todas las novillas blancas aun se encuentran en el corral, pero tenemos una novilla menos en total, entonces, la probabilidad de que la segunda novilla sea blanca es 6/9 o seis novillas blancas de un total de 9 novillas restantes
Resumen de probabilidades independientes y dependientes
Ejemplo de una distribución de Poisson en Excel
Como vemos entonces al multiplicar la probabilidad de que salga una
novilla negra de primera y luego una novilla blanca será del 26%.
Las permutaciones hacen referencia al número total de las diferentes
posibles maneras en que podemos organizar un determinado número de
elementos. Las permutaciones siempre se representan por los números
factoriales.
En las permutaciones SI importa el orden ya que el intercambio entre
dos elementos distintos genera una nueva permutación. En las
permutaciones NO se repiten los elementos, ya que de repetirse o ser
iguales entre si, no se genera una nueva permutación.
En las permutaciones simpre tenemos igual número de espacios para igual número
de elementos.
La fórmula para representar las permutaciones es:
Pn = n!
Donde la probabilidad de n esta dado por el n factorial. Por ejemplo, Tenemos 5 pesebreras y 5 caballos, de cuantas maneras posibles podemos organizar los caballos en el establo?. Tenemos que acomodar un caballo por pesebrera (no hay repeticiones).
Entonces, existen 120 posibles maneras de organizar los caballos en los establos. Es importante tener en cuenta que en las permutaciones todos los elementos están organizados en el mismo espacio y que no existen repeticiones (no se puede acomodar el mismo animal en dos pesebreras al mismo tiempo). Entonces en la permutación estamos organizando un numero n de elementos en un determinado numero de espacios y ni los elementos, ni los espacios son repetibles. En las permutaciones se organizan todos los elementos que hay disponibles.
Las variaciones representan el numero de las diferentes posibles maneras en que se pueden seleccionar un p número de elementos que pertenecen a un grupo n. En las variaciones ordinarias a diferencia de las permutaciones, no entran todos los elementos, solo se selecciona un p número de un total n. Si importa el orden y no hay repetición del mismo elemento (la vaca no vuelve al corral), aunque también existe un tipo de variaciones con repetición como veremos mas adelante.
3.6.1- Variaciones sin repeticiones
Se da cuando tenemos determinado número de elementos n y un número
limitado de posiciones p para asignar.
Ojo en este caso no puede haber repeticiones. Por ejemplo tenemos
3 elementos A, B y C y deseamos seleccionar solamente 2, de cuantas maneras
podremos seleccionar solo dos de los tres elementos disponibles?.
Las combinaciones que serían posibles son: AB AC BA BC CA CB es decir tenemos
seis posibles maneras de combinar dos extracciones (n) de tres posibles diferentes
elementos (M).
Fórmula general de las variaciones sin repecicion es:
Variaciones para dos posiciones con tres elementos sin repetición
Variaciones sin repeticiones
Variaciones para dos posiciones con tres elementos sin repetición
Variaciones sin repeticiones
1 of 2
Donde V son las variaciones, n es el numero total de elementos en el espacio muestral y p es el número de elementos que necesitamos disponibles a seleccionar. Entonces para extraer el primer elemento tenemos 3 opciones (n), mientras que para el segundo elemento las opciones se reducen a 2 (n-1) porque no podemos repetir la unidad con la cual iniciamos. Tenemos cada vez menos opciones por cada elemento adicional.
Ejemplo: Deseamos escoger 4 novillas de 10 disponibles para una exhibición. Los diez animales tienen características fenotípicas y genotípicas muy similares entre ellas, razón por la que la selección se hace difícil. Entonces, cuantas son las posibles variaciones que tenemos, seleccionando solo 4 (p) de las 10 (n)? Como es una exhibición, el orden de selección es importante.
Entonces, tendremos 5039 diferentes maneras de seleccionar los 4 animales dentro de los 10 disponibles, esto siempre y cuando el orden asignado sea de importancia.
3.6.2- Variaciones con repeticiones
En las variaciones con repetición, tenemos diferentes agrupaciones con n elementos que pueden repetirse, es decir tenemos n opciones para el primer elemento p, y para el segundo elemento p también tenemos n opciones (a diferencia de n-1) y asi para cada elemento que se necesite organizar. A nivel de producción podemos pensar en la asginación de los registros a los animales. Si tenemos los 10 dígitos del 0 al 9 y queremos asignar 6 digitos por animal registrado, hasta cuantas combinaciones podremos tener?
Fórmula general para las variaciones con repeticion
Donde V representa las variaciones con repetición, n es el número de
elementos disponibles y p es el numero de elementos que estamos
organizando. Entonces en este caso n serian los 10 dígitos del 0 al 9 y
p serían los 6 dígitos a seleccionar. Entonces tendremos 106 =
1'000.000 de variaciones. Para el efecto de los registros no importa que
los números se repitan, es decir podemos tener un registro 111111 y es perfectamente
válido por eso utilizamos la formula con repetición, mientras que con animales
por ejemplo, no podemos utilizar la repetición como en el ejemplo anterior.
Las
combinaciones representan el numero de diferentes maneras posibles
como se pueden escoger un numero de elementos. En las combinaciones el orden de selección no es importante a
diferencia de las variaciones y no es posible la repetición (es igual
seleccionar ABC que CBA o BAC).
Fórmula general de las combinaciones
Donde C son las combinaciones, n es el numero total de elementos en el espacio muestral y p ese es el numero de elementos que necesitamos seleccionar.
Si se van a seleccionar 4 novillas de las 10 disponibles para la feria
de exhibición, siguiendo el ejemplo que hicimos en la sección devariaciones sin repetición pero en este caso el orden no es importante, entonces cuantas posibles
combinaciones existen?.
Entonces despejando la fórmula, tendriamos un total de 210 combinaciones diferentes para seleccionar las 4 novillas. Un número inferior si comparamos con las 5039 variaciones cuando importa la posición.
3.7.1- Combinaciones con espacios muestrales diferentes
Este tipo de combinaciones representa el numero de diferentes posibles combinaciones en que podemos escoger un determinado numero de elementos de dos o mas espacios muestrales. Ejemplo, si continuamos con nuestro ejemplo de los registros, donde encontramos 1'000.000 de posibles variaciones, que pasa si decidimos agregar 3 letras seleccionadas entre la A hasta la J (10 letras)?.
Que son las combinaciones
Fórmula para combinaciones con espacios muestrales diferentes
Donde C representa las combinaciones, n1 es el tamaño del primer espacio muestral, n2 es el segundo espacio muestral etc. Es importante que la opción que escogemos en un espacion muestral no afecta el numero de opciones de los otros espacios. El orden en el que escogemos el elemento individual es arbitrario y necesitamos conocer el tamaño del espacio muestral para cada elemento individual
Entonces despejando la fórmula para continuar con nuestro ejemplo de
registos con números y letras, la primera parte es 106 * 103 = 109 posibles combinaciones. Si no necesitamos tantos registros,
creo que deberiamos considerar reducir el número de cifras en el primer espacio
muestral!.