6- Pruebas de hipótesis e intervalos

Vet Análisis Datos

6.1- Pruebas de hipótesis


Una vez que los datos están limpios y listos para ser explorados, el principal objetivo es transformarlos en información útil y para ellos debemos formularnos preguntas que nos den las pautas de acción. Entonces, es conveniente recordar algunos términos estadísticos. Una vez que nos hemos hecho una pregunta clave, debemos formular una hipótesis que nos ayude a responder la pregunta. Entonces podemos decir que la hipótesis es una suposición o una explicación propuesta hecha sobre la base de evidencia limitada como punto de partida para posterior investigación (Pfaffenberger, R.C. and Patterson, J.H., 1977). Es decir, no sabemos aún el resultado o la respuesta final pero con la hipótesis buscamos dar los primeros pasos para encontrar la respuesta.
Para poder hablar de las hipótesis primero debemos recordar el método científico. Este consiste en la observación sistemática, medición, experimentación y la formulación, prueba y modificación de una Hipótesis. En este caso vamos a utilizar los datos recogidos dentro y fuera de la finca para poder comprobar hipótesis y tomar decisiones.

Los pasos en el proceso de comprobación de una Hipótesis son:(Minitab® software estadístico):


  • 1. Formulación de una Hipótesis
  • 2. Elegir el nivel de significancia
  • 3. Encontrar la prueba adecuada
  • 4. Ejecutar la prueba
  • 5. Comparar el valor de P con el nivel de significancia
  • 6. Tomar la decisión de aceptar o rechazar la hipótesis nula

Cuando se formula una hipótesis siempre tenemos dos postulados:

Hipótesis Nula (H0): es la hipótesis para comprobar. Es el estato-quo. Es todo lo que ha sido creído hasta ahora y lo que estamos desafiando con nuestra prueba. Básicamente es lo que se ha creído y así se mantendrá hasta que no tengamos las sufientes pruebas para demostrar lo contrario.
Hipótesis Alterna (H1): es el cambio o el desafío al estato-quo. Si la H0 es la creencia general, el desarrollar una prueba muestra que existen dudas acerca de la veracidad de la H0. A menudo la norma es que la opinión de los investigadores esta contenida dentro de la H1.


Ejemplos de Hipótesis:


En una granja avícola (pollo de engorde), el nutricionista nos propone la utilización de un probiótico en la dieta de inicio y levante de los animales asegurándonos que los pollos tendrán una conversión alimenticia superior frente a los que no usan probiótico. Si decidimos hacer un ensayo nuestra hipótesis nula será:
H0: La conversión alimenticia durante las primeras tres semanas de vida no varía por el uso de los probióticos en pollos de engorde.
H1: El suministro de probioticos en pollo de engorde generan una variacion positiva en la conversión alimenticia durante las primeras tres semanas de vida.


Decisiones para tomar:


- Aceptar la hipótesis nula, significa que no existe suficiente evidencia para aceptar el cambio propuesto por la hipótesis alterna.
- Rechazar la hipótesis nula significa lo contrario, que existe suficiente evidencia estadística para entender que la hipótesis nula no soporta la verdad.


Errores en que se incurre al tomar las decisiones (Alterman,2020):


Tipo I: Sucede cuando se rechaza la hipótesis nula y no se debería haber hecho. Eje: Un palpador que declare preñez en un novillo (ha sucedido). También el error tipo I puede ser un falso positivo. Es determinar que existe diferencia significativa entre variables cuando en realidad no la hay. La probabilidad de cometer un error tipo I (falso positivo) se conoce como nivel de significancia del nivel 𝛼.
Tipo II: Sucede cuando no se rechaza la hipótesis nula y esta debería haber sido rechazada. Por ejemplo una vaca preñada con 5 meses de gestación y ha sido palpada negativa. También se le conoce como un falso negativo ya que se determina que no hay diferencia significativa entre las variables cuando de hecho si la hay. La probabilidad de cometer un error tipo II (falso negativo) es igual a beta (𝛽).


Nivel de significancia:


Nivel de significancia (𝛼): es la probabilidad de rechazar una hipótesis nula que es verdadera; la probabilidad de cometer este error. Los niveles de significancia mas comunes son: 0.10, 0.05, 0.01. Por ejemplo se elige un nivel de significancia del 0.05 ó 5% al diseñar un ensayo de hipótesis, entonces hay aproximadamente 5 ocasiones en 100 en que se rechazaría la hipótesis nula cuando debería ser aceptada, es decir, se está con un 95% de confianza de que se toma la decisión adecuada. En tal caso se dice que la hipótesis ha sido rechazada al nivel de significancia del 0.05,lo que significa que se puede cometer error con una probabilidad de 0.05. (Benitez Morales A).
Valores de significancia notables (P-Values): cuando estamos comprobando una hipótesis y el valor de P es inferior a 0.000 esto nos indica que podemos rechazar la H0 en todos los niveles de significancia. Sin embargo, 0.05 a menudo es el punto de corte. En resumen, si nuestro valor P es mas alto que 0.05 entonces aceptamos la H0, pero si el valor de P es inferior de 0.05 rechazamos la H0. Esto cuando hemos asumido un 𝛼 del 5%.


Estimadores


Un estimador es una función matemática que aproxima un parámetro poblacional a partir de una población muestral (estadística inferencial). Según Chao (1978) es probable que el resultado obtenido a partir de la muestra, por ejemplo la media, difiera del resultado de la población total. La diferencia entre estos resultados es lo que se llama el error de estimación o error muestral.
Si a partir de las observaciones de una muestra se calcula un solo valor como estimación de un parámetro de la población desconocido, estamos hablando de una estimación puntual. Si por el contrario queremos determinar dos números dentro de los cuales se halla el parámetro objetivo, estamos hablando de la estimación por intervalos. El intervalo de confianza es mucho mas preciso que los estimados únicos. Por eso se prefieren al hacer inferencias.


Error Estándar de la Media:


Cuantifica las oscilaciones de la media muestral alrededor de la media poblacional, es decir, cuando tomamos varias muestras de la misma población, seguramente tendremos diferentes resultados para el estimador que estamos tratando de calcular. El error estándar cuantifica la variabilidad del estimador frente al parámetro que se trata de estimar. El error estándar se mide en términos de la desviación estándar del estimador.
La formula del error estándar para la media muestral es:


Donde S representa la desviación estándar de la muestra y el denominador de la fórmula representa la raíz cuadrada del tamaño de la muestra n


6.2- Tipos de pruebas


6.2.1- Ensayo de dos colas


Cuando tenemos una hipótesis y la distribución muestral de los datos tiene distribución normal y media 𝛍 y desviación 𝛔 entonces estos valores podemosnormalizarlos como vimos anteriormente y obtener una normal con media 0 y varianza 1 o sea el valor equivalente z. Basados en la curva de distribución normal estandarizada podemos asegurar con el 95% de confianza si la hipótesis es cierta, que el valor normalizado (z) obtenido de una muestra real se encontrara entre +1.96 y -1.96 desviaciones estandar ya que el área bajo la curva normal entre estos valores es 0.95. Si estandarizamos los valores con los cuales obtuvimos lacurva normal para la producción de leche ajustada a 305 días, vamos a poder entender mejor cuál es el área de confianza como se observa en el siguiente gráfico. Entonces en el ensayo de dos colas la H0 estará dado por una igualdad (no hay diferencia entre A y B) y tenemos que tener en cuenta ambos extremos de la distribución de los datos para poder responder la pregunta.


Si el valor z (valor normal estandarizado) elegido aleatoriamente de la muestra está por fuera del rango -1.96 a 1.96 significa que este valor z difiere significativamente de lo que cabría esperar bajo esta hipótesis y se estaría inclinado a rechazar la hipótesis. Entonces el conjunto de las z que se encuentran entre -1.96 y 1.96 desviaciones se conoce como el área de aceptación de la hipótesis o región de no significación. Si por el contrario la z obtenida para el estadístico s es mayor a 1.96 o menor -1.96 entonces el estadístico muestral observado es significativo al nivel del 0.05, entonces se rechaza la hipótesis al nivel de significación del 0.05. Gráficamente las colas de la distribución muestran cuando se rechaza la hipótesis nula. Todo lo que permanece entre las líneas rojas es tomado como la región de aceptación.


6.2.2- Ensayo de una cola


A diferencia de la prueba de dos colas que busca probar si un valor se ubica dentro de la distribución (igualdad), la prueba de una cola es usada cuando la hipótesis nula no contiene signos de igualdad sino busca identificar si el dato en cuestion es mayor o menor. El test de una sola cola se usa cuando solo se necesita conocer los resultados de un solo extremo (desigualdad es decir, en una cola de la distribución).
Por ejemplo este test es útil para saber la probabilidad de que la producción de leche sea mayor a 30000 lbs por lactancia, o para ver determinar que un nuevo alimento para cerdos garantiza una conversión alimenticia mayor a 1 kg de peso corporal por cada 2 kg de alimento. Estos ensayos se llaman ensayos de una cola o ensayos unilaterales. En tales casos, la región crítica es una región a un lado de la distribución, con área igual al nivel de significancia.


Como se ve en la gráfica a diferencia del test de dos colas, el test de una cola se enfoca solo en un extremo en este caso la zona de corte para el 95% de confianza no es 1.96 en ambos lados sino 1.65 desviaciones en un solo extremo de la curva estandarizada, en este caso -1.65. Este significa que cualquier número por debajo de este valor esta por fuera de la zona de confianza del 95% y por lo tanto es sujeto a rechazo.


Pruebas de una o dos colas


6.3- Intervalos de confianza


El intervalo de confianza es un rango de valores que toma la variable en el cual se tiene confianza con un determinado porcentaje (usualmente el 95%) que el parámetro poblacional se encuentre ubicado. El intervalo de confianza es una representación mas certera de la realidad que solo dar el valor de una media, especialmente cuando se trabaja con una muestra y no con una población. El intervalo de confianza se debe construir alrededor de un punto estimado.
Para obtener el intervalo de confianza de un parámetro por ejemplo estimar la media, se van a determinar los números a y b de manera que:


Esto significa que con un 95% de confianza la media se encuentra entre el punto a y el punto b. El nivel de confianza de un intervalo es una probabilidad que representa la seguridad de que el intervalo encierra el verdadero valor del parámetro que estamos buscando determinar. Para cada nivel de confianza existe un valor de tabla (z, t, x2,F) asociado al nivel de confianza dado. Este es el coeficiente de confiabilidad. El nivel de confianza se denota como 100(1 – 𝛼)%.


6.3.1- Intervalo con varianza poblacional conocida


Para este tipo de intervalo muestral debemos tener en cuenta (greelane.com,2018):


  • - La muestra es pequeña en relación con la población. Normalmente el tamaño de la población es veinte veces mayor que el tamaño de la muestra.
  • - La variable en estudio tiene una distribución normal.
  • - Se conoce la desviación estándar de la población.
  • - La muestra es aleatoria simple.
  • - Se desconoce la media de la población.

Para este intervalo podemos fijar de antemano el grado de confianza de que el verdadero valor de la media 𝛍x quede incluido en el rango. La formula simplificada es:


Donde: z (1-α/2) = valor de la variable normal estándar que determina una cola superior de medida 𝛂/2


Es importante recordar que el valor de confianza de 100(1 – 𝛼)% en la tabla respectiva, debe buscarse un valor de variable para el cual el área de la cola superior e inferior sea del 100(𝛼/2)%. Esto porque la porción de área que no será cubierta por el intervalo se reparte en partes iguales tanto en la cola superior como la inferior. Entonces si es 5% las areas se repartirían 2.5% hacia la izquierda y 2.5% hacia la derecha.

Ejemplo: en una granja avícola (huevos) en Santander Colombia, se hace un muestreo aleatorio de las producciones de 30 lotes de ponedoras y se obtuvo una media de 339 huevos por ave por por postura. El promedio de la producción por ave por postura sigue una distribución normal y tiene una desviación estándar 𝛔 = 35. El administrador de la finca no está de acuerdo con este resultado ya que según sus cuentas, el promedio no puede bajar de 360 huevos por ave por lote. Para determinar si lo que dice el administrador es cierto, necesitamos comprobar si existe diferencia significativa entre la media encontrada en el muestreo y la media suministrada por el administrador.

Entonces en Excel calculamos la media de las 30 muestras (=AVERAGE o =PROMEDIO) el dato de la desviación estándar, lo conocemos (35) y calculamos el error estándar muestral. El error estándar nos permite estimar que tanto varia la media muestral con respecto al valor de la que se obtendría calculando la media poblacional. Se obtiene la siguiente manera:



Error Estándar Muestral = 35/√30 = 3.29


Donde 35 es el valor de la desviación estándar conocida y 30 corresponde la valor de muestras obtenidas.

Para facilitar el manejo de la información podemos construir una pequeña tabla en Excel tal como se muestra en la tabla inferior a la derecha.

Entonces de la tabla z obtenemos el 𝛂/2, como queremos establecer un intervalo de confianza del 95% entonces el 𝛂 seria 5/2 = 2.5% (la mitad para cada cola). Este valor en la tabla es de 1.96. Entonces reemplazamos en la formula para obtener el valor mínimo y el valor máximo.
El valor para establecer el intervalo de confianza se puede calcular en Excel por lo tanto no hay necesidad de tener una tabla. Para ello utilizamos en inglés la función =NORM.S.INV o =DITR.NORM.ESTAND.INV en español. Esta función nos pide insertar el porcentaje de confianza en este caso es del 95% pero hay que tener en cuenta que este se reparte entre las dos colas, asi que el 𝛂/2 que en este caso es el 97.5% y el valor retornado es igual al obtenido en la tabla o sea 1.96. Con este valor podemos construir nuestro intervalo de confianza. Una vez tenemos el valor crítico de la tabla podemos calcular el intervalo.

Valor mínimo = 339 – (3.29 * 1.96) = 332.55


Valor máximo = 339 + ( 3.29*1.96) = 347.82


Para calcular el intervalo en Excel, utilizamos la función =CONFIDENCE.NORM o =INTERVALO.CONFIANZA.NORM. Insertamos la función e incluimos el valor del 𝛂, la desviación estándar y el tamaño de la muestra. Para este caso el valor es 12.52. Entonces el intervalo será de 339 ± 12.52 con lo cual vamos a obtener los mismos resultados calculados previamente. Entonces con un 95% de confianza podemos decir que la media de producción por ave por lote en esta finca es un valor que se encuentra entre 332.55 y 347.82 huevos por ave por lote. Por tanto con un 95% de confianza podemos afirmar que la media que el administrador estimó en 360 huevos por ave por lote, no es acertada.


Vamos a ver otra manera de comprobar si el promedio es 360 huevos por ave/encasetada como dice el administrador, para ello establezcamos las hipótesis H0 y H1 donde:

  • H0: 𝛍 = 360
  • H1: 𝛍 ≠ 360

Como la hipótesis es una igualdad y una desigualdad entonces hablamos de un ensayo de dos colas. Para demostrar si estas medias son iguales, utilizamos la siguiente fórmula:


Donde X es la media muestral, 𝛍 es la media poblacional, σ es la desviación estándar de la población y n el tamaño de la muestra. Entonces, reemplazando:


El z calculado para una media de 360 es de -3.28 desviaciones estandar. El intervalo de z establecido para el 95% de confianza es entre -1.96 y 1.96 desviaciones estandar, por tanto -3.28 se encuentra por fuera de este rango y podemos decir con 95% de confianza que la media no es 360 huevos por ave por lote. Tal como lo habíamos previsto en nuestro intervalo de confianza.


Intervalo de confianza con varianza poblacional conocida


flecha de descargacarpeta de descarga

6.3.2- Intervalo de confianza con varianza poblacional desconocida


Cuando no se conoce la varianza de la población de interés, podemos basados en una muestra obtener un intervalo de confianza para la media de dicha variable. Para ello entonces, debemos obtener una muestra aleatoria de tamaño n, que pertenece a una población con distribución normal, media 𝝻 y desviación estandar 𝞂, ambas desconocidas. El intervalo de confianza se construye partiendo de la variable aleatoria:


Donde 𝛸 es la media muestral, 𝛍 es la media poblacional, s es la desviación estándar de la muestra y n el tamaño de la muestra.



El intervalo de confianza asociado con un nivel de confianza de 100(1-𝝰)% es:


Donde tα/2, n-1 es el punto de la distribución t Student con n-1 grados de libertad.

Ejemplo, en una finca ganadera del departamento del Cesar en Colombia, se busca determinar el peso promedio de los novillos vendidos en pie. Para ello se tomaron al azar y se pesaron 25 novillos antes de embarcarlos al camión. Este intervalo se puede calcular por medio de la función en Excel =INTERVALO.CONFIANZA.T o =CONFIDENCE.T
Para ello nos ubicamos en la celda donde deseamos insertar la función, la escribimos y entre los paréntesis incluimos los siguientes datos en orden: seleccionamos el 𝝰, la desviación estándar de la muestra y el tamaño de la muestra. Como se ve en la tabla inferior y de esta manera obtendremos el intervalo.

Resultados:


Otra manera sencilla de obtener el intervalo es con el módulo de estadística descriptiva que se ubica en la herramienta Análisis de Datos o Data Analysis de Excel y que revisamos en el capítuloquinto. Una vez seleccionada esta herramienta seleccionamos el rango de los datos, marcamos que están agrupados por columnas (columns) si están en una fila (desaconsejable) seleccionar filas o rows. Seleccionamos la celda o la hoja donde queremos ubicar el informe, incluimos la opción summary statistics (resumen estadístico) y finalmente, seleccionamos la opción nivel de confianza para la media, en este caso 95% tal como se muestra en el cuadro.


Una vez seleccionadas las opciones damos ok y obtendremos el siguiente reporte:


Si observamos la última fila, el valor de confianza (confidence) es igual al que obtuvimos con la función =INTERVALO.CONFIANZA.T

Ahora que ya tenemos el valor solo tendremos que sumar y restar de la media asi: 514.92 ± 42.72 , entonces el intervalo de la media de peso para los novillos en pie para esta finca, con un 95% de confianza está entre 472.2 y 557.64 kg. Podemos deducir que este es un intervalo mas amplio al que obtendriamos si conocieramos la desviación estandar poblacional pero dado que no la conocemos este intervalo a partir de la muestra nos da certeza sobre los resultados a esperar sobre el comportamiento poblacional.


Intervalo de confianza con varianza poblacional desconocida


flecha de descargacarpeta de descarga

6.4- Intervalo de confianza para la diferencia de medias en poblaciones normales independientes


Existen situaciones en las cuales es importante comparar las medias de dos grupos diferentes. Por ejemplo la condición corporal de vacas lecheras en confinamiento y semi confinamiento, o la persistencia en producción entre lotes de ponedoras de diferentes líneas. Estas situaciones involucran comparaciones entre dos grupos independientes, significando que son diferentes animales los que están en los grupos (Boston University of Public Health, 2017).


6.4.1- Intervalo cuando las varianzas son desconocidas, pero se asumen iguales


Cuando no se conocen las varianzas poblacionales, para calcular el intervalo 𝛍x – 𝛍y se usa la fórmula:


Donde t(k,1-α/2) Es el valor de la variable con distribución t con k = nx + ny – 2 grados de libertad que determina un área superior de media 𝛼/2



Como se desconoce la varianza poblacional debemos calcular la varianza ponderada Sp con la siguiente fórmula:


La diferencia de los parámetros se toma de manera que la diferencia muestral sea positiva.



Ejemplo: Un propietario tiene dos hatos lecheros, sus registros son escasos y contrata un asistente técnico para que le ayude a mejorar producción. El asistente desea saber si existen diferencias en las medias de producción de ambas fincas. Para ello tomó los registros de producción del último año y seleccionó 27 lactacias al azar de cada uno de los hatos. Desconocemos las varianzas poblacionales, pero podemos calcular las de las muestras de cada finca para determinar el intervalo de la diferencia de la media.


Entonces X será el promedio de la producción de leche para la granja A y Y el promedio de la producción de leche par a la granja B.



Calculamos la varianza combinada siguiendo la fórmula establecida y tenemos por resultado:


Una vez tenemos este valor buscamos el valor de t para los grados de libertad combinados y un 𝛼 de 5%. En este caso utilizamos la función de Excel =T.INV.2T porque estamos trabajando con una igualdad, queremos saber si las medias de X y Y son iguales (H0) o por el contrario las medias de X y Y son diferentes (H1).
La condición de que las medias son iguales se traduce por la condición (𝛍x – 𝛍y) = 0.


Entonces, tenemos que el valor de T para 52 grados de libertad y 𝛼/2 es de 2.31. Reemplazando los valores tenemos que el intervalo de la media de producción de las dos granjas con un 95% de confianza, oscila entre -61.22 kg y 1546 kg, por tanto no podemos descartar que las dos medias sean iguales, ya que el 0 esta incluido dentro del intervalo, por tanto aceptamos la hipótesis nula.


Intervalo de confianza para la diferencia de dos medias con varianza poblacional desconocida pero se asumen iguales


flecha de descargacarpeta de descarga


6.4.2- Cálculo del intervalo de dos medias cuando las varianzas poblacionales no son conocidas y se asumen diferentes


Si el número de las muestras obtenidas de ambos grupos es diferente y existe gran diferencia entre ambas varianzas (por lo menos el doble), es recomendable hacer esta prueba (podemos asumir que las varianzas son iguales). Para realizar la prueba vamos a tomar ventaja del analizador de datos de Excel que hemos trabajado durante toda esta sección.
Ejemplo: en una finca de ganado de ceba se hace un estudio para comparar los pesos ajustados a 24 meses de dos grupos de novillos, el primero son animales Brahman puros y el segundo grupo es un lote de animales F1 Simbrah (Simmental x Brahman), tal como como en el fragmento que se muestra en la tabla a continuación:


El propietario desea conocer si existe diferencia entre las medias de ambos grupos con un 95% de confianza.
La diferencia de los parámetros se toma de manera que la diferencia muestral sea positiva.
Definiendo los términos tenemos:


  • X = peso (kg) ganado Simbrah
  • Y = peso (kg) ganado Brahman

Una vez tenemos los datos listos en la tabla podemos acudir a la herramienta de Análisis de Datos de Excel cuyo funcionamiento ya hemos visto y también se explica en el video que se encuentra anexo a esta sección y de ahí seleccionamos la opción t-Test: Two Samples Assuming Unequal Variances' o prueba T dos muestras asumiendo varianzas diferentes. Los resultados obtenidos con el analizador de datos de Excel para prueba T cuando la varianza no se conoce fueron:


La condición de que las medias son iguales se traduce por la condición (𝛍x – 𝛍y) = 0. En este caso Excel no nos devuelve el intervalo, sin embargo el P calculado para dos colas es muy inferior al nivel de confianza (P= 0.05), por tanto podemos decir que no hay igualdad entre los dos grupos, por lo tanto con un 95% de confianza podemos decir que las medias poblacionales son diferentes, por tanto aceptamos la hipótesis alterna, es decir hay una diferencia signficativa entre los pesos de ambos grupos.


Intervalo de confianza para la diferencia de dos medias con varianza poblacional desconocida y se asumen diferentes


flecha de descargacarpeta de descarga

6.5- Intervalo de confianza para la diferencia de dos medias dependientes


Las muestras dependientes ocurren en múltiples situaciones, por ejemplo, cuando estamos mirando variaciones de la misma variable en el mismo individuo en el tiempo (antes y después). La varianza que se utiliza es la varianza de la diferencia entre el antes y el después. Se asume que la distribución de los datos sigue una curva normal.

La fórmula para calcular el intervalo de la diferencia ese el siguiente:


Como se ve la fórmula del intervalo es muy similar a la de una sola población con varianza desconocida solo que aquí para calcular el intervalo utilizamos la media de la diferencia entre el antes y el después que es la "d" y sumamos o restamos el valor obtenido en la tabla t para n-1 y 𝛼/2 multiplicado por el error estandar. Por ejemplo, queremos evaluar el efecto de un nuevo programa de higiene y control preventivos contra la mástitis clínica. Tomamos 13 vacas al azar a las cuales previamente hemos hecho el recuento de céluas somaticas (scc 000/ml) y volvemos a medir 30 días después para comprobar si hay alguna diferencia. Como podemos ver las variables son dependientes porque son las mismas vacas las que estamos muestreando tanto antes como después.


La tabla superior presenta los resultados de scc/ml para un n de 13 animales.


Calculamos la media de la diferencia (antes y después), la desviación estándar, el error estándar y el t de la tabla, tal como lo hemos visto anteriormente. Finalmente reemplazamos los valores de la fórmula para obtener nuestros rangos superior e inferior.

Teniendo en cuenta que ambos valores del intervalo están por debajo del 0, y viendo que el promedio de scc/ml es inferior después de aplicar las medidas podemos asegurar que si hubo un cambio positivo en la implementación de las medidas ya que el conteo dismunuyó y no hay igualdad dentro del intervalo. También podemos utilizar la herramienta de Análisis de Datos de Excel y seleccionar la opción 't-test: Paired Two Samples per Mean' o prueba-t: Dos muestras emparejadas por media como se explica en el video incluido en esta sección.


Intervalo de confianza para la diferencia de dos medias dependientes


flecha de descargacarpeta de descarga