LA T DE STUDENT
Asunciones de la prueba t de Student
Técnicamente se puede describir la prueba t de Student como aquella que se utiliza en un modelo en el que una variable explicativa (var. independiente) dicotómica intenta explicar una variable respuesta (var. dependiente) dicotómica. Es decir en la situación: dicotómica explica dicotómica.
La prueba t de Student como todos los estadísticos de contraste se basa en el cálculo de estadísticos descriptivos previos: el número de observaciones, la media y la desviación típica en cada grupo. A través de estos estadísticos previos se calcula el estadístico de contraste experimental. Con la ayuda de unas tablas se obtiene a partir de dicho estadístico el p-valor. Si p<0,05 se concluye que hay diferencia entre los dos tratamientos.
Las hipótesis o asunciones para poder aplicar la t de Student son que en cada grupo la variable estudiada siga una distribución Normal y que la dispersión en ambos grupos sea homogénea (hipótesis de homocedasticidad=igualdad de varianzas). Si no se verifica que se cumplen estas asunciones los resultados de la prueba t de Student no tienen ninguna validez.
Por otra parte no es obligatorio que los tamaños de los grupos sean iguales, ni tampoco es necesario conocer la dispersión de los dos grupos.
¿Qué hacer cuando las asunciones no se cumplen?
Existen varias pruebas estadísticas para contrastar la Normalidad de los datos: la más utilizada la de Kolmogorov-Smirnov. De igual modo existen también varias pruebas que permiten contrastar la homogeneidad de varianzas: la más utilizada es la prueba de Levene.
En el caso de que no se cumpla la asunción de Normalidad se suele intentar alguna transformación de los datos que "normalice" los datos, siendo la transformación logaritmo neperiano la más usual. Ocurre en la práctica que la transformación que "normaliza" los datos también consigue igualdad de varianzas. En el caso de que no se diera la hipótesis de igualdad de varianzas ni siquiera después de transformar los datos, hay que utilizar una modificación de la prueba t de Student debida a Satterthwaite que es válida para el caso de no homogeneidad de varianzas.
Ejemplo
Se supone que se quiere comparar dos tratamientos con relación a una variable cuantitativa. Los datos experimentales son:
Trat A: 25, 24, 25, 26
Trat B: 23, 18, 22, 28, 17, 25, 19, 16
Si se aplica la t de Student directamente se obtiene una p=0,096>0,05 con lo que se concluye que no se puede demostrar diferencias entre los dos tratamientos. Sin embargo la prueba de Levene pone de manifiesto que p=0,014<0,05 con lo que se concluye que en estos datos no se verifica la igualdad de varianzas, con lo que la conclusión anterior queda en suspenso. Tras aplicar Satterthwaite, que es válido en este caso de heterocedasticidad, se obtiene que p=0,032<0,05 con lo que la conclusión correcta es que sí hay diferencia entre los dos tratamientos.
Conclusiones
La prueba t de Student es muy utilizada en la práctica, sin embargo a menudo su aplicación se hace sin excesivo cuidado, no comprobando las asunciones que requiere. En este artículo se ha puesto de manifiesto que la falta de normalidad o la falta de homogeneidad en las varianzas invalida la prueba t de Student
Distribución t-Student de n grados de libertad
1. Función de densidad de probabilidad:

2. Valores esperados
E(t)=0
3. Parecida a N(0,1)
4. Th. Si es una v.a. con distribución N(0,1) y es otra v.a. con distribución de n grados de libertad, entonces es una v.a. con distribución t-Student de n grados de libertad.
1. es una t-Student de n-1 grados de libertad
2. Analogía con , que es N(0,1)
5. Si es el fractil de la distribución t-Student de n grados de libertad, entonces, por ser simétrica respecto del origen

En estadística, una prueba t de Student, prueba t-Student, o Test-T es cualquier prueba en la que el estadístico utilizado tiene una distribución t de Student si la hipótesis nula es cierta. Se aplica cuando la población estudiada sigue una distribución normal pero el tamaño muestral es demasiado pequeño como para que el estadístico en el que está basada la inferencia esté normalmente distribuido, utilizándose una estimación de la desviación típica en lugar del valor real. Es utilizado en análisis discriminante.
Entre los usos mas frecuentes de las pruebas t se encuentran:
El test de locación de muestra única por el cual se comprueba si la media de una población distribuida normalmente tiene un valor especificado en una hipótesis nula.
El test de locación para dos muestras, por el cual se comprueba si las medias de dos poblaciones distribuidas en forma normal son iguales. Todos estos test son usualmente llamados test t de Student, a pesar de que estrictamente hablando, tal nombre sólo debería ser utilizado si las varianzas de las dos poblaciones estudiadas pueden ser asumidas como iguales; la forma de los ensayos que se utilizan cuando esta asunción se deja de lado suelen ser llamados a veces como Prueba t de Welch. Estas pruebas suelen ser comúnmente nombradas como pruebas t desapareadas o de muestras independientes, debido a que tienen su aplicación mas típica cuando las unidades estadísticas que definen a ambas muestras que están siendo comparadas no se superponen.5
El test de hipótesis nula por el cual se demuestra que la diferencia entre dos respuestas medidas en las mismas unidades estadísticas es cero. Por ejemplo, supóngase que se mide el tamaño del tumor de un paciente con cáncer. Si el tratamiento resulta efectivo, lo esperable seria que el tumor de muchos pacientes disminuyera de tamaño luego de seguir el tratamiento. Esto con frecuencia es referido como prueba t de mediciones apareadas o repetidas.5 6
El test para comprobar si la pendiente de una regresión lineal difiere estadísticamente de cero.
Ejemplo
Sea A1 denotando un grupo obtenido tomando 6 muestras aleatorias a partir de un grupo mayor:

y sea A2 denotando un segundo grupo obtenido de manera similar:


Estos podrían ser, por ejemplo, los pesos de tornillos elegidos de un montón.
Vamos a llevar a cabo la prueba de hipótesis contando cmo hipótesis nula de que la media de las poblaciones de las cuales hemos tomado las muestras son iguales.
La diferencia entre las dos medias de muestras, cada uno denotado por , la cual aparece en el numerador en todos los enfoques de dos muestras discutidas anteriormente, es



La desviaciónes estándar muestrales para las dos muestras son aproximadamente 0,05 y 0,11 respectivamente. Para muestras tan pequeñas, una prueba de igualdad entre las varianzas de las dos poblaciones no es muy poderoso. Pero ya que los tamaños muestrales son iguales, las dos formas de las dos pruebas t se pueden desarrollar en forma similar en este ejemplo.

FORMULA

En esta prueba se evalúa la hipótesis nula de que la media de la población estudiada es igual a un valor especificado μ0, se hace uso del estadístico:











ESCALAS DE MEDICIÓN ESTADÍSTICA
Según la clasificación de Stevens pueden clasificarse en:

• Nominales
• Ordinales
• De inventario
• De razón

ESCALA NOMINAL
son aquellas en que sólo se manifiesta una equivalencia de categorías entre los diferentes puntos que asume la variable como una simple lista de las diferentes posiciones que pueda adoptar la variable, pero sin que en ella se defina ningún tipo de orden o de relación
Entre estos valores no cabe obviamente ninguna jerarquía, no se puede trazar ningún ordenamiento. Sin embargo, a la enunciación explícita de todas estas posibilidades la consideramos como una escala, pues de algún modo es útil para medir el comportamiento de la variable, indicándonos en que posición se halla en cada caso.

LAS ESCALAS ORDINALES
distinguen los diferentes valores de la variable jerarquizándolos simplemente de acuerdo a un rango
Establecen que existe una gradación entre uno y otro valor de la escala, de tal modo que cualquiera de ellos es mayor que el precedente y menor que el que le sigue a continuación
Un ejemplo de escala ordinal es el que suele usarse para medir la variable "grado de escolaridad": podemos decir que una persona que ha tenido 2 años de instrucción escolar ha recibido más instrucción que quien solo tiene un año y menos que quien posee tres.
Sin embargo no puede afirmarse válidamente que la diferencia entre quien posee 2 años de instrucción y quien ha recibido un año es igual a la diferencia entre quienes han recibido 16 y 17años de educación formal. Por tanto, como no podemos determinar la equivalencia entre las distancias que separan un valor de otro, debemos concluir que la escala pertenece a la categoría ordinal.

LAS ESCALAS DE INTERVALOS
además de poseer la equivalencia de categorías y el ordenamiento interno entre ellas, como en el caso de las ordinales, tienen las características de que la distancia entre sus intervalos está claramente determinada y que estos son iguales entre sí
Un ejemplo típico de las escalas de intervalos iguales esta dado por las escalas termométricas. Entre 23 y 24 grados centígrados, por ejemplo, existe la misma diferencia que hay entre 45 y 46 grados. Muchas otras escalas, como las que se utilizan en los test psicológicos y de rendimiento, pertenecen a este tipo
La limitación que poseen es que no definen un cero absoluto, un valor límite que exprese realmente la ausencia completa de la cualidad medida.
Por ello no se pueden establecer equivalencias matemáticas como las de la proporcionalidad: no puede afirmarse que 24° C es el doble de temperatura que 12° C, porque el cero de la escala es un valor arbitrario y no se corresponde con la ausencia absoluta de la variable que se mide.

LAS ESCALAS DE COCIENTES
En ellas se conservan todas las propiedades de los casos anteriores pero además se añade la existencia de un valor cero real, con lo que se hacen posibles ciertas operaciones matemáticas, tales como la obtención de proporciones y cocientes
Esto quiete decir que un valor de 20 en una escala de este tipo es el doble de un valor de 10, o de las dos terceras partes de un valor de 30. Son escalas de cocientes las que miden la longitud, la masa, la intensidad de corriente eléctrica y otras variables del mundo físico.
Difícilmente las variables que intervien en las ciencias sociales son medidas con escalas de razones, pues son contados los casos en que dichas variables pueden ser definidas con la exactitud y precisión necesarias. La economía y la demografía son, entre estas disciplinas, las que más utilizan escalas de razones.