Resumen de unidades estadistica adnistrativa

marzo 4, 2019 Desactivado Por admin

Unidad 2 Pruebas de la bondad del ajuste y análisis de varianza Prueba De Independencia Cuando cada individuo de la población a estudio se puede clasificar según dos criterios A y g, admitiendo el primero a posibilidades diferentes y b el segundo, la representación de las frecuencias observadas en forma de una matriz a x b recibe el nombre de Tabla de contingencia.

Los datos se disponen de la forma siendo nij el número de individuos que presentan simultáneamente la i-ésima modalidad del carácter A y la j-ésma del B. La hipótesis nula a contrastar admite que ambos caracteres, A y B, se presentan de forma independiente en los individuos de la población de la cual s PACE 1 dependencia estocás a e de esta prueba requi frecuencias absoluta El estadístico L se dis st do la alternativa la res. La realización tico donde: y son las muestral total. l)(b 1) grados de libertad. El contraste se realiza con un nivel de significación del Ejemplo de Aplicación Para estudiar la dependencia entre la práctica de algún deporte y la depresión, se seleccionó una muestra aleatoria simple de 100 jóvenes, con los siguientes resultados: Sin depresión Con depresión total Deportista 38 9 No deportista 31 2 SWipe 10 47 53 69 IOO L = (38 – + (31 – + (9 – + (22 – 6,43 = 0,9557 + 0,8484 + 2,1 293 + 1,8883 = 5,8227 El valor que alcanza el estadístico L es 5,8227.

Buscando en la tabla teórica de Chi Cuadrado para 1 grado de libertad se aprecia Lt = 3,84146 < 5,8227 lo que permite rechazar la hipótesis de independencia de caracteres con un nivel de significación del 5%, admitiendo por tanto que la práctica deportiva disminuye el riesgo de depresión. Prueba De Bondad De Ajuste Una hipótesis estadística se definió como una afirmación o conjetura acerca de la distribución f(x,q) de una o más variables aleatorias.

Igualmente se planteó que la distribución podia tener uno o más parámetros desconocidos, que denotamos por q y que la hipótesis se relaciona con este parámetro o conjunto de parámetros En otros casos, se desconoce por completo la forma de la distribución y la hipótesis entonces se relaciona con una distribución especifica f(x,q) que podamos asignarle al conjunto de datos de la muestra. El primer problema, relacionado con los parámetros de una distribución conocida o supuesta es el problema que hemos analizado en los párrafos anteriores.

Ahora examinaremos el problema de verificar si el conjunto de datos e puede ajustar o afirmar que proviene de una determinada distribución. Las pruebas estadísticas que tratan este problema reciben el nombre general de «Pruebas de Bondad de Ajuste». Se analizarán dos pruebas básica 2 0 analizarán dos pruebas básicas que pueden aplicarse: La prueba Chi – Cuadrado y la prueba de Smirnov-Kolmogorov.

Ambas pruebas caen en la categoría de lo que en estadística se denominan pruebas de «Bondad de Ajuste» y miden, como el nombre lo indica, el grado de ajuste que existe entre la distribución obtenida a partir de la muestra y la distribución eórica que se supone debe seguir esa muestra. Ambas pruebas están basadas en la hipótesis nula de que no hay diferencias significativas entre la distribución muestral y la teórica. Ambas pruebas están basadas en las siguientes hipótesis: HO: f(x,q) = Hl : f(x,q) 1 f0(x,q) donde es la distribución que se supone sigue la muestra aleatoria.

La hipótesis alternativa siempre se enuncia como que los datos no siguen la distribución supuesta. Si se desea examinar otra distribución específica, deberá realizarse de nuevo la otra prueba suponiendo que la hipótesis nula es esta nueva distribución. Al especificar la hipótesis nula, el conjunto de parámetros definidos por q puede ser conocido o desconocido. En caso de que los parámetros sean desconocidos, es necesario estimarlos mediante alguno de los métodos de estimación analizados con anteriorldad.

Tablas De Contingencia En estadística las tablas de contingencia se emplean para registrar y analizar la relación entre dos o más variables, habitualmente de naturaleza cualitativa -nominales u ordinales-. Supóngase que se dispone de dos variables, la primera el sexo (hombre o mujer) y la segunda que recoge si el individuo es zurdo diestro. Se ha observado esta pareja de vari 30 recoge si el individuo es zurdo o diestro. Se ha observado esta pareja de variables en una muestra aleatoria de 100 individuos.

Se puede emplear una tabla de contingencia para expresar la relación entre estas dos variables, del siguiente modo: Diestro zurdo TOTAL Hombre 43 9 52 Mujer 44 4 48 TOTAL 87 13 100 Las cifras en la columna de la derecha y en la fila inferior reciben el nombre de frecuencias marginales y la cifra situada en la esquina inferior derecha es el gran total. La tabla nos permite ver de un vistazo que la proporción de ombres diestros es aproximadamente igual a la proporción de mujeres diestras.

Sin embargo, ambas proporciones no son id » nticas y la sgnlficación estadística de la diferencia entre ellas puede ser evaluada con el test Chi Cuadrado de Pearson, supuesto que las cifras de la tabla son una muestra aleatoria de una población. Si la proporción de individuos en cada columna varía entre las diversas filas y viceversa, se dice que existe asociación entre las dos variables. Si no existe asociación se dice que ambas variables son independientes.

El grado de asociación entre dos variables se puede evaluar mpleando distintos coeficientes: el mas simple es el coeficiente phi que se define por = / N) donde : Cj2 se deriva del test de Pearson, y N es el total de observaciones -el gran total-. puede oscilar entre O (que indica que no existe asociación entre las variables) y 1 (asociación total)Y El análisis de la varianza El análisis de la varianza parte de los conceptos de regresión lineal. El primer concepto fundamental es que 4 30 de la varianza parte de los conceptos de regresión lineal.

El primer concepto fundamental es que todo valor observado puede expresarse mediante la siguiente función: Donde Y sería el valor observado (variable dependiente), y X el valor que toma la variable independiente. BO sería una constante que en la recta de regresión equivale a la ordenada en el origen, Bl es otra constante que equivale a la pendiente de la recta, y e es una variable aleatoria que añade a la función cierto error que desvía la puntuación observada de la puntuación pronosticada.

Por tanto, a la función de pronóstico la podemos llamar ‘Y prma»• Y=BO+BI Podemos resumir que las puntuaciones observadas equivalen a las puntuaciones esperadas, más el error aleatorio: Sabiendo este concepto, podemos operar con esta ecuación de la siguiente forma: 1) Restamos a ambos lados de la ecuación (para mantener la igualdad) la media de la variable dependiente: 2) Substituimos el error por la ecuación resultante de despejar la ecuación 1. 1: e=Y-Y’ Por tanto…

Y reorganizando la ecuación: Ahora hay que tener en cuenta que la media de las puntuaciones observadas es exactamente igual que la media de las puntuaciones pronosticadas: Por tanto: s 0 Podemos ver que nos han untuaciones diferenciales. las varianzas, pero al no estar divididas por el número de casos n), las llamamos Sumas de Cuadrados. , excepto en el último término, que es una Suma Cruzada de Cuadrados (el numerador de la covarianza), y la covarianza en este caso es cero (por las propiedades de la regresión lineal, la covarianza entre el error y la variable independiente es cero).

O lo mismo que: de un factor, que es el caso más sencillo, la idea básica del análisis de la varianza es comparar la variación total de un conjunto de muestras y descomponerla como: Donde: es un número real relacionado con la varianza, que mide la variación debida al ‘factor», «tratamiento» o tipo de situación studiado. variación dentro de cada «factor», «tratamiento» o tipo de situación. En el caso de que la diferencia debida al factor o tratamiento no sean estadísticamente significativa puede probarse que las varianzas muestrales son iguales: es el número de situaciones diferentes o valores del factor se están comparando. s el número de mediciones en cada situación se hacen o número de valores disponibles para cada valor del factor. Así lo que un simple test a partir de la F de Snedecor puede decidir si el factor o tratamiento es estadísticamente significativo. Prueba F (análisis de varianza o ANOVA) Inferencia Varianza De Población Anova El análisis de varianza (ano los métodos estadísticos más utilizados V más elabo vestieación moderna. investigación moderna. El análisis de la varianza, no obstante su denominación se utiliza para probar hipótesis preferentes a las medias de población más que a las varianzas de población.

Las técnicas anovas se han desarrollado para el análisis de datos en diseños estadísticos muy complicados. Veamos cuando se tienen puntuaciones de Cl en 5 muestras de adulto. Grupos 1 23 4 S 02 103 100 108 121 s2 15 12 12 1410 Se aprecia que varían las medias de los grupos. Esta variación de las medias de grupo a partir de la media total o global de todos los grupos, se conoce como vananza inter grupal, la variabilldad promedio de las puntuaciones en cada grupo se denominan varianza inter grupal. Ahora se colocan todas las puntuaciones de Cl en una gran urna y se mezclan en forma adecuada.

Puede desentenderse por el momento cuáles puntuaciones pertenecen a que grupos. Estas puntuaciones varían. La variación de estas puntuaciones individuales se denomina variación total. El meollo del análisis de varianza radica en el siguiente hecho: si los grupos son muestras aleatorias provenientes de la misma población, las varianzas, inter grupal e intra grupal, son estimaciones insesgadas de la misma varianza poblacional. Se prueba la significación de la diferencia de los 2 tipos mediante la prueba F. Supuestos que fundamentan la aplicación de análisis de varianza.

Cuando se utiliza la técnica anova se deben cumplir los siguientes supuestos: Las personas de los diversos subgrupos deben seleccionarse mediante el muestreo aleatorio, a partir de poblaciones ormalmente distribuidas. La varianza de muestreo aleatorio, a partir de poblaciones normalmente distribuidas. La varianza de los subgrupos debe ser homogénea. Las muestras que constituyen los grupos deben ser independientes. Amenos de que las muestras sean independientes, y que por lo tanto, generen estimaciones de varianza independientes, la razón de las varianzas inter e intra no adoptará la distribución F.

Unidad 3 Análisis de regresión, correlación lineal simple y múltiple Estimación Mediante Linea De Regresión Como la Estadística Inferencial nos permite trabajar con una anable a nlvel de intervalo o razón, asi tambien se puede comprender la relación de dos o más variables y nos permitirá relacionar mediante ecuaciones, una variable en relación de la otra variable llamándose Regresión Lineal y una variable en relación a otras variables llamándose Regresión múltiple.

Casi constantemente en la práctica de la investigación estadística, se encuentran variables que de alguna manera están relacionados entre si, por lo que es posible que una de las variables puedan relacionarse matemáticamente en función de otra u otras variables. Il. – MARCO TEORICO REGRESIÓN. Se define como un procedimiento mediante el cual se trata de determinar si existe o no relación de dependencia entre dos o más variables. Es decir, conociendo los valores de una variable independiente, se trata de estimar los valores, de una o más variables dependientes.

La regresión en forma grafica, trata de lograr que una dispersión de las frecuencias sea ajustada a una línea recta o curva. Clases de Regresión La regresion puede ser Lineal y Curvilínea 30 ajustada a una línea recta o curva. La regresión puede ser Lineal y Curvilínea o no lineal, ambos tipos e regresión pueden ser a su vez: Regresión Simple: Este tipo se presenta cuando una variable independiente ejerce influencia sobre otra variable dependiente. Ejemplo: Y = f(X) Esta regresión se utiliza con mayor frecuencia en las ciencias económicas, y sus disciplinas tecnológicas.

Cualquier función no lineal, es linealizada para su estudio y efectos prácticos en las ciencias económicas, modelos no lineales y lineales multiecuacionales. Objetivo: Se utiliza la regresión lineal simple para: 1 . – Determinar la relación de dependencia que tiene una variable respecto a otra. 2. Ajustar la distribución de frecuencias de una línea, es decir, determinar la forma de la línea de regresión. 3. – Predecir un dato desconocido de una variable partiendo de los datos conocidos de otra variable.

Diagrama De Dispersión Los Diagramas de Dispersión o Gráficos de Correlación permiten estudiar la relación entre 2 variables. Dadas 2 variables Xe Y, se dice que existe una correlación entre ambas si cada vez que aumenta el valor de X aumenta proporcionalmente el valor de Y (Correlación positiva) o si cada vez que aumenta el valo de X disminuye en igual proporción el valor de Y (Correlación egativa). En un gráfico de correlación representamos cada par X, Y como un punto donde se cortan las coordenadas de X e Y.

Método Mínimos Cuadrados El método de mínimos cuadrados para el cálculo de la ecuación de una recta a través de los datos de interés da la línea de mejor el cálculo de la ecuación de una recta a través de los datos de interés da la línea de mejor ajuste, para llegar a la ecuación de tendencia por mínimos cuadrados se resuelven dos ecuaciones smultáneamente. ECUACION PARA LA LINEA DE TENDENCIAS EY=na 2 Pero el mejor método para para determinar a + b es.. LA PENDIENTE b: EL PUNTO DONDE N SE INTERCEPTA AL EJE Y b Las ventas de una cadena de comestibles desde 2003 son los siguientes. ño ventas(y) t ty y 7171 2004 102204 2005 93 27 9 2006 11 44416 2007 135 65 25 total 50 15 163 55 para simplificar los cálculos se reemplaza los valores de formula. PENDIENTE LA CUAL ES.. – 1. 3 (15) EL PUNTO DONDE 50 1. 3 15 – 6. 1 SE INTERSEPTA EL EJE Y 5 5(55)- La ecuación de tendencia es 6. 1 + 1 . 3t donde las ventas se expresan en millones de dólares. Interpretación Error Estándar De Estimación El error estándar nos pe ecuación de regresión que confiabilidad de la rollado. Este error se