Inicio Actividades Cálculo Regresión lineal múltiple
Correlación y regresión son elementos utilizados en análisis estadístico para determinar qué tan fuerte es la relación entre dos variables. Ejemplos de variables que pueden estar correlacionadas son los siguientes:
La correlación se usa para determinar la fuerza y también la dirección de la relación entre las variables. Dos variables están correlacionadas positivamente cuando si una de ellas crece la otra también crece. La correlación es negativa cuando si una variable crece la otra decrece. Se utiliza Regresión Lineal para encontrar la linea de mejor ajuste, entendiendo por esto la línea alrededor de la cual están dispersos los puntos de los datos. Las correlaciones positivas y negativas se corresponden con la pendiente de la recta de mejor ajuste. El coeficiente de correlación es una medida de qué tan fuerte es la relación.
Las regresiones múltiples se usan al tratar de establecer un buen indicador para una variable aleatoria. Por ejemplo, si usted piensa comprar un auto nuevo, puede usar el precio del auto como su variable dependiente y entonces examinar su correlación con variables "predictoras" como caballos de fuerza, eficiencia del combustible, precio de reventa, calificación en seguridad en caso de choque, etc. Al hacer el análisis podria encontrar que la calificación en seguridad es mejor indicador del precio total del auto que el número de asientos que tenga. Podría tambien descubrir que ciertos autos deberían tener un precio más alto o más bajo según sus características, pudiendo así identificar el mejor auto por determinado precio.
Esta actividad ayuda a los estudiantes en la comparación de múltiples variables independientes como predictoras de una variable dependiente. Los estudiantes pueden explorar correlaciones y líneas de mejor ajuste
Ingreso de datos
Primero, el usuario necesita ingresar los datos. Para hacerlo, cada línea debe tener cinco elementos de información. El primero es la variable dependiente. En el ejemplo del auto, aquí es donde se ingresa el precio de cada uno. En seguida está la variable independiente de dimensión 1, después de dimensión 2, etc. Es posible que haya visto anteriormente coordenadas similares para puntos del plano, en las que los valores de X y de Y representan ciertas cualidades de los puntos (es decir, su posición). En esta aplicación cada dimensión representa también alguna cualidad del auto. Las cinco dimensiones son "precio", "portavasos", "motor(litros)", "precio de reventa" y "calificacion de seguridad". Entonces, la línea de datos para un auto que vale $10.000 dólares, tiene 4 portavasos, un motor de seis litros, un precio de reventa igual a la mitad del precio original y una calificación perfecta en seguridad en una escala sobre 10, sería (10,4,6,5,10)
Después de presionar Actualizar Datos cada una de las cuatro dimensiones será graficada contra la variable dependiente y aparecerán dos líneas en cada gráfica
(Actualizar datos)
Línea verde de mejor ajuste
Para modificar la recta verde de mejor ajuste utilice las barras deslizadoras púrpura y verde para ajustar la pendiente y el intercepto en el eje Y, respectivamente. El rango de los deslizadores es [-10, 9.5], lo cual hace imposible graficar una recta vertical. Si la recta de mejor ajuste es vertical, la ecuación roja mostrará la ecuación de una recta vertical (por ejemplo, x=3)
Para juzgar qué tan preciso es el ajuste de la recta verde de mejor ajuste hecho por el usuario, en la esquina inferior derecha se muestra la suma de los cuadrados de las diferencias.
Suma de los cuadrados
Estos cuadrados se pueden integrar sobre las cuatro dimensiones, o verse individualmente seleccionando o no la casilla de verificación Integrar suma de cuadrados
Línea roja de mejor ajuste
La ecuación y correlación, r, se calculan para la línea roja de mejor ajuste con el fin de establecer qué tan bien la linea representa los datos. Para mayor información sobre correlación, ver la discusión en Coeficientes de Correlación
La aplicacion sobre regresión múltiple se diseñó para que los estudiantes puedan graficar una variable dependiente contra cuatro variables independientes cuando se busca un buen indicador para la variable dependiente. La aplicación calcula automáticamente la recta de mejor ajuste para los datos de cada dimension y su correspondiente r-valor. Sin embargo, para la línea de mejor ajuste obtenida por el usuario, solamente se muestra la suma de los cuadrados de las desviaciones. Esto es particularmente importante cuando una de las dimensiones tiene correlación igual a cero. Aunque se pueden cambiar la pendiente y el intercepto en Y de la recta verde de mejor ajuste para reducir la suma de los cuadrados, no se está cambiando la habilidad de esa dimensión para predecir la variable dependiente. Entonces, cambiar la recta de mejor ajuste para reducir la suma de los cuadrados posiblemente no puede afectar la falta de influencia de esa dimensión sobre las otras dimensiones.
Esta actividad es mejor para trabajo individual o en grupos pequeños durante unos veinte a veinticinco minutos si se utilizan las preguntas de exploración
Grados 9-12