Imagine that I have a linear correlation like y = a·x + b with a defined R2 value. I would like to know if it is possible to use/transform this R2 value into an error in order to get something like y = (a ± error)·x + (b ± error).
The answer by Jochen is authorized one. I estimate the 95% CI of eight LDFs by the k-fold cross validation for small sample method. You can apply this method for the regression analysis.
Gracias Martí, por exponernos esta cuestión. En ella veo que tienes una visión clara de lo que es un ajuste lineal de unos datos observados y en base a otros datos observables x.
Pienso que lo que planteas, sustituir el ajuste lineal que minimiza el error cuadrático medio en la muestra sobre la que se hace el ajuste, por un haz de rectas que estén en su entorno, no veo clara su utilidad. Pues si tienes el mejor ajuste, ¿qué importan los demás ajustes aproximados al mejor desde un punto de vista práctico? No creo que aporte mayor claridad desde un punto de vista de la optimización ni de su utilidad. Es como sustituir lo mejor por un conjunto de cosas algo peores o igual, entre las que se encuentra la mejor. No veo ninguna ventaja, y creo que complica innecesariamente el problema del ajuste lineal.
thank you very much: I agree with you. The issue here, though, is that we use this equation as a modelling step of an agent based model where an optimal solution does not exist. We would like to work with a "fork" of values for this equation in order to run different parameter combinations and see what happens.
No, because correlation and regression already take into account variation in the data. That's what the R2 value indicates – a statistical measure of how well the regression line approximates the real data points :)