一元二次回归模型拟合方法

一元二次回归模型拟合方法
四技术
一、一元线性回归模型引入
从简单的一元线性回归开始。这里,我们以房屋面积(x)与房屋价格(y)为例,显而易见,二者是一种线性关系,房屋价格正比于房屋面积,我们假设比例为w:透水石
y ^ = w ∗ x \hat{y} = w * x y^=w∗x
然而,这种线性方程一定是过原点的,即当x为0时,y也一定为0。这可能并不符合现实中某些场景。为了能够让方程具有更广泛的适应性,我们这里再增加一个截距,设为b,即之前的方程变为:
y ^ = w ∗ x + b \hat{y} = w * x + b y^=w∗x+b
氧气止回阀而以上方程,就是我们数据建模的模型。方程中的w与b,就是模型的参数。
假定数据集如下:
线性回归是用来解释自变量与因变量之间的关系,但是,这种关系并非严格的函数映射关系。从数据集中,我们也看到了这一点。相同面积的房屋,价格并不完全相同,但是,也不会相差过大。
二、下一步目的,去学习(确定)w与b的值
我们现在的目的就是,从现有的数据(经验)中,去学习(确定)w与b的值。一旦w与b的值确定,我们就能够确定拟合数据的线性方程,这样就可以对未知的数据x(房屋面积)进行预测y(房屋价格)。
1. 引入权重
eg. 房屋价格会随着房屋面积改变而改变,也符合常规认识,我们认为房屋面积越大,房屋价格越高。
对于这种线性关系,接下来我们就可以去建立这个函数的模型。对于这个线性的模型,可以表示为x y 之间有一定的比例。这个时候 我们可以建立这样的关系,建立这样的模型。
模型就是一个映射,一个函数,通过历史数据,建立一个模型,一个函数。
Y = f(x) ,法则,成比例,法则我们不知道,可以先预设出来,用w表示比例,表示法则,W*x;W表示我们这个x的比例关系,W :weight 权重通用模型
应用的房屋价格这个例子:Y就是房屋的价格, x就是面积,所以可以把比例认为是房屋的单价;单价不知道,应该从我们数据集中求出来,因为模型要靠历史数据集建立出来。值是多少不知道,我们需要传递历史数据集
我们要把W学出来,y=100*x,学出来后,对于未知的x,我们也能够进行求y。咱们就能够建立这样的模型:
y = w ∗ x y = w*xy=w∗x
注意:预测的我们一般用 y_hat ,y上面有帽子,预测值 y_hat;而y通常表示我们真实的数据。
我们有一个小小的疑问:有一点不足的地方:
钾霞石这个模型建立起来了,不管w取什么 y一定过原点。
所以引入偏置b (bias)
举例打车
eg. 打车
打车有一个里程,里程和价格也是有一种固定的比例,这个线性的关系:
Y随着里程的变化而变化;
W可以看成每公里的价格;
但是打车有一个起步价,所以很多场景中,模型不一定过原地,我们可以在后面加上一个偏置b,如果线过原点, b为0就行了。这样我们就能把线性回归更通用的模型建立起来了。
房屋的取暖费
eg. 房屋的取暖费也有起步价,而不是简单的房屋的面积和最终价格。
y ^ = w ∗ x + b \hat{y} = w*x + b
浆浆在线y^=w∗x+b
通过历史数据的训练,w和b就能学出来了,以后遇到未知的数据,也能学出来了。这就体现了预测。
2. 引入噪声
有一个重要的概念噪声。因为在我们真实的场景中,不见得数据都是线性关系,可能和真实场景有偏差。也就是不是严格函数的映射关系;换一种说法:是一种线性,但不是完全的函数式线性关系。
eg. 跳远 Y = f(x)
Y 跳远的距离X 同学只要是同一个同学,跳远距离能相同吗?
当然做不到。
X 相同 y不一定相同。但是偏差也不会太大,不会特别明显。
三、从回归分析到线性回归
1. 回归分析
回归分析是用来评估变量之间关系的统计过程。用来解释自变量X与因变量Y的关系。即当自变量X发生改变时,因变量Y会如何发生改变。
自变量,因变量 是 x , y;建立这样的映射关系
用来解释自变量x与因变量y的关系
2. 线性回归
回归分析的一种,评估自变量X与因变量Y之间是一种线性关系。当只有一个自变量时,称为一元线性回归,当具有多个自变量时,称为多元线性回归。

本文发布于:2024-09-24 02:34:36,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/343491.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:房屋   模型   回归   数据   线性   关系   价格   面积
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议