梯度(gradient)是什么?梯度的概念
(资料图)
梯度概念是建立在偏导数与方向导数概念基础上的。
目录
偏导数方向导数梯度(gradient)梯度下降法偏导数
所谓偏导数,简单来说是对于一个多元函数,选定一个自变量并让其他自变量保持不变,只考察因变量与选定自变量的变化关系。数学上说,是指对于多元函数 y = f ( x 1 , x 2 , … x n ) y=f\left(x_{1}, x_{2}, \ldots x_{n}\right) y=f(x1,x2,…xn),假设其偏导数都存在,则该函数共有 n n n个偏导数,可以表示为: f x 1 = ∂ y ∂ x 1 , f x 2 = ∂ y ∂ x 2 … f x n = ∂ y ∂ x n f_{x_{1}}=\frac{\partial y}{\partial x_{1}}, f_{x_{2}}=\frac{\partial y}{\partial x_{2}} \ldots f_{x_{n}}=\frac{\partial y}{\partial x_{n}} fx1=∂x1∂y,fx2=∂x2∂y…fxn=∂xn∂y
偏导数只能表示多元函数沿某个坐标轴方向的导数,如对于二元函数 z = x 2 + y 2 z =x^2+y^2 z=x2+y2, ∂ z ∂ x = 2 x \frac{\partial z}{\partial x}=2x ∂x∂z=2x表示函数沿 X X X轴方向的导数; ∂ z ∂ y = 2 y \frac{\partial z}{\partial y}=2y ∂y∂z=2y表示函数沿 Y Y Y轴方向的导数;
方向导数
除了沿坐标轴方向上的导数,多元函数在非坐标轴方向上也可以求导数,这种导数称为方向导数。很容易发现,多元函数在特定点的方向导数有无穷多个,表示函数值在各个方向上的增长速度。一个很自然的问题是:在这些方向导数中,是否存在一个最大的方向导数,如果有,其值是否唯一?为了回答这个问题,便需要引入梯度的概念。
梯度(gradient)
一般来说,梯度可以定义为一个函数的全部偏导数构成的向量(这一点与偏导数与方向导数不同,两者都为标量)。一般将函数 f f f的梯度记为 ∇ f \nabla f ∇f,即: 事实上,梯度向量的方向即为函数值增长最快的方向,为什么会如此,可以从几个角度去理解。 在下图中,我们可以看到,为了找到方向导数中的最大值,我们可以将其投影到 x y xy xy平面来理解,这种投影方式对应的便是等高线图。 如对于一个二元函数 z = f ( x , y ) z = f (x,y ) z=f(x,y) ,我们可以画出它的等高线图如下: 该函数的等高线图为圆心在原点的一系列圆,等高线的值由里向外逐渐增加。 点 B ( x , y ) B (x,y) B(x,y) 为点 ( x , y , z ) ( x , y , z ) (x,y,z)在 x y xy xy 平面上的投影,可以看到向量 A B → \overrightarrow{A B} AB 即为函数在点 ( x , y , z ) ( x , y , z ) (x,y,z)处的梯度向量(梯度向量是一个函数的全部偏导数构成的向量,梯度向量为 u = ( f x , f y ) u = \left(f_{x}, f_{y}\right) u=(fx,fy)) 根据方向导数的定义,方向导数 D u f = f x cos θ + f y sin θ D_{u}f=f_{x} \cos \theta+f_{y} \sin \theta Duf=fxcosθ+fysinθ,其中 θ \theta θ为此向量与 X X X正方向的夹角。 由于梯度向量为 u = ( f x , f y ) u = \left(f_{x}, f_{y}\right) u=(fx,fy),单位向量 w = ( cos θ , sin θ ) w=(\cos \theta, \sin \theta) w=(cosθ,sinθ),则方向导数的大小可以表述为梯度向量与此单位向量的数量积,即: D u f = f x cos θ + f y sin θ = u ⃗ ⋅ w ⃗ = ∣ u ∣ ⋅ ∣ w ∣ ⋅ cos α = ∣ u ∣ ⋅ cos α D_{u} f=f_{x} \cos \theta+f_{y} \sin \theta=\vec{u} \cdot \vec{w}=|u| \cdot|w| \cdot \cos \alpha=|u| \cdot \cos \alpha Duf=fxcosθ+fysinθ=u ⋅w =∣u∣⋅∣w∣⋅cosα=∣u∣⋅cosα 其中 α \alpha α为梯度向量与单位向量之间的夹角,即 ∠ B A D \angle B A D ∠BAD。可以看出,方向导数的大小可以看作梯度向量在指示方向导数方向的单位向量上的投影,即线段 A E AE AE的长度。显而易见,线段 A E AE AE的长度小于线段 A B AB AB的长度,也即梯度向量的模总是大于等于方向导数向量的模。这就解释了为什么沿着梯度向量方向是函数值增长最快的方向,而它正是函数所有偏导数构成的向量。
在上图中也可以看出,梯度向量垂直于等高线,这为我们提供了另一个观察梯度向量的角度。如对于函数 f ( x , y ) = x y f(x,y)=xy f(x,y)=xy,其等高线图与梯度向量如下(蓝色的线为等高线,紫色的小箭头为梯度向量的方向): 我们可以两个角度考虑:第一,在特定函数点,固定每次移动的步长,向那个方向移动函数值增长最快?第二,固定需要增加的函数值,向哪个方向需要移动的步长最短? 注:上图中大圆是小圆所在区域的放大显示,是为了方便说明左图:在所有方向给定相同大小的步长,哪个方向函数 f f f增加最多? 右图:所有让 f f f增加相同值的步长,哪一个最短? 在上面的左图中,固定移动的步长,我们可以看到垂直于等高线图的方向即为函数值增长最快的方向,也就是梯度向量指示的方向。在右图中,假设函数值有一个固定的微小的增长(2到2.1),则明显梯度向量指示的方向所需要的步长最短,而这个向量也是垂直于等高线的。
梯度下降或上升法正是基于梯度指示函数值增长最快的方向而产生的,利用这个方法,我们可以使用迭代的方法计算函数的最大或最小值,从而解决机器学习中遇到的最优化问题。梯度下降法
既然在变量空间的某一点处,函数沿梯度方向具有最大的变化率,那么在优化目标函数的时候,自然是沿着负梯度方向去减小函数值,以此达到我们的优化目标。 如何沿着负梯度方向减小函数值呢?既然梯度是偏导数的集合,如下: gradf ( x 0 , x 1 , … , x n ) = ( ∂ f ∂ x 0 , … , ∂ f ∂ x j , … , ∂ f ∂ x n ) \operatorname{gradf}\left(x_{0}, x_{1}, \ldots, x_{n}\right)=\left(\frac{\partial f}{\partial x_{0}}, \ldots, \frac{\partial f}{\partial x_{j}}, \ldots, \frac{\partial f}{\partial x_{n}}\right) gradf(x0,x1,…,xn)=(∂x0∂f,…,∂xj∂f,…,∂xn∂f) 同时梯度和偏导数都是向量,那么参考向量运算法则,我们在每个变量轴上减小对应变量值即可,梯度下降法可以描述如下: 注: := 表示赋值(assignment),也就是对 x 0 x_0 x0, x 1 x_1 x1,…, x n x_n xn更新 以上就是梯度下降法的由来,大部分的机器学习任务,都可以利用Gradient Descent来进行优化
标签:
相关推荐:
最新新闻:
- 全球百事通!格式化时间是什么?抽象类DateFormat是什么?
- 格式化时间是什么?抽象类DateFormat是什么?:当前热文
- 迅雷怎么高速下载?迅雷高速下载方法
- 打印机共享需要密码怎么办?打印机共享需要密码解决方法
- 梯度(gradient)是什么?梯度的概念
- 如何解决手机浏览器中出现404notfound的问题?手机浏览器404notfound解决方法
- 天天快报!disable怎么运用?disable简单易理解用法
- 电脑无法进入系统怎么办?电脑无法进入系统解决方法
- Internal问题解决流程 Internal server error 500 问题解决思路-动态焦点
- 电脑的显示器屏幕老是闪烁怎么办?电脑的显示器屏幕老是闪烁解决方法
- 如何联系爱奇艺APP中的人工客服?爱奇艺APP人工客服联系步骤
- 宽带的内网和外网什么意思?宽带的内网和外网介绍
- USB2.0怎样提高传输速度?提高传输速度方法
- 摄像头远程监控步骤是什么?手机远程监控摄像头设置方法
- 多普达有哪些型号的手机?多普达最新手机大全详情 天天新视野
- U盘遇到病毒怎么办?U盘遇到病毒解决方法
- 快讯:文章目录是什么?选择排序怎么设置?
- 【天天速看料】Internal问题解决流程 Internal server error 500 问题解决思路
- 信号的基本概念是什么?信号的分类有哪些?
- Excel函数之VLOOKUP()怎么使用?一文搞懂Excel函数之VLOOKUP()使用
- 倒车雷达哪个品牌好?汽车倒车雷达品牌及价格介绍_每日信息
- 美国多灵门锁怎么安装?美国多灵门锁安装步骤?
- 网络的利与弊是什么?网络的利弊分析:环球消息
- lol怎么在游戏里回复好友?lol游戏回复消息设置-环球视点
- 转动惯量是什么意思?转动惯量的含义
- OneNote是什么?OneNote的功能有哪些?
- 每日简讯:磁条读写器多少钱?磁条读写器怎么使用?
- 转动惯量是什么意思?转动惯量的含义 当前聚焦
- 三星N8010如何设置?三星N8010的屏幕锁定图案_快消息
- Modbus通信协议是什么?Modbus通信协议详解
- 世界热文:c语言餐桌游戏有哪些?教会你这十款酒桌游戏让你在朋友圈稳站“C”位!
- 电脑默认网关如何查询?电脑默认网关查询的小技巧
- iPad Air(iPad5)什么时候上市?iPad Air(iPad5)的上市时间-今日快看
- IE浏览器不见了怎么办?IE浏览器不见了解决方法
- 梯度(gradient)是什么?梯度的概念|天天日报
- 今亮点!JSONObject是什么意思?JSONObject详情介绍
- Win7专业版与Win7旗舰版如何区分?Win7专业版与Win7旗舰版区分方法
- 聚焦:工厂模式是什么?工厂模式的详解
- Win7系统安装声卡驱动失败怎么办?声卡驱动安装失败解决方法
- mysql置疑原因是什么?数据库置疑的处理办法
- 百度快照如何彻底删除?百度快照正确的删除方法
- 禁用宏则关闭excel文件怎么弄?设置流程_天天速递
- 英雄联盟无法全屏显示如何解决?英雄联盟无法全屏显示解决方法
- Modbus通信协议是什么?Modbus通信协议详解|全球报资讯
- 焦点热讯:支付宝阿里巴巴货到付款如何交易?货到付款交易流程
- 如何解决IE浏览器网页图片显示红叉问题?IE浏览器网页图片显示红叉解决方法
- 今日看点:手机QQ接收电脑端好友发送的文件存储在什么地方?文件储存的详细路径
- 每日观察!Trans系列是啥?基于翻译模型(Trans系列)的知识表示学习
- 语义分割:基于openCV和深度学习(二)_环球速看料
- 微特微电机怎么样?微特微电机详情介绍:热闻
- 优麒麟社区懒人版本(含软件全家桶) 怎么一键安装?_当前速读
- 禁用宏则关闭excel文件怎么弄?设置流程_天天速递
- java中flypaper怎么使用?Java 基础接口fly_全球快播报
- 每日看点!用VC6.0怎么实现上位机串口通信?位机串口通信的设置方法
- 会议panel是什么意思?医学术语中的panel到底是指什么?
- 观点:颜料墨水和染料墨水的区别是什么?颜料墨水和染料墨水简介
- 天天速递!粘胶短纤维市场现状是什么?粘胶短纤维的未来发展趋势
- 浪漫主义时期的音乐有哪些?浪漫主义乐派是什么?-当前独家
- 世界热文:c语言餐桌游戏有哪些?教会你这十款酒桌游戏让你在朋友圈稳站“C”位!
- Android中LayoutParams是什么?Android中LayoutParams总结和用法
- 今日热门!数据结构试题有哪些?数据结构试题及评分解析
- ssm大学生兼职论坛是什么?大学生兼职有哪些?:每日观察
- 摄氏度和开氏度的换算 开氏度和摄氏度的换算公式 天天亮点
- 基础版本的基础版本 直方图均衡化系列
- 今日视点:怎么设置交换机?计算机交换机连接设置方法
- 天天要闻:图片或手写签名转电子签名怎么转?手写签名转电子签名教程
- 电脑默认网关如何查询?电脑默认网关查询的小技巧
- IE浏览器不见了怎么办?IE浏览器不见了解决方法
- Win7专业版与Win7旗舰版如何区分?Win7专业版与Win7旗舰版区分方法
- Win7系统安装声卡驱动失败怎么办?声卡驱动安装失败解决方法
- 百度快照如何彻底删除?百度快照正确的删除方法
- 英雄联盟无法全屏显示如何解决?英雄联盟无法全屏显示解决方法
- 如何解决IE浏览器网页图片显示红叉问题?IE浏览器网页图片显示红叉解决方法
- Win7系统安装CAD软件提示缺少dfst.dll怎么办?解决方法
- 内网端口映射怎么设置?内网端口映射定义及设置方法
- 美拍是什么?美拍怎么用?
- 怎么关闭微信的扫脸支付功能?微信的扫脸支付功能关闭步骤
- 朴叙俊将加盟《惊奇队长2》 演惊奇队长丈夫|当前头条
- PSVR2首发获两款老游戏强化!可4K、90帧运行
- 许多推倒重建正在发生 | 独家对话索尼互娱中国总裁
- 二代接班,一场父与子的「明争暗战」 全球新动态
- 《高达 水星魔女》一阶段最终话暂停 明年1月8日续播
- 传英伟达RTX 4070Ti首发价899美元 约合RMB 6268元|环球资讯
- 天天速看:CDP警告员工《巫师》AR手游停服后将会进行裁员
- 【新要闻】育碧:《纪元1800》于今日返回Steam平台