LR模型是什么?LR模型详解 世界速看
目录
1、逻辑回归
2、算法推导
(资料图片)
3、逻辑参数估计
3.1、使用极大似然法进行参数估计
3.2、逻辑回归的损失函数
4、逻辑回归的梯度下降
5、多分类逻辑回归
6、逻辑回归的欠、过拟合
6.1、解决过拟合和欠拟合问题
6.2、LR 正则化
6.2.1、L1正则化
6.2.2、 L2 正则化
6.3 、L1正则化和L2正则化的区别
7、LR与最大熵模型的关系
8、逻辑回归的优缺点
9、逻辑回归面对线性不可分数据
10、逻辑回归通常稀疏的原因
11、逻辑回归和线性回归的异同
1、逻辑回归
2、算法推导
对数几率函数:是一种Sigmoid函数,通过此函数来输出类别概率。
对数几率函数为: ,其中y 代表的是样本视为正样本的可能性,则 1-y 为视为负样本的可能性。
对数几率:定义为 ,其中 y/(1-y) 称为比率。
决策边界:作用在 n 维空间,将不同样本分开的平面或曲面,在逻辑回归中,决策边界对应$ wx+b=0 。
3、逻辑参数估计
3.1、使用极大似然法进行参数估计
现学习目标是对参数 w 和b 进行参数估计,使得逻辑回归模型能尽可能符合数据集分布。
现在,即对对数似然函数求极大值,即以对数似然函数为目标的最优化问题。 L(w) 是关于 w 的高阶连续可导凸函数,根据凸优化理论,可采用梯度下降法,牛顿法等优化方法求解。
3.2、逻辑回归的损失函数
4、逻辑回归的梯度下降
5、多分类逻辑回归
假设:离散型随机变量 y 的取值集合是 {1,2,...K} ,共有 k 类,则多分类逻辑回归模型的输出概率为:
其中,注意 p(y=k|x)是一个取 1 到 k-1类其中一类, K 是指第 K 类, p(y=K|x) 便是由1减去其他k取值的概率就是第K类的概率。
二阶逻辑回归的参数估计法也可推广到多项逻辑回归。
6、逻辑回归的欠、过拟合
6.1、解决过拟合和欠拟合问题
解决LR回归欠拟合:
增加特征的维度
解决LR的过拟合:
减少特征的数量,可人工特征选择,也可降维等模型算法选择正则化(加入 L1,L2 罚项)逐渐减小梯度下降学习率
6.2、LR 正则化
6.2.1、L1正则化
LASSO 回归,相当于为模型添加了这样一个先验知识:w服从零均值拉普拉斯分布。
拉普拉斯分布:
等价于原始的cross−entropy后面加上了L1正则,因此L1正则的本质其实是为模型增加了“模型参数服从零均值拉普拉斯分布”这一先验知识。
6.2.2、 L2 正则化
Ridge 回归,相当于为模型添加了这样一个先验知识:w服从零均值正态分布。
等价于原始的cross−entropy后面加上了L2正则,因此L2正则的本质其实是为模型增加了“模型参数服从零均值正态分布”这一先验知识。
6.3 、L1正则化和L2正则化的区别
如上面所讲,两者引入的关于模型参数的先验知识不一样。L1偏向于使模型参数变得稀疏(但实际上并不那么容易),L2偏向于使模型每一个参数都很小,但是更加稠密,从而防止过拟合。
L1偏向于稀疏,L2偏向于稠密,看下面两张图,每一个圆表示loss的等高线,即在该圆上loss都是相同的,可以看到L1更容易在坐标轴上达到,而L2则容易在象限里达到。
L1 L2
7、LR与最大熵模型的关系
将最大熵模型写成约束问题:
8、逻辑回归的优缺点
LR优点:
直接对分类的可能性建模,无需事先假设数据分布,避免了假设分布不准确带来的问题不仅预测出类别,还可得到近似概率预测对率函数是任意阶可导凸函数,有很好得数学性质,很多数值优化算法可直接用于求取最优解容易使用和解释,计算代价低LR对时间和内存需求上相当高效可应用于分布式数据,并且还有在线算法实现,用较小资源处理较大数据对数据中小噪声鲁棒性很好,并且不会受到轻微多重共线性影响因为结果是概率,可用作排序模型
LR缺点:
容易欠拟合,分类精度不高数据特征有缺失或特征空间很大时效果不好
9、逻辑回归面对线性不可分数据
逻辑回归本质上是一个线性模型,可通过:
利用特殊核函数,对特征进行变换把低维空间转换到高维空间,使用组合特征映射(如多项式特征)。但组合特征泛化能力较弱扩展LR算法,提出FM算法
10、逻辑回归通常稀疏的原因
分类特征通常采用one-hot转换成数值特征,产生大量稀疏一般很少直接将连续值作为逻辑回归模型输入,而是将连续特征离散化
LR一般需要连续特征离散化原因
离散特征的增加和减少都很容易,易于模型快速迭代稀疏向量内积乘法速廈快,计算结果方便存储,容易扩展离散化的特征对异常数据有很强的鲁棒性(比如年龄为300异常值可归为年龄>30这一段逻辑回归属于广义线性模型,表达能力受限。单变量离散化为N个后,每个变量有单独的权重,相当于对模型引入了非线性,能够提升模型表达能力,加大拟合离散化进行特征交叉,由 M+N 个变量为 M*N 个变量(将单个特征分成 M 个取值),进一步引入非线性,提升表达能力特征离散化后,模型会更稳定(比如对用户年龄离散化,20-30作为一个区间,不会因为用户年龄,增加一岁变成完全不同的人,但区间相邻处样本会相反,所以怎样划分区间很重要)特征离散化后,简化了LR模型作用,降低模型过拟合风险
11、逻辑回归和线性回归的异同
相同之处:
都使用了极大似然估计来对样本建模。线性回归使用最小二乘法,实际上就是在自变量 x 和参数 w 确定,因变量 y 服从正态分布的假设下,使用最大似然估计的一个化简。逻辑回归通过对似然函数的学习,得到最佳参数 w二者在求解参数的过程中,都可以使用梯度下降的方法
不同之处:
逻辑回归处理的是分类问题,线性回归处理的是回归问题逻辑回归中因变量取值是一个二元分布,模型学习得出的是 E[y|x,w] ,即给定自变量和参数后,得到因变量的期望。而线性回归实际上求解的是 y=wx ,是对假设的真实关系 y=wx+e 的一个近似,其中e 是误差项逻辑回归中因变量是离散的,线性回归中的因变量是连续的。并在自变量与参数 w 确定情况下,逻辑回归可以看作广义线性模型在因变量 y 服从二元分布时一个特殊情况,而使用最小二乘法求解线性回归时,我们认为因变量 y 服从正态分布
参考网址:
https://blog.csdn.net/songbinxu/article/details/79633790 (较深入的逻辑回归介绍)
https://zhuanlan.zhihu.com/p/56900935 (较基础的逻辑回归介绍)
标签:
相关推荐:
最新新闻:
- 什么是Cover letter?Cover letter应该包含哪些内容? 当前要闻
- 全球最资讯丨Javscript插件都有哪些?Javscript插件怎么安装?
- mysqldump是什么意思?mysqldump命令详解_世界即时看
- 实时:sonarQube是什么?Sonar的简介
- Swift Code是什么意思?Swift具有哪些特性?|天天微资讯
- String format格式化怎么操作?常规类型的格式化
- LR模型是什么?LR模型详解 世界速看
- js 常见的replace方法案例有哪些?
- 什么是Sprint?Sprint怎么使用?:当前看点
- UART是什么意思?UART详解 软件通信协议
- 全球热推荐:win10开始菜单没反应怎么办?win10开始菜单没反应的解决方法
- Linux怎么操作cp命令?Linux之cp命令详解
- 天天观点:电视一二三级能效有什么区别?电视一二三级能效的详情介绍
- STC - STC15官方库函数 串口操作怎么修改?:天天热头条
- 什么是脚手架? 脚手架有什么作用?
- 快讯:iOS15.0.1修复了什么?修复了哪些bug?
- excel怎么批量发送邮件和工资条?excel批量发送技巧:环球看点
- 环球播报:空调电路图怎么看?空调工作原理大全
- 联想昭阳e41g系列配置如何?联想昭阳e41g系列报价详解
- 500万像素数码相机有啥推荐?最受欢迎的十款推荐 环球动态
- seagate硬盘好用吗?seagate硬盘最新报价
- 访问developer.apple.com太慢怎么解决?解决方法步骤|天天时讯
- 微信24小时客服热线电话是多少?如何转到人工服务办理?-世界报道
- SUGAR马卡龙宝石多少钱?SUGAR马卡龙宝石价格详情:天天热文
- 比特币是什么?比特币有哪些特点?_天天日报
- 每日动态!404 not found是什么意思?该怎么解决?
- 资源管理器怎么打开?资源管理器打开方法 当前速读
- 电脑显示器价格是多少?高性价比的电脑显示器选购技巧_环球快讯
- 系统崩溃了怎么办?如何快速还原崩溃的系统-天天速看料
- 每日播报!qq怎么截图?qq截图的快键建
- 三星d518怎么样?三星d518评测介绍 微资讯
- 微资讯!html常用长度度量单位 度量长度的单位是什么?
- 怎么使用java修改端口?springboot打包项目
- 高清录像笔哪款好?高清录像笔有啥推荐?|当前聚焦
- 华阳太阳能怎么不加热?华阳太阳能不加热的原因及解决方法
- “红兔大展”演绎生肖酒文化,五粮浓香借创意快闪传递C端情深
- 焦点观察:心理测试小游戏有哪些?真的准吗?
- BigDecimal是什么?BigDecimal详细解析 -天天速递
- 天天观速讯丨ABAP自定义截取字符串长度函数 截取字符串长度的函数
- 自动感应门哪个品牌好?自动感应门品牌推荐
- 什么是电阻器?可变电阻器结构、工作和不同应用|环球热资讯
- 【世界时快讯】遗传算法实例有哪些?函数的最大值怎么解?
- MTP USB安装失败怎么办?MTP USB安装失败解决方法
- 番薯网是什么?番薯网有哪些差强人意的设计?-焦点播报
- 世界今热点:SecureCRT中文乱码怎么解决?两种解决方法
- 回顾历史事件:首台通用电子计算机的发明者诞生 谷歌推出第一个涂鸦
- 世界焦点!如何使用数字万用表?数字万用表的使用步骤
- 如何高速下载国外资源?国外资源下载方法技巧|热点聚焦
- 环球热讯:补丁安装命令是什么?补丁安装命令详情
- FBI的WARNING是什么?简单的静态代码检测规则_当前快看
- macfee怎么用?macfee使用教程
- torrent是什么文件?torrent文件介绍?
- Tencent Files文件夹在哪?tencent files文件夹能删除吗?
- 什么是子网掩码?如何划分子网?
- windows无法完成格式化怎么办?windows无法完成格式化2种解决方案
- Facetime怎么用?Facetime详细使用指南
- 网线应该怎么接?网线水晶头做法标准
- pdf是什么格式?pdf格式介绍
- 怎么将U盘制作成DOS启动盘?U盘制作成DOS启动盘方法
- 三星P7500怎么刷机?三星P7500刷机教程
- 系统光盘怎么刻录?系统光盘刻录步骤
- 如何快速制作flash banner?制作flash banner步骤
- Win8每次开机gwx.exe进程都会自动启动怎么解决?解决方法
- KB2565063更新补丁是什么?KB2565063可以卸载吗?
- 百度云登陆失败总是显示网络连接失败该怎么办?解决方法
- 临时文件夹在哪?Win10临时文件夹的路径在哪?
- TGA 2022:《Among Us》捉迷藏新模式公布 12月9日发布_世界热资讯
- 怎么查看惠普电脑保修截止日期?惠普电脑保修截止日期查看方法
- 药企组团出国“抢单”,投资人“疯狂”加码低估的biotech,牛市启动了?
- TGA 2022:《猎天使魔女起源:Cereza and the Lost Demon》正式公布!明年3.17发售
- 抑郁症患者“阳了”之后,慎用这几种常见感冒药
- TGA 2022:《自杀小队:杀死正义联盟》新预告:蝙蝠侠亮相!明年5.26发售
- 世界即时看!TGA2022:《猎天使魔女:起源》公开 2023年3月17日发售
- 焦点速看:TGA 2022:生存恐怖游戏《创伤后》公布
- TGA 2022:解谜游戏《Viewfinder》预告 支持简中 当前信息