基于逻辑回归的多任务域快速分类学习算法
关键词:逻辑回归 多任务域 快速分类学习 算法 罗杰斯特回归模型
中图分类号:TP391 文献标识码:A 文章编号:1007-9416(2016)11-0123-01
多任务学习方法主要是指在采用迁移学习方法的基础上,对单任务域的学习性能可以通过多个彼此关联的相似域学习进行改善。本文在多任务学习方法中应用罗杰斯特回归模型,通过对所有任务域分类器构造一致性模型,从而最大化地对不同任务域学习进行获取。而目前大部分多任务学习方法主要是利用非线性核函数,而多任务学习已经在图像处理、自然语言处理以及文本分类等多个领域的罗杰斯特回归函数分类模型中得到应用,因而在实际应用中具有非常高的分类精度以及效率。
1 多任务域学习
多任务学习将具有非常广泛的应用领域以及应用前景,将多任务域快速分类学习算法应用于进行学校网页分类时单纯人工收集及辨别标注往往能起到事倍功半的效果。在此过程中是采用多任务学习方法将每个学校的网页数据作为一个任务域,然后通过对多个任务域的学习来对其共性特征进行获取,最终再综合指导各个任务域的分类学习。但若仅仅只有一所学校,就只需要针对单任务目标域的学习,因而采用传统的算法即可。本文所研究的是多任务分类学习,研究的主要目标为彼此相似但却需要满足不同数据分布的多个任务域。将多个任务学习进行合并或者对每个任务域设计一个独立的设计分类器等方法均在实际应用的过程中存在缺陷。其中合并多个任务学习的方法没有关注到不同任务域之间的差异,而大样本域指导所存在的偏向性会在一定程度上干扰稀有域学习。而独立分类器学习没有重视到任务域之间存在的共性特征,因而在实际应用的过程中对分类精度有所下降。多任务域学习在实际应用的过程总具有自身较为独特的优势,在罗杰斯特回归模型提出之前有很多学者提出不同的多任务算法,尽管其中一部分算法在后来的实验中证明有效,但大多仅仅只是针对于小样本的学习。
2 基于逻辑回归多任务域快速分类学习算法
2.1 罗杰斯特回归函数
罗杰斯特回归函数被认为是一种最为常用且最为有效的分类方法,此函数在图像处理、文本分类以及语义识别中得到了较为广泛的应用。在二分类里Y={+1,-1}罗杰斯回归函数模型为:
其中Y代表为离散值,X代表连续量或者离散量,此函数可以用P(Y/X)概率函数进行预测。此函数可以为每组任务域构建其与之对应的分类器,并设置参数概率分布模型,采用训练集学习获得最优参数。
2.2 MTC-LR-Cddual大样本快速算法
为了能够在机器学习领域中快速地提高分类的准确率,在计算的过程中需要大样本高维数的数据作为次算法的支撑,罗杰斯特回归函数算法在面对大样本数据的过程中也存在效率低下的问题。MTC-LR-Cddual大样本快速算法对偶表达式为:
此算法的时间复杂度与数据的规模nk呈线性关系,因而风场适合面对大样本数据的运算。同时,由于此算法时间复杂度与任务域数据集的维数K呈线性关系,因而可以在高维的角度对大样本数据进行运算。
3 结果分析
根据相关的实验表明,在不同的数据规模下MTC-LR-CDdual算法均能正常运行,在小样本下罗杰斯特回归函数运行速度要快于MTC-LR-Cddua算法,但当样本量增大后,MTC-LR-Cddua才显现出其快速性。这说明不同数据规模均能采用MTC-LR-CDdua算法,且在小样本数据下MTC-LR-Cddual接近于罗杰斯特回归函数分类精度,且精度不会有较大损失。
4 讨论
罗杰斯特回归函数是通过耦合多任务域之间的共性信息来克服分类偏差产生的影响,从而能够在一定程度上提高个体分类器的精度。在罗杰斯特回归函数算法的基础上,将大样本快速算法CDdual延伸扩展至多任务域分类学习后形成的快速版本MTC-LR-CDdual。通过相关的实验数据表明此种算法具备一定的有效性、快速性以及精度。因此,我们得出面对小样本量的多任务分类学习方法可以采用罗杰斯特回归函数算法,而面对大样本数据集则更加适用于MTC-LR-CDdua算法。但由于本次研究过程中的所有任务域均具备相同数量的特征属性,但在实际应用中会面对不同的功能特征属性,因此域对于多任务学习的权重不同,这就要求在实际应用中进一步研究,以选择更加合适的算法。
参考文献
[1]郭华平,董亚东,邬长安,等.面向类不平衡的逻辑回归方法[J].模式识别与人工智能,2015,(8):686-693.
[2]吴含前,朱云杰,谢珏,等.基于逻辑回归的中文在线评论有效性检测模型[J].东南大学学报(自然科学版),2015,(3):433-437.
[3]苏汉宸,李红燕,苗高杉,等.PTLR:云计算平台上处理大规模移动数据的置信域逻辑回归算法[J].计算机研究与发展,2010,47(z1):414-419.
[4]谭雪敏,吴远峰,袁正午,等.拉格朗日多项式逻辑回归分类算法并行计算优化[J].遥感信息,2016,(1):96-101.
百度搜索“爱华网”,专业资料、生活学习,尽在爱华网!
更多阅读
转载 数字逻辑课程设计多功能数字钟 多功能数字钟的设计
原文地址:数字逻辑课程设计多功能数字钟作者:青涩橄榄数字逻辑课程设计报告设计名称:多功能数字钟设计工具:EWB 5.12版本相关课程:数字电子技术基础简明教程,电工电子技术实验任务指标:具有时分秒的显示,时分可以调整,使闹钟具有整点报时
线性回归、逻辑回归、损失函数 逻辑回归的损失函数是
回归问题的条件/前提:1) 收集的数据2) 假设的模型,即一个函数,这个函数里含有未知的参数,通过学习,可以估计出参数。然后利用这个模型去预测/分类新的数据。1. 线性回归假设 特征 和 结果 都满足线
多项logistic回归 基于Logistic回归对考研率在不同群体间的差异研究
伴随着我国市场经济的飞速发展,社会的不断进步,我国对高层次的人才的需求越来越大。现阶段,中国高等教育与研究生教育迅猛发展,规模也在急剧地膨胀,考研己成为一种公认的热潮。自2001年以来,我国开始实施了研究生招生扩招政策,研
南京的房子还能投资吗 在南京投资什么样的房子才能涨的多又快?
房价高涨的今天,很多人选择投资房产。那么,在南京,投资什么样的房子才能涨的又多又快呢?要问现在南京投资什么稳妥?那自然是房子!南京的房价,从去年一直涨到了今年,还记得城南、江宁两大板块的“地王”吗?地王一旦出现,房价必定往上飘。所以,
多任务委托代理模型 基于多任务委托代理的教育部科技查新员激励机制
摘要:本文主要从高校管理者角度,基于H-M多任务委托代理模型,结合教育部科技查新员从事的科技查新和查收查引工作,构建了高校管理者和查新员的多任务委托代理模型,分别在对称信息及非对称信息下,给出了查新员的最优薪酬激励合约及次佳薪酬