admin 管理员组文章数量: 1086019
2024年4月15日发(作者:修改xml文件内容)
Journal of Computer Applications
ISSN 1001—9081
2017一O6—10
计算机应用,2017,37(6):1674~1679
文章编号:1001—9081(2017)06—1674—06
CODEN JYIIDU
http://www.joca.an
DOI:10.11772/j.issn.1001—9081.2017.06.1674
针对Lasso问题的多维权重求解算法
陈善雄 ,刘小娟 ,陈春蓉 ,郑方园
(1.西南大学计算机与信息科学学院,重庆400715; 2.贵州工程应用技术学院信息工程学院,贵州毕节551700)
( 通信作者电子邮箱csxpml@163.conr)
摘要:最小绝对收缩和选择算子(Lasso)在数据维度约减、异常检测方面有着较强的计算优势。针对Lasso用
于异常检测中检测精度不高的问题,提出了一种基于多维度权重的最小角回归(LARS)算法解决Lasso问题。首先考
虑每个回归变量在回归模型中所占权重不同,即此属性变量在整体评价中的相对重要程度不同,故在LARS算法计算
角分线时,将各回归变量与剩余变量的联合相关度纳入考虑,用来区分不同属性变量对检测结果的影响;然后在
LARS算法中加入主成分分析(PCA)、独立权数法、基于Intereriteria相关性的指标的重要度评价(CRITIC)法这三种
权重估计方法,并进一步对LARS求解的前进方向和前进变量选择进行优化。最后使用Pima Indians Diabetes数据集
验证算法的优良性。实验结果表明,在更小阈值的约束条件下,加入多维权重后的EARS算法对Lasso问题的解具有
更高的准确度,能更好地用于异常检测。
关键词:最小绝对收缩和选择算子;变量选择;最小角回归;多元线性回归;加权
中图分类号:TP181;TP301.6 文献标志码:A
Method for solving Lasso problem by utilizing multi-dimensional weight
CHEN Shanxiong ' ,LIU Xiaojuan 一,CHEN Chunrong ,ZHENG fangyuan
(1.College of Computer and Information Science,Southwest Univemi ̄,Chongqing 400715,China;
2.School ofInformation Engineering,Gu&hou University ofEngineering Science,Bijie Gu ̄hou 551700,China)
Abstract:Least absolute shrinkage and selection operator(Lasso)has pefrormance supeirority in dimension reduction of
data and anomaly detection.Concerning the problem that the accuracy is low in anomaly detection based on Lasso,a Least
Angle Regression(LARS)algorithm based on multi・dimensional weight was proposed.Firstly,the problem was considered
that each regression variable had diferent weight in the regression mode1.Namely,the importance of the attribute variable was
different in the overall evaluation.So,in calculating angular bisector of LARS algorithm,the united correlation of regression
variable and residual vector was introduced to distinguish the effect of different attibute varirables on detection results.Then,
the three weight estimation methods of Principal Component Analysis(PCA),independent weight evaluation and CRiteria
Importance Though Intercriteria Correlation(CRITIC)were added into LARS algoirthm respectively.The approach direction
and approach variable selection in the solution of LARS were further optimized.Finally,the Pima Indians Diabetes dataset was
used to prove the optimal property of the proposed algorithm.The experimental results show that,the LARS algorithm based on
multi・dimensional weight has a higher accuracy than the traditional LARS under the same constraint condition with smaller
threshold value,and can be more suitblae for anomaly detection.
Key words:Least absolute shrinkage and selection operator(Lasso);variable selection;Least Angle Regression
(LARS);Multiple Linear Regression(MLR);weighting
0 引言
大数据时代,数据挖掘已展现出其魅力,如何使用数理统
计模型从海量数据中挖掘有效信息越来越受到业界的关注。
在建立模型初期,一般会选择尽可能多的自变量(属性集)减
小因缺少重要自变量而出现的模型偏差,但建模过程中需要
确性主要取决于变量的选择和回归系数的取值。在Frank
等 提出的Ridge Regression算法和Bireman口 提出的
Nonnegative Garrote算法的启发下,Tibshirani 提出了一种称
之为最小绝对收缩和选择算子(Least absolute shrinkage and
selection operator,Lasso)的新的变量选择方法。该算法通过
构造一个惩罚函数来压缩系数,在回归系数的绝对值之和小
于一个常数的约束条件下,使残差的平方最小化,Lasso方法
作为一种压缩估计,具有较高的检测精度和较好的参数收敛
一
寻找对结果变量解释力最强的自变量集合,即通过对自变量
选择来提高模型的预测精度与准确度…。统计学中常用的
模型之一是线性回归模型,而对线性回归模型而言,模型的准
收稿日期:2016-11—07;修回日期:2017—01一l2。
致性。进一步,Efron等 提出最小角回归(Least Angle
基金项目:国家自然科学基金资助项目(61303227);贵州省普通高等学校科技拔尖人才
支持计划项目(黔教合KY字[2016]098);贵州省科技厅联合基金资助项目(黔科合LH字[2016]7053)。
作者简介:陈善雄(198l一),男,重庆人,副教授,博士,主要研究方向:压缩感知、异常检测、模式识别;刘小娟(1990一),女,四川广安人,
助教,硕士,主要研究方向:模式识别、神经网络; 陈春蓉(1995一),女,重庆人,硕士研究生,主要研究方向:数据挖掘、智能信息处理;
郑方园(1994一),男,河南焦作人,硕士研究生,主要研究方向:异常检测、网络安全。
第6期 陈善雄等:针对Lasso问题的多维权重求解算法 1675
Regression,LARS)算法来支撑Lasso问题的解法,并进一步
提出了修正的LARS算法,该算法通过消除了回归系数p异
号的情况来得到Lasso问题的解。修正的LARS算法采用逐
步回归,每一步路径都保持当前的残差与所有入选变量的相
关性都相同,同时满足Lasso解与当前逼近保持同向的要求,
保证最优结果,降低算法复杂度 一 。但LARS算法在求解
过程中。利用了自变量的均分的“角分线”方向对解向量进行
逼近,并没有考虑到不同变量对最终解的权重影响。
即残差处于 。与 :的角平分线上,此后用 。与 :的角平分线
方向逼近因变量Y。
图1 EARS算法求解步骤
Fig.I Solving process of ARS alEgorithm
因此本文提出了采用多维权重的方式计算变量的权重,
考虑到不是所有属性项(变量)都影响着检测结果,每个回归
2 多维权重LARS方法
变量在回归模型中所占权重不同,即此属性变量在整体评价
中的相对重要程度不同,因此,在LARS算法计算“角分线”
时,将各回归变量与剩余变量的联合相关度纳入考虑,用来区
分不同属性变量对检测结果的影响。实验通过Pima Indians
Diabetes数据集,两组评价指标对本文提出的方法进行了讨
论,其结果表明加入多维权重的LARS对Lasso问题的解答具
有更高的准确性能。
1.Lasso问题及LARS算法
1.1 Lasso问题描述
存在多维自变量设 ∈11 ( =1,2,…,m),因变量
Y∈R ,且每组自变量 都有对应的因变量Y,用自变量 对
因变量Y进行线性回归,在限定回归系数 的 。范数小于 的
情况下,求使得残差平方和最小的回归系数卢的估值。因此,
线性Lasso回归模型可以表示为:
Y= + (1)
其中: 是 维列向量,为待估参数;误差向量口满足E( )=
0,且Var(e): 。并且假定E(y I )= + 2+…+
卢 ,。注意该模型是稀疏模型,即JB , ,…, 中有很多系数为
零。变量选择的目的就是根据获取的数据来识别模型中哪些
系数为零,并估计其他非零参数,即寻找构建稀疏模型的参
数。需要求解的问题写成矩阵表达式为:
(口,卢)=arg min l lY一 一 l l2;ll卢II 1≤t(2)
1.2 LARS算法
LARS算法很好地解决了Lasso问题,其建立在前向选择
算法和前向梯度算法的基础上,逐步前进步长适中,降低计算
复杂度的同时又尽可能地保留了信息相关性。LARS算法的
基本步骤如下:
1)LARS算法判断自变量 与Y的相关度,用相关度最
大的 对Y进行逼近。
2)直到另一个 具有相同的对Y的相关度,即 =
,
此时开始从 与 的“角分线”方向 逼近Y。
3)同样的,当出现第三个 对Y相关度与 相同时,将
纳入到逼近队列中,选择三个向量共同的“角分线”方向
,,
进行新一轮逼近,此时“角分线”表示高维空间中各向量的
平分线。
4)逐步逼近直到残差小于某个阈值或所有自变量都参
与进逼近,算法结束。
图1中,两个自变量 。与 与因变量Y相关度I"x,,>rx
用 。进行逼近,直至 。与Y的残差和 。、 :的相关度相同,
2.1多维权重的IARS方法分析
在LARS逐步回归过程中,将所有入选变量视为同等重
要进行角回归,每次逼近选择与Y最大相关度 ,考虑到每个
回归变量 在回归模型中所占权重不同,即此指标在整体评
价中的相对重要程度不同,将自变量 与剩余变量的联合相
关度纳入考虑。每一次逼近,将xj与.),的相关度及 在整体指
标中所占重要程度同时作为选择逼近特征的条件。
对于 、 ,原LARS选择对Y逼近变量的条件是回归变
量对Y的相关度,此时由rx. > 将 。作为第一逼近变量;
我们将自变量xj对整个系统的贡献率作为逼近条件之一,此
时新的相关度为:
Rx = 抽 l (3)
其中: 为自变量 对系统的贡献率,计算方法将在下面详
细描述;//,、 为常数。将自变量对Y相关度与对系统的贡献率
的乘积作为逼近条件,必然会增加判断条件的值域,为了保留
系统逼近的稳定性,将乘积限制在某个值域范围内,即规定在
[ , ]内。
经过变换后,可能使自变量 的被选人性增加,如 变
换后向.),靠近 ,到达新的向量位 :; 。变换后向Y靠近0。,
到达新的向量位 。。也可能使自变量被选人性减小,如 。变
换后向Y偏移 ,到达新的向量位x” ,如图2所示。
图2加人多维权重后 与y的相关性变化
Fig.2 Correlation change of and Y after joining
multi-dimensional weight
在图2的基础上,采用新的相关度会对系统的逼近过程
有较大的改变。如图3所示,原初始逼近自变量为 ,前进
至/3 。位置时,出现与残差e=Y一/3 相关度相同的变量
2,
逼近方向改为 和 :的角分线,再前进/3:( ;4- :),完成
逼近过程。采用新的逼近条件后,逼近过程有了较大改变:此
时两个自变量被选人性改变,初始逼近自变量变为 ,前进
至JB :位置时, 。与残差P=Y一卢 2相关度相同,逼近
方向改为 和 :的角分线,再前进卢 ( 。+ ),完成逼近
过程。可以看出,逼近路径改变,回归变量 和卢 也随着改
变,得到改进回归方法下的新的回归变量组卢。
1676 计算机应用 第37卷
图3加入多维权重后的 前进方向
Fig.3 Approaching direction for after joining
multi-dimensional weight
将上述过程应用到多维高阶系统,将m个特性指标及n
个对象用矩阵表示为:
l1 l2
2l X21
: :
Xn =
● ●
(4)
ggil
: :
● ●
n1 n2
或者表示为:
X=[ … … ] (5)
则应变量lr用矩阵表示为:
Y=[Yl Y2…Y …Y r (6)
回归过程中, .有多种计算方法,本文采用以下三种权
重确定方法来控制回归过程。
1)主成分分析法。
统计学中,主成分分析(Principle Component Analysis,
PCA)借用正交变换进行降维 引,将数据变换到一个新的坐
标系统中,使数据投影的最大方差处于第一坐标(称为第一
主成分),第二方差处于第二坐标(称为第二主成分),依此类
推。变换后,保留了数据集的低阶主成分,忽略高阶主成分,
确定起支配作用的因素,通常保留总体信息利用率高于85%
的前m个主成分。借用主成分分析法的思想,同时保留所有
成分的评价值,确定每个成分的方差贡献率,算法步骤如下:
对样本进行如下标准化变换:
z = — ;i=1,
0
2,…,n, =1,2,…,m (7)
其中:
f =∑ n
? (8)
【 =∑( 一 ) /(n一1)
将相关系数矩阵R作为每个特征的信息利用率:
R=[ ]…=Z Z/(n一1) (9)
其中:
r =
∑z ・z /(n—1) (1O)
2)独立性权数法。
利用数据统计学中的多元回归方法,对特征的复相关系
数进行排序,复相关系数越大,所重复的信息越多,信息利用
率响应越小,权重越小。计算方式如下:
∑( 一 )( 一 )
可
’ J:1,2,…,m
其中: 为 中除去墨的剩余矩阵; 由式(12)求得。
X=mean( ) (12)
由R与权重为负比例关系,取复相关系数的倒数作为评
分,经归一化处理得到权重系数,最终的权重表示为:
R=[古忐… 1… ]. = ,z,…,m
(13)
3)CRITIC法。
在独立权数法的基础上,更进一步,基于Intereriteria相
关性的指标的重要度评价法(CRiteria Importance Though
Intercriteria Correlation,CRITIC)是由Diakoulaki[1 提出的一
种客观权重赋权法,它以确定指标的客观权数来评价指标间
的对比强度和冲突性为基础。标准差的大小表明在同一指标
内,各方案取值差距的大小,可用标准差表现对比强度;各指
标间的冲突性是以指标之间的相关性为基础,可用相关度表
示冲突性_ l。计算步骤如下:
第 个指标与其他指标的冲突性量化指标为:
∑(1一rfJ) (14)
其中,r ,表示评价指标 和 之间的相关系数:
:—  ̄/∑(
一
) ∑( 一 )
(15)
c,表示第J个指标所包含的信息量:
=
∑(1一r ); =1 2一,m (16)
c,越大,表示 个评价指标所包含的信息量越大¨ ,该
指标的重要性也就越大,则第 个指标的客观权重表示为:
=
/∑ ; =1,2,…,m (17)
以上所述三个方法得到权重后,将权重足集中化后表示
权重对前进方向的影响:
R =centralization( ,) (18)
2.2算法步骤
为获得稳定的数值解,对式(2)进行预处理和归一化,消
去常数 ,并使结果向量Y和自变量向量 :1,2,…,m)零
均值且z:范数归一。
定义指标集A={01xi1, ,…,sytxi ̄,…,sjkxi ̄} {1,2,
…
,
m},存在从 中选出的满足指标集A的列向量 ,使其与
Y同向。
Xa=[Sjl 1, ,…,sitxj ̄,…, ]∈R (I9)
其中 为符号变量:
r1, ( ,.),)>0
{0, ( ,Y)=0
(20)
L一1
,
( ,Y)<0
定义 中向量的“角分线”n :
r =
l :(1 t -1 )一手
(21)
l’.’^:AaG 1^
【 : w
第6期 陈善雄等:针对Lasso问题的多维权重求解算法 1677
其中:1 为长度为l A1 0所有元素为1的列向量; 是角分线
上的单位矢量;'., 可理解为选中的变量集
'.’ 进行加权处理。
中每个属性
3实验结果与分析
3.1数据集
对角分线的贡献度。为改变前进方向与前进变量的选择,对
进一步具体描述,初始逼近方向“。=0,且每次逼近产生
数据集采用美国约翰・霍普金斯大学应用物理实验室
(Applied Physics Laboratory,,I’}le Johns Hopkins University)提
新的U,假设上一步结束时算法的估计是 ,则C表示为当前
各自变向量与因变向量的相关度:
c=XT(y一 )或c,=( ,,Y一 ) (22)
取C=max{I c I}时的指标集A所对应的U 作为逼近
供的皮马印第安人糖尿病数据集(Pima Indians Diabetes Data
Set)[141。该数据记录了768个体征性能描述与糖尿病阴阳
性样本,包括8个属性变量和一个分类值,分类值中“1”表示
检测结果为阳性,…0表示检测结果为阴性。将8个不同属
方向,令:
s =sign{C};J∈A (23)
a= A或aj=( ,,U^> (24)
此时算法沿U 方向前进的长度为:
删 i{ , j) (25)
式中min上面的加号表示在此轮逼近中,只计算集合中正数
的最小值。每个A中的自变向量相应增加 '., ,同时加入权重
控制逼近方向:
=W× (26)
=
卢^ Tw (27)
其中 为从R 中取出的与W同维的权重矩阵。下一步前进方
向五 估计为:
+
= y (28)
之后需要引入新的元素:
A+=A u{ } (29)
其中 是为式(25)取最小值的 ,为了符合Lasso解要求与当
前逼近保持同向,在最早出现异号的步长为:
=min l_t ̄/wj} (30)
当 <y,存在异号,此时将相应的 从A中除去。至此算
法进入下一次逼近,用A+代替A重复上述步骤,直到残差足
够小或所有自变量都被使用过。算法描述如下。
输入自变量集x,因变量集y,误差项8;
输出 式(2)中的回归系数卢。
1)程序准备;
2)数据预处理,对x、y归一化;
3)初始化:逼近方向U:0,残差 =Y一 ;
4)c=巧;
)c
6)j=arg max{I cj ll,A= ;
7)R ighl=PCA(X)或 i咖=IW(X)或詹 i曲t=CRITIC(X)
8)集中化R ;
9)当II l I2< 且I A 1≤m执行循环;
1O)LARS循环中
rate=R 。iEhI(1:row( ),:);
W =W rate:
11)循环结束;
12)返回回归系数卢。
算法加入权重分析,增加了计算步骤,使得计算时间增
加,但统计模型中各自变向量与因变向量的前进机制不变,空
间复杂度与原算法保持一致。
性值作为输入自变量置,是否患病作为输出因变量y验证算
法,检测目标是在原EARS算法结果上对检测结果准确度加
以改进。
3.2验证条件
为了更直观地对本文提出的方法性能进行评估比较,本
文采用ROC睦线展示结果。参与者糖尿病检测阴阳性为二
元分类问题,检测的结果有以下四种类型:
1)真阳性(True Positive,TP):检测为阳性,实际上也为
阳性。2)伪阳性(False Positive,FP):检测为阳性,实际却为
阴性。3)真阴性(True Negative,TN):检测为阴性,实际上也
为阴性。4)伪阴性(False Negative,FN):检测为阴性,实际却
为阳性。
通过ROC空间四个基础类型统计,P表示正例,Ⅳ表示
负例,采用以下三个性质作为检查标准:
1)准确度(ACCuracy,ACC):
ACC=(TP+ Ⅳ)/(P+Ⅳ)
2)真阴性率(True Positive Ratio,TPR):
TPR=TP/P=TP/r TP+FN)
3)阴性预测值(Negative Predictive Value,NPV):
NPV=TN/(TN+FN、
3.3实验结果
对于阈值t,从0开始以0.01为步长进行增加至1,以阴
阳性为因变量,8个属性特征性能值为自变量,绘出准确度、
阳性预测值、真阴性率的变化曲线。
图4展示了在Pima Indians Dibaetes数据集下,Lasso算
法每轮循环后准确度以及Lasso算法每轮循环后的三项检查
指标的综合最优值。
NPV表示检测为阳性的人中实际为阳性即检测正确的
比例,图4中显示,加人权重后Lasso解法的NPV均有所提
高,其中,加入主成分分析后NPV提高5.16个百分点,采用
独立权数法NPV提高5.58个百分点,采用CRITIC法NPV提
高5.1个百分点。
与NPV相比较,真阴性率(TPR)又称命中率,表示检测
为阳性的人中检测正确的比例。图4中显示,PCA对算法前
进方向的改变使得TPR提高13个百分点,独立权数法使
TPR提高14个百分点,CRITIC使TPR提高13个百分点。
准确度(ACC)表示在因变量阳性和阴性的总和中,经
Lasso求解判断正确的个体点的个数,即检测为阳性、实际也
阳性与检测为阴性、实际也为阴性的人数的总和,可以看出,
加入主成分分析使得ACC增加了0.32个百分点,加人
CRITIC法对ACC无影响,加入独立权数法后的Lasso解法使
l678 计算机应用 第37卷
得ACC提高了0.32个百分点,三个方法都使ACC保持不变
或有所提高。
综合以上三个指标,可以发现加入多维度权重的前进方
向后,系统最优解的阈值减小,代表系统回归系数绝对值之和
法每轮循环因变量与角分线方向的残量的平方和(Sum of
Squared Residuals,SSR),而SSR平稳的转折点就对应了
遥盛
l 0 0 0 O O 0 0 0 0 0
Lasso在Pima Indians Diabetes数据集中进行回归的最佳自变
0 9 8 7 6 5 4 3 2 l 0
量系数。
小于某一更小的阈值,即在更苛刻的阈值范围内满足要求。
t
(a)标准的LARS的检测效果
r
(b)采用PCA作为LARS权重确定方法的检测效果
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
f
(c)采用独立性权数法作为LARS权重确定方法的检测效果
t
(d)采用CRITIC法作为LARS权重确定方法的检测效果
图4不同检测标准曲线
Fig.4 Curves of different detection standards
图5展示了在Pima Indians Diabetes数据集下,Lasso算
7.5
7.0
6.5
6.O
5.5
5.0
4.5
4.0
3.5
0 0 0.1 0.2 0.3 0.4 0.5 o.6 0.7 o.8 0.9 1.0
t
(a)标准的LARS方法
t
(b)采用PCA作为LARS权重确定的方法
7・5
7.0
6・5
6.0
受5.5
们
5・O
4-5
4.O
3.5
0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
f
(c)采用独立性权数法作为LARS权重确定的方法
7.5
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
t
(d)采用CRITIC法作为LARS权重确定的方法
图5 因变量与角分线方向的残量的平方曲线
Fig.5 Curve of the sum of squared residuals for dependent
variable and angle bisector direction
由图5可以看出,加入不同权重判定后,SSR的整体走向
完全一致,且最佳系数处对应的残量基本保持一致,加入权重
第6期 陈善雄等:针对Lasso问题的多维权重求解算法 1679
后不会改变Lasso解法原有的优点。最佳自变量系数有明显
的增大,此时所对应的因变量与角分线方向的残量有所变化,
其中:加入主成分分析法的Lasso解法增加了5.1个百分点
的残量,加入独立权数法降低了2.1个百分点的残量,加入
CRITIC法降低了2.1个百分点的残量,即加人独立权数法和
CRITIC法后最后的回归结果更接近真实因变量。
综合以上指标,加入独立权数法后Lasso解的准确性最
高,其次是CRITIC法和主成分分析法。加入权重通过改变回
归系数方向提高解准确性,表1展示了原始的回归系数 以
及加入主成分分析法后的卢一PCA,加入独立权数法后的
卢一IW,加入CRITIC法后的卢一CRITIC。从表1中可以看出,
卢一IW对应的回归系数相对于原始回归系数有一定减小,取值
区间变窄,但其收敛性没有改变,而且从图5中可以看出,其
回归结果更加准确。
表1不同方法回归系数
Tab.1 Regression coeficientfs of diferent methods
the Optical Society of America A。——Optics Image Science and Vi-
4 结语
本文针对Lasso问题的解法即LARS算法的选择变量与
前进方向过程,提出了基于多维权重的LARS算法,提高了
Lasso问题解的准确性,并且保持原Lasso的参数估计具有稳
定的回归系数、较少参数数量的同时具有较好的参数收敛一
致性,并采用Ptma Indians Diabetes数据集验证算法的有效
性。由于自变量集维数较大,计算权重的准确度存在瑕疵,因
此以后研究中需要进一步优化嵌入的确定权重的算法,以提
sion,2013,30(1):13—21.
J.Forecasting stock market indexes using prinei—
[9]
WANG J,WANG
pie component analysis and stochastic time effective neurl netaworks
[J].Neurocomputing,2015,156:68—78.
S L.Determi-
【10】
DIAKOULAK1 D,MAVROTAS G,PAPAYANNAKI
ning objective weights in multiple criteria problems:the CRITIC
method[J】.Computers&Operations Research,1995,22(7):763
—
770.
升回归算法在利用权重改变前进变量和前进方向选择时的精
度和准确度。
ALHAMZAWI R,YU K M.Bayesian Lasso—mixed quantile regres—
sion【J].Journal of Statistical Computation and Simulation,2014,
84(4):868—880.
参考文献(References)
【1] 马景义,张辛连,苏治,等.广义线性模型组LASSO路径算法
【J】.中国科学:数学,2015,45(10):1725—1738.(MA J Y,
ZHANG X L,SU Z,et a1.An algorithm for the estimation of regu—
larization paths of generalized linear models with group LASSO pen—
[12】 KAUL A.Lasso with long memory regression e ̄ors[J】.Journal of
Statistical Planning and Inference。2014,153:1 1—26.
ve decision—making approach based
【13]
U L H.MO R.A comprehensi
on hierarchical attirbute model for information fusion algorithms’
alty【J].SCIENTIA SINICA Mathematica,2015,45(10):1725—
1738.)
【2】 FRANK I E,FRIEDMAN J H.A statistical view of some chemomet—
performance evaluation[J].Mathematical Problems in Engineer-
ing,2014,2014:Article ID 124156.
[14】 BACHE K,LICHMAN M.UCI machine learning repository【DB/
OL】.1rvine,CA:University of Caliorfnia.【2016—09-20].ht-
tp://archive.ics.uci.edu/m1.
ries regression tools【J】.Technometrics,1993,35(2):109—135.
【3】 BREIMAN L.Better subset regression using the nonnegative garrote
【J】.Technometrics,1995,37(4):373—384.
[4]TIBSHIRANI R.Regression shrinkage and selection via the Lasso
hiTs work is partilly saupported by the National Natural Science Foun—
【J].Journal of he Royatl Statistical Society.Series B(Methodologi—
ca1),1996,58(1):267—288.
【5] EFRON B,HASTIE T,JOHNSTONE I,et a1.Least angle regres・
sion[J】.The Annals of Statistics,2004,32(2):407—499.
dation of China(61303227),the Plan of Guizhou Provincial Science and
Technology Talents in Universities(KEHE KY[2016】098),the Joint
Fund of Guizhou Science and Technology Agency(KEHE LH【2016】
7053).
[6】 李锋,盖玉洁,卢一强.测量误差模型的自适应LASSO变量选择
方法研究【J].中国科学:数学,2014,44(9):983—1006.(LI F,
GAI Y J,Lu Y Q.Adaptive LASSO for measurement error models
[J].SCIENTIA SINICA Mathematica,2014,44(9):983—1006.)
【7】 MARAHIEL M A.Introducing Lasso peptides as a moleculr seafa-
CI-IEN Shanxiong,born in 1981,Ph.D.,associate professor.His
research interests include compressed sensing,anomaly detection,pattern
recognition.
LIU Xiaojuan,born in 1990,M.S.,assistnt.Hera research inter-
ests include pattern recognition,neural network.
CHEN Chunrong,born in 1995,M.S.candidate.Her research
interest include data mining,intelligent ifornmation processing.
fold for drug design[J].Journal of Peptide Science,2014,20:¥27
一
S28.
【8】 SHAHBEIG S,POURGHASSEM H.Fast and automatic algorithm
or optfic disc extraction in retinal images using principle--component・・ ZHENG Fangyuan,born in 1994,M.S.candidate.His research
interest include anomaly detection,network security.
nalysias—based preproeessing and eurvelet transform[J】. Journal of
版权声明:本文标题:针对Lasso问题的多维权重求解算法 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://roclinux.cn/p/1713179514a622735.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论