admin 管理员组文章数量: 1184232
2024年4月15日发(作者:concatente函数的操作)
数据库技术
•
Data Base Technique
基于Lasso和模糊互信息多标记特征选择算法
文/孟金彪 钱萌 李存志 翟静波
空间的模糊互信息,根据模糊互信息的大小对
本文提出一种基于Lasso和
摘
特征依次进行排序,得出最终特征子集。通过
模糊互信息多标记特征选择算法。
要
本文所提的算法在6个多标记数
实验结果表明本文算法是有效的。
据集上进行了测试,实验结果和
统计假设检验说明本文算法是有
1 模糊信息熵
效的。
定义1假设样本空间的描述记为论域U,
论域U可根据某种特征属性进行划分,假设
根据特征属性对论域U进行划
【关键词】多标记学习 模糊互信息 Lasso算
分记,则模糊信息熵定
法 特征选择
义如下:
多标记学习广泛应用于机器学习、人工
(1)
智能等方面。在多标记学习中,数据集往往具
有高维性和高冗余性等特点,从而导致维数灾
其中E(X)为模糊熵,公式(2)中表
难。特征选择作为一种有效的降维方式,其通
示在论域U中等价类X
i
的概率,
过删除冗余或不相关特征来提高分类模型精度
的目的。
表示在论域U中的X
i
的互补概率。
目前,众多学者已提出多种效果较优的
定义2类似的,模糊互信息定义为:
特征选择算法。例如Lee等提出了基于多变量
互信息的多标记特征选择算法(PMU)。Lin
(2)
等提出了基于邻域互信息的多标记特征选择算
2 结合Lasso与模糊互信息的特征选择算
法。
法
然而,上述特征选择算法在选择特征子
集时都有计算开销过大的问题。为解决该问
2.1 基于Lasso算法的特征降维
题,近年来,一种基于线性回归模型的降维方
法-Lasso算法,其因高效的性能在特征选择
Lasso算法是一种同时进行特征选择和正
领域得到了广泛的关注。Lasso通过对变量进
则化的线性回归分析方法,其基本思想是在回
行选择和压缩来降低原始特征空间的维度,该
归系数绝对值之和小于一个阈值的条件下,使
算法的基本思想是在构建线性回归模型时,其
残差平方和最小化,将相关性较低的变量的系
回归系数绝对值之和小于一个阈值的约束条件
数压缩为0,然后删除这些特征变量,从而达
下,使绝对值较小的回归系数自动压缩为0,
到降低特征空间维度的目的。另外,Lasso算
从而得到可解释的模型。另外,在常见的特征
法还能有效的防止过拟合问题。针对多标记学
选择算法中,主要利用传统熵方法来判断特征
习,Lasso构造的函数如下:
与标记空间之间的相关性。但传统信息熵不具
有补的性质,因此,用模糊信息替代传统信息
(3)
熵。在选择特征子集的过程中,为了提高分类
式(3)中,是控制稀疏矩阵
性能的同时并缩减算法计算开销过大的问题,
的参数,Lasso回归是一个
本文首先利用Lasso算法对特征空间降维,求
凸优化问题,但由于其是通过1范式构造的惩
解出每个特征在每个标记下的回归系数,系数
罚函数,因此稀疏矩阵不能直接求解。本论文
为0所对应的特征都视其为冗余特征并将其删
中,将用交替方向乘子法(ADMM)来将式(3)
除,得出新的特征空间。然后结合模糊信息熵
转换为2个子问题求解,式(3)可以利用拉
对新的特征空间中所有特征分别计算其与标记
格朗日形式重新构造为:
●基金项目:基于步态触觉特征的身份识别(2)资助。
186 •
电子技术与软件工程
版权声明:本文标题:基于Lasso和模糊互信息多标记特征选择算法 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://roclinux.cn/p/1713179562a622737.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
更多相关文章
小技巧大用处:一招搞定Vista OEM系统免激活,避开内存和BIOS误区
顶一下,贴上我最近在看雪写的文章 标 题: 【原创】不修改Bios完成OEM版Vista系统免激活作 者: 火翼[CCG] 时 间:
嵌入式系统通讯指南:从IIC到SPI,一文带你领略数据传输的魅力
本文简单的描述了在实际应用中会碰到的一些总线协议,让各位读者对实际系统中的总线有个概念上的理解。 一、I2C I2C(Inter - Integrated Circuit)
删除无回头路?3招拯救你刚清空的回收站,快快学起来!
“每个人都有手滑失误的瞬间,而我的这个瞬间恰好发生了清空回收站。回收站清空后我的文件还能够找回来吗?请大家给我支支招,非常感谢。” 回收站是每一部电脑都会有的一个系统文件夹,它是电脑删除文件数据的“审判所”,除了文件被执行了永
Hex与Bin的奇妙之旅:转换技巧全揭秘
大家好,我是学电子的小白白。 熟悉单片机开发的朋友,应该经常见到*.hex后缀的文件,它是单片机和嵌入式工程编译输出的一种常见的目标文件格式(比如keil就能编译输出hex文件),通过烧写工具把它下载到单片机中,程序就能在芯片
NRG文件编辑之旅:从基础知识到进阶技能全面梳理
NRG 文件是光盘映像文件的一种,通常用于存储光盘的完整副本,包括数据、文件系统和光盘的结构。在本文中,我将向您介绍如何打开和编程处理 NRG 文件。 要处理 NRG 文件,您可以使用开源的工具或库来读取和提取其中的数据。下面
全面解读NRG文件:Adobe Flash Player助力编程大法
NRG 文件是光盘映像文件的一种,通常用于存储光盘的完整副本,包括数据、文件系统和光盘的结构。在本文中,我将向您介绍如何打开和编程处理 NRG 文件。 要处理 NRG 文件,您可以使用开源的工具或库来读取和提取其中的数据。下面
SSD基础知识大汇总:理解硬盘读写原理,掌握FTL、TRIM与写入放大效应
前言 大家好,我是jiantaoyab,本篇文章我们来看看SSD硬盘和FTL、磨损均衡,SSD 硬盘,适合读多写少的应用,使用寿命受限于可以擦除的次数。 SSD 的读写原理 SSD 没有像机械硬盘那样的寻道过程
SSD硬盘操作秘籍:深入了解SSD内部的读写逻辑、认识FTL并掌握TRIM优化技巧
前言 大家好,我是jiantaoyab,本篇文章我们来看看SSD硬盘和FTL、磨损均衡,SSD 硬盘,适合读多写少的应用,使用寿命受限于可以擦除的次数。 SSD 的读写原理 SSD 没有像机械硬盘那样的寻道过程
ASF文件格式揭秘:掌握与Adobe Flash Player的完美合作
了解ASF文件格式对于开发人员在处理多媒体文件时非常重要。ASF代表"Advanced Systems Format",是一种由Microsoft开发的多媒体容器格式,用于存储和传输音频和视频数据。在本指南中,我们将深入
解锁ZIP压缩包的加密技术:让隐私安全有保障
ZIP 加密压缩文件的原理主要围绕 数据压缩和 加密保护两个核心环节展开,通过将文件压缩后再加密,既节省存储空间,又能防止未授权访问。以下是具体原理的详细解析: 一、数据压缩:减
SayRecy数据恢复,轻松解救你的电脑数据危机!
在我们日常清理电脑时,有时会意外删除一些有用的文件,比如重要文件、照片等。这时就需要使用数据恢复软件尝试恢复数据。 EasyRecovery是一款强大有效实现数据恢复的软件,软件占用空间小,就算你是XP系统也能轻松驾驭。界面简
智能提取:VLOOKUP跨表数据检索的高效实践指南
说明我下面简单说明匹配数据,详细使用方式也可以参考下面文库哈EXCEL表中如何利用VLOOKUP将2张工作表的数据匹配? countif 方式1 A列数据在B列中出现的次
Canon CR2图片的神秘IFD0:揭示RAW格式的隐藏细节
首先是8个字节的文件头。 CR2的前2个字节是"II",代表INTEL格式的存储顺序,即低字节在前,高字节在后。 接下来是固定的2个字节:0x2a00。 最后的4个字节的整数是指向第一个IFD(I
即时更新:厂里Flash中心的最热文章,深度剖析Adobe Flash Player的前沿技术
1 今日内容 1.1 定时计算与实时计算 1.2 今日内容 kafkaStream 什么是流式计算 kafkaStream概述 kafkaStream入门案例
机械硬盘损坏,数据还能起死回生吗?揭秘数据恢复秘籍
电脑硬盘坏了数据可以恢复吗?对于这种问题,还需要具体问题具体分析的,一般是可以恢复。 硬盘损坏可以分为物理损坏和逻辑损坏两种情况: 1.逻辑损坏 这通常是由于软件问题,如文件系统错误、病毒攻击、误删除、格式化等
Windows应用数据开发实战:Windows 8环境下轻松上手
一、Application Data简介Applicaion Data相当于桌面应用的注册表,存储一些用户配置信息,如运行时状态,用户喜好等,需要注意的时, 当卸载应用时,这些数据会被删除,所以不要存储重要数
深入Windows Phone 8.1应用设置:LocalSettings与ApplicationDataContainer的实战应用
最近正好有机会看到林政老师的Windows Phone 8,1的书,正好我平时都是基于用户控件之类的写写使用收获,虽然 编程中基本上都用过应用数据之类的知识,但是一直没整理过,知识越来越多,东西也越来越杂,有时候过
Windows应用数据揭秘:在Windows 8开发中构建个性化应用程序
一、Application Data简介Applicaion Data相当于桌面应用的注册表,存储一些用户配置信息,如运行时状态,用户喜好等,需要注意的时, 当卸载应用时,这些数据会被删除,所以不要存储重要数
启动之路:深入ARM I.MX6ULL的内部机制 - 内部BOOT ROM、IVT、Boot Data、DCD与led.bin揭秘
参考:Linux之ARM(IMX6U)裸机之I.MX6ULL镜像烧写以及启动头文件的详解作者:一只青木呀发布时间: 2020-08-09 17:10:00网址:BOOT R
基于Matlab的MDF文件导入与处理研究_matlabmdf格式数据处理
摘要 本文围绕MDF文件格式展开全面研究,系统阐述了MDF文件的基本结构与数据块概念,深入探讨了在Matlab环境下导入和处理这些文件的理论与实践方法。首先,介绍了MDF文件在现代工业和汽车电子领域的应用背景及重要意义。接着,
发表评论