admin 管理员组

文章数量: 1184232


2024年4月15日发(作者:concatente函数的操作)

数据库技术

Data Base Technique

基于Lasso和模糊互信息多标记特征选择算法

文/孟金彪 钱萌 李存志 翟静波

空间的模糊互信息,根据模糊互信息的大小对

本文提出一种基于Lasso和

特征依次进行排序,得出最终特征子集。通过

模糊互信息多标记特征选择算法。

本文所提的算法在6个多标记数

实验结果表明本文算法是有效的。

据集上进行了测试,实验结果和

统计假设检验说明本文算法是有

1 模糊信息熵

效的。

定义1假设样本空间的描述记为论域U,

论域U可根据某种特征属性进行划分,假设

根据特征属性对论域U进行划

【关键词】多标记学习 模糊互信息 Lasso算

分记,则模糊信息熵定

法 特征选择

义如下:

多标记学习广泛应用于机器学习、人工

(1)

智能等方面。在多标记学习中,数据集往往具

有高维性和高冗余性等特点,从而导致维数灾

其中E(X)为模糊熵,公式(2)中表

难。特征选择作为一种有效的降维方式,其通

示在论域U中等价类X

i

的概率,

过删除冗余或不相关特征来提高分类模型精度

的目的。

表示在论域U中的X

i

的互补概率。

目前,众多学者已提出多种效果较优的

定义2类似的,模糊互信息定义为:

特征选择算法。例如Lee等提出了基于多变量

互信息的多标记特征选择算法(PMU)。Lin

(2)

等提出了基于邻域互信息的多标记特征选择算

2 结合Lasso与模糊互信息的特征选择算

法。

然而,上述特征选择算法在选择特征子

集时都有计算开销过大的问题。为解决该问

2.1 基于Lasso算法的特征降维

题,近年来,一种基于线性回归模型的降维方

法-Lasso算法,其因高效的性能在特征选择

Lasso算法是一种同时进行特征选择和正

领域得到了广泛的关注。Lasso通过对变量进

则化的线性回归分析方法,其基本思想是在回

行选择和压缩来降低原始特征空间的维度,该

归系数绝对值之和小于一个阈值的条件下,使

算法的基本思想是在构建线性回归模型时,其

残差平方和最小化,将相关性较低的变量的系

回归系数绝对值之和小于一个阈值的约束条件

数压缩为0,然后删除这些特征变量,从而达

下,使绝对值较小的回归系数自动压缩为0,

到降低特征空间维度的目的。另外,Lasso算

从而得到可解释的模型。另外,在常见的特征

法还能有效的防止过拟合问题。针对多标记学

选择算法中,主要利用传统熵方法来判断特征

习,Lasso构造的函数如下:

与标记空间之间的相关性。但传统信息熵不具

有补的性质,因此,用模糊信息替代传统信息

(3)

熵。在选择特征子集的过程中,为了提高分类

式(3)中,是控制稀疏矩阵

性能的同时并缩减算法计算开销过大的问题,

的参数,Lasso回归是一个

本文首先利用Lasso算法对特征空间降维,求

凸优化问题,但由于其是通过1范式构造的惩

解出每个特征在每个标记下的回归系数,系数

罚函数,因此稀疏矩阵不能直接求解。本论文

为0所对应的特征都视其为冗余特征并将其删

中,将用交替方向乘子法(ADMM)来将式(3)

除,得出新的特征空间。然后结合模糊信息熵

转换为2个子问题求解,式(3)可以利用拉

对新的特征空间中所有特征分别计算其与标记

格朗日形式重新构造为:

●基金项目:基于步态触觉特征的身份识别(2)资助。

186 •

电子技术与软件工程

本文标签: 特征 数据 算法 进行 实验室

更多相关文章

告别繁琐操作:智能的DBF查看器让数据更清晰可见

2月前

简介:DBF文件是一种早期的桌面数据库文件格式,广泛应用于如FoxPro等系统。DBF查看器是一款工具,使用户无需依赖原始数据库软件即可打开和浏览DBF文件内容。它具备多种功能,包括文件打开、浏览记录、字段信息查看、搜索与过滤、编辑数

进阶指南:让DBF查看器成为你数据分析的好帮手

2月前

简介:DBF文件是一种早期的桌面数据库文件格式,广泛应用于如FoxPro等系统。DBF查看器是一款工具,使用户无需依赖原始数据库软件即可打开和浏览DBF文件内容。它具备多种功能,包括文件打开、浏览记录、字段信息查看、搜索与过滤、编辑数

轻松掌握:基于CSDN的SWF安全加密与管理方法

2月前

最近开发一个手机上的类似于保险箱的功能,就是把选择某个文件然后这个文件就加密起来了,在普通的文件管理器中无法显示。 下面简单介绍下思路,在做这个功能之前,参考很多Android市场上的成熟产品,( 不过话说起来,如果不

CSND高手谈:高效实现文件加密与存储的实用技巧

2月前

最近开发一个手机上的类似于保险箱的功能,就是把选择某个文件然后这个文件就加密起来了,在普通的文件管理器中无法显示。 下面简单介绍下思路,在做这个功能之前,参考很多Android市场上的成熟产品,( 不过话说起来,如果不

告别BIOS限制,跨越RSDT内存束缚:过年教你玩转免激活的OEM Vista系统

2月前

顶一下,贴上我最近在看雪写的文章 标 题: 【原创】不修改Bios完成OEM版Vista系统免激活作 者: 火翼[CCG] 时 间:

提高SSD性能的秘密武器:4K对齐技术详解

2月前

转载至: 一、什么是4K对齐 固态硬盘和机械硬盘不同,固态硬盘的日常流程是【读】→【擦】→【写】。简而言之就是SSD不能覆盖存储区的数据,它先把原数据擦除,然后再写入新数据。最小的读写单位被称为“页”、最小的擦除单位被

一文读懂:深入剖析bin、hex及axf格式,揭秘它们在嵌入式开发领域的奥秘

2月前

嵌入式开发必懂:bin、hex、axf格式的核心区别与应用场景 你有没有想过,当你把程序下载到单片机时,那些后缀名不同的文件(.bin、.hex、.axf)到底藏着什么秘密?为什么同样的代码会生成不同格式的文件?今天就来扒开这

从新手到精通:Python中临时存储用'temp'

2月前

在Python中,temp是一个常见的命名约定,通常用于表示临时变量或临时存储数据的变量。"temp"一词是"temporary"的缩写,意味着它只是用于暂时存储数据,而不是长期使用。 在编程

深入浅出:了解Python中temp变量在代码逻辑中的角色

2月前

在Python中,temp是一个常见的命名约定,通常用于表示临时变量或临时存储数据的变量。"temp"一词是"temporary"的缩写,意味着它只是用于暂时存储数据,而不是长期使用。 在编程

全面解读NRG文件:Adobe Flash Player助力编程大法

2月前

NRG 文件是光盘映像文件的一种,通常用于存储光盘的完整副本,包括数据、文件系统和光盘的结构。在本文中,我将向您介绍如何打开和编程处理 NRG 文件。 要处理 NRG 文件,您可以使用开源的工具或库来读取和提取其中的数据。下面

一文掌握:利用Windows剪贴板与clipbrd工具提升工作生产力的实战指南

2月前

简介:Windows剪贴板是操作系统中用于不同程序间传递信息的核心组件。本文将介绍其基本概念、格式多样性、clipbrd工具的功能及使用方法,以及HTML FORMAT与剪贴板的交互。剪贴板工具对于开发者、故障排查和用户体验研究等场景

提升电脑性能:通过删除pagefile.sys和hiberfil.sys释放C盘空间

2月前

通过移除 pagefile.sys 和 hiberfil.sys 文件释放C盘空间(不推荐) 点击查看 -> 选项 -> 文件夹选项 -> 查看, 取消勾选 “ 隐藏受保护的操作系统文件(推荐)” ,选择“显示

C盘空间紧张?试试删除pagefile.sys和hiberfil.sys来释放空间

2月前

通过移除 pagefile.sys 和 hiberfil.sys 文件释放C盘空间(不推荐) 点击查看 -> 选项 -> 文件夹选项 -> 查看, 取消勾选 “ 隐藏受保护的操作系统文件(推荐)” ,选择“显示

猫与宽带:在家庭网络中,两者的角色与作用,谁更关键?

2月前

1. 猫猫的作用是为了能够转接不同介质的网络信号,比如说将ADSL,光纤,有线等不同的网络信号通过猫来转变成为标准的电脑网络信号。猫叫正名叫【调制解调器】, 电脑通过它才能拨号上网。如图就是典型的猫 特

012-XMP数据处理:打造Adobe Flash Player内核的XMP架构

2月前

012-XMP数据处理 学习目标 通过本章学习,你将掌握:XMP标准理解 XMP元数据架构和结构 XMP命名空间和属性定义 XMP与其他元数据

XMP数据处理指南:探索Adobe Flash中心的SWF文件基本架构

2月前

012-XMP数据处理 学习目标 通过本章学习,你将掌握:XMP标准理解 XMP元数据架构和结构 XMP命名空间和属性定义 XMP与其他元数据

SayRecy数据恢复,轻松解救你的电脑数据危机!

1月前

在我们日常清理电脑时,有时会意外删除一些有用的文件,比如重要文件、照片等。这时就需要使用数据恢复软件尝试恢复数据。 EasyRecovery是一款强大有效实现数据恢复的软件,软件占用空间小,就算你是XP系统也能轻松驾驭。界面简

移动硬盘不再担忧!揭秘简单加密步骤,保护个人数据

1月前

在工作中,我们经常需要使用移动硬盘来保存重要数据,但是这样却不能保护重要数据的安全。所以,我们可以使用加密来保护移动硬盘。那么,移动硬盘要怎么加密呢?U盘超级加密3000 U盘超级加密3000是一款

深入I.MX6U:Linux启动方式的实战指南

1月前

第九章I.MX6U启动方式详解 I.MX6U支持多种启动方式以及启动设备,比如可以从SDEMMC、NAND Flash、QSPI Flash等启动。用户可以根据实际情况,选择合适的启动设备。不同的启动方式其启动方式和启动要求

从零开始,I.MX6U上Linux的启动流程详解,助你顺利上手

1月前

第九章I.MX6U启动方式详解 I.MX6U支持多种启动方式以及启动设备,比如可以从SDEMMC、NAND Flash、QSPI Flash等启动。用户可以根据实际情况,选择合适的启动设备。不同的启动方式其启动方式和启动要求

发表评论

全部评论 0
暂无评论