admin 管理员组

文章数量: 1184232


2024年4月15日发(作者:concatente函数的操作)

数据库技术

Data Base Technique

基于Lasso和模糊互信息多标记特征选择算法

文/孟金彪 钱萌 李存志 翟静波

空间的模糊互信息,根据模糊互信息的大小对

本文提出一种基于Lasso和

特征依次进行排序,得出最终特征子集。通过

模糊互信息多标记特征选择算法。

本文所提的算法在6个多标记数

实验结果表明本文算法是有效的。

据集上进行了测试,实验结果和

统计假设检验说明本文算法是有

1 模糊信息熵

效的。

定义1假设样本空间的描述记为论域U,

论域U可根据某种特征属性进行划分,假设

根据特征属性对论域U进行划

【关键词】多标记学习 模糊互信息 Lasso算

分记,则模糊信息熵定

法 特征选择

义如下:

多标记学习广泛应用于机器学习、人工

(1)

智能等方面。在多标记学习中,数据集往往具

有高维性和高冗余性等特点,从而导致维数灾

其中E(X)为模糊熵,公式(2)中表

难。特征选择作为一种有效的降维方式,其通

示在论域U中等价类X

i

的概率,

过删除冗余或不相关特征来提高分类模型精度

的目的。

表示在论域U中的X

i

的互补概率。

目前,众多学者已提出多种效果较优的

定义2类似的,模糊互信息定义为:

特征选择算法。例如Lee等提出了基于多变量

互信息的多标记特征选择算法(PMU)。Lin

(2)

等提出了基于邻域互信息的多标记特征选择算

2 结合Lasso与模糊互信息的特征选择算

法。

然而,上述特征选择算法在选择特征子

集时都有计算开销过大的问题。为解决该问

2.1 基于Lasso算法的特征降维

题,近年来,一种基于线性回归模型的降维方

法-Lasso算法,其因高效的性能在特征选择

Lasso算法是一种同时进行特征选择和正

领域得到了广泛的关注。Lasso通过对变量进

则化的线性回归分析方法,其基本思想是在回

行选择和压缩来降低原始特征空间的维度,该

归系数绝对值之和小于一个阈值的条件下,使

算法的基本思想是在构建线性回归模型时,其

残差平方和最小化,将相关性较低的变量的系

回归系数绝对值之和小于一个阈值的约束条件

数压缩为0,然后删除这些特征变量,从而达

下,使绝对值较小的回归系数自动压缩为0,

到降低特征空间维度的目的。另外,Lasso算

从而得到可解释的模型。另外,在常见的特征

法还能有效的防止过拟合问题。针对多标记学

选择算法中,主要利用传统熵方法来判断特征

习,Lasso构造的函数如下:

与标记空间之间的相关性。但传统信息熵不具

有补的性质,因此,用模糊信息替代传统信息

(3)

熵。在选择特征子集的过程中,为了提高分类

式(3)中,是控制稀疏矩阵

性能的同时并缩减算法计算开销过大的问题,

的参数,Lasso回归是一个

本文首先利用Lasso算法对特征空间降维,求

凸优化问题,但由于其是通过1范式构造的惩

解出每个特征在每个标记下的回归系数,系数

罚函数,因此稀疏矩阵不能直接求解。本论文

为0所对应的特征都视其为冗余特征并将其删

中,将用交替方向乘子法(ADMM)来将式(3)

除,得出新的特征空间。然后结合模糊信息熵

转换为2个子问题求解,式(3)可以利用拉

对新的特征空间中所有特征分别计算其与标记

格朗日形式重新构造为:

●基金项目:基于步态触觉特征的身份识别(2)资助。

186 •

电子技术与软件工程

本文标签: 特征 数据 算法 进行 实验室

更多相关文章

小技巧大用处:一招搞定Vista OEM系统免激活,避开内存和BIOS误区

2月前

顶一下,贴上我最近在看雪写的文章 标 题: 【原创】不修改Bios完成OEM版Vista系统免激活作 者: 火翼[CCG] 时 间:

嵌入式系统通讯指南:从IIC到SPI,一文带你领略数据传输的魅力

2月前

本文简单的描述了在实际应用中会碰到的一些总线协议,让各位读者对实际系统中的总线有个概念上的理解。 一、I2C I2C(Inter - Integrated Circuit)

删除无回头路?3招拯救你刚清空的回收站,快快学起来!

2月前

“每个人都有手滑失误的瞬间,而我的这个瞬间恰好发生了清空回收站。回收站清空后我的文件还能够找回来吗?请大家给我支支招,非常感谢。” 回收站是每一部电脑都会有的一个系统文件夹,它是电脑删除文件数据的“审判所”,除了文件被执行了永

Hex与Bin的奇妙之旅:转换技巧全揭秘

2月前

大家好,我是学电子的小白白。 熟悉单片机开发的朋友,应该经常见到*.hex后缀的文件,它是单片机和嵌入式工程编译输出的一种常见的目标文件格式(比如keil就能编译输出hex文件),通过烧写工具把它下载到单片机中,程序就能在芯片

NRG文件编辑之旅:从基础知识到进阶技能全面梳理

2月前

NRG 文件是光盘映像文件的一种,通常用于存储光盘的完整副本,包括数据、文件系统和光盘的结构。在本文中,我将向您介绍如何打开和编程处理 NRG 文件。 要处理 NRG 文件,您可以使用开源的工具或库来读取和提取其中的数据。下面

全面解读NRG文件:Adobe Flash Player助力编程大法

2月前

NRG 文件是光盘映像文件的一种,通常用于存储光盘的完整副本,包括数据、文件系统和光盘的结构。在本文中,我将向您介绍如何打开和编程处理 NRG 文件。 要处理 NRG 文件,您可以使用开源的工具或库来读取和提取其中的数据。下面

SSD基础知识大汇总:理解硬盘读写原理,掌握FTL、TRIM与写入放大效应

2月前

前言 大家好,我是jiantaoyab,本篇文章我们来看看SSD硬盘和FTL、磨损均衡,SSD 硬盘,适合读多写少的应用,使用寿命受限于可以擦除的次数。 SSD 的读写原理 SSD 没有像机械硬盘那样的寻道过程

SSD硬盘操作秘籍:深入了解SSD内部的读写逻辑、认识FTL并掌握TRIM优化技巧

2月前

前言 大家好,我是jiantaoyab,本篇文章我们来看看SSD硬盘和FTL、磨损均衡,SSD 硬盘,适合读多写少的应用,使用寿命受限于可以擦除的次数。 SSD 的读写原理 SSD 没有像机械硬盘那样的寻道过程

ASF文件格式揭秘:掌握与Adobe Flash Player的完美合作

1月前

了解ASF文件格式对于开发人员在处理多媒体文件时非常重要。ASF代表"Advanced Systems Format",是一种由Microsoft开发的多媒体容器格式,用于存储和传输音频和视频数据。在本指南中,我们将深入

解锁ZIP压缩包的加密技术:让隐私安全有保障

1月前

ZIP 加密压缩文件的原理主要围绕 数据压缩和 加密保护两个核心环节展开,通过将文件压缩后再加密,既节省存储空间,又能防止未授权访问。以下是具体原理的详细解析: 一、数据压缩:减

SayRecy数据恢复,轻松解救你的电脑数据危机!

1月前

在我们日常清理电脑时,有时会意外删除一些有用的文件,比如重要文件、照片等。这时就需要使用数据恢复软件尝试恢复数据。 EasyRecovery是一款强大有效实现数据恢复的软件,软件占用空间小,就算你是XP系统也能轻松驾驭。界面简

智能提取:VLOOKUP跨表数据检索的高效实践指南

1月前

说明我下面简单说明匹配数据,详细使用方式也可以参考下面文库哈EXCEL表中如何利用VLOOKUP将2张工作表的数据匹配? countif 方式1 A列数据在B列中出现的次

Canon CR2图片的神秘IFD0:揭示RAW格式的隐藏细节

1月前

首先是8个字节的文件头。 CR2的前2个字节是"II",代表INTEL格式的存储顺序,即低字节在前,高字节在后。 接下来是固定的2个字节:0x2a00。 最后的4个字节的整数是指向第一个IFD(I

即时更新:厂里Flash中心的最热文章,深度剖析Adobe Flash Player的前沿技术

1月前

1 今日内容 1.1 定时计算与实时计算 1.2 今日内容 kafkaStream 什么是流式计算 kafkaStream概述 kafkaStream入门案例

机械硬盘损坏,数据还能起死回生吗?揭秘数据恢复秘籍

1月前

电脑硬盘坏了数据可以恢复吗?对于这种问题,还需要具体问题具体分析的,一般是可以恢复。 硬盘损坏可以分为物理损坏和逻辑损坏两种情况: 1.逻辑损坏 这通常是由于软件问题,如文件系统错误、病毒攻击、误删除、格式化等

Windows应用数据开发实战:Windows 8环境下轻松上手

1月前

一、Application Data简介Applicaion Data相当于桌面应用的注册表,存储一些用户配置信息,如运行时状态,用户喜好等,需要注意的时, 当卸载应用时,这些数据会被删除,所以不要存储重要数

深入Windows Phone 8.1应用设置:LocalSettings与ApplicationDataContainer的实战应用

1月前

最近正好有机会看到林政老师的Windows Phone 8,1的书,正好我平时都是基于用户控件之类的写写使用收获,虽然 编程中基本上都用过应用数据之类的知识,但是一直没整理过,知识越来越多,东西也越来越杂,有时候过

Windows应用数据揭秘:在Windows 8开发中构建个性化应用程序

1月前

一、Application Data简介Applicaion Data相当于桌面应用的注册表,存储一些用户配置信息,如运行时状态,用户喜好等,需要注意的时, 当卸载应用时,这些数据会被删除,所以不要存储重要数

启动之路:深入ARM I.MX6ULL的内部机制 - 内部BOOT ROM、IVT、Boot Data、DCD与led.bin揭秘

1月前

参考:Linux之ARM(IMX6U)裸机之I.MX6ULL镜像烧写以及启动头文件的详解作者:一只青木呀发布时间: 2020-08-09 17:10:00网址:BOOT R

基于Matlab的MDF文件导入与处理研究_matlabmdf格式数据处理

1月前

摘要 本文围绕MDF文件格式展开全面研究,系统阐述了MDF文件的基本结构与数据块概念,深入探讨了在Matlab环境下导入和处理这些文件的理论与实践方法。首先,介绍了MDF文件在现代工业和汽车电子领域的应用背景及重要意义。接着,

发表评论

全部评论 0
暂无评论