admin 管理员组

文章数量: 1087135


2024年4月15日发(作者:线程和进程有什么区别知乎)

2021年

第4期

学报

第42卷

总第313期

阿里云机器学习PAI平台

在驾驶行为识别上的应用

林峰,刘永志

摘要:随着具有车内外双拍摄功能行车记录仪的普及,如何通过分析车内驾驶人员实时影像,

识别驾驶者状态,对分心驾驶、疲劳驾驶等危险行为进行及时预警已成为近年来研究的热点问题之

一.该文基于阿里云机器学习PAI平台,利用AutoLearning自动学习模块,对1100张含10种驾驶状

态的车内影像数据构建了线上深度学习模型,模型训练耗时约11分钟,识别准确率可达99.08%,并通

过与传统本地线下模型训练方式的对比,验证了基于PAI平台方案的可行性,为基于图像识别的驾

驶行为检测提供了一种新的参考方法.

关键词:PAI平台;AutoLearning;驾驶行为;机器学习

中图分类号:TP181文献标志码:A文章编号:1008-7974(2021)04-0085-05

DOI:10.13877/22-1284.2021.04.014

发布了《道路交通安全调研报告——2019年

2020年4月,中国社会福利基金会等机构

方案

[2-3]

.在该方案中,基于深度学习的图像

识别技术被广泛使用,并已在实践中被证实

具有较高的性能和准确性

[4]

.但是传统的深

度学习图像识别技术存在以下不足:一是需

要开发人员掌握深度学习相关理论知识,能

够熟练使用Keras、TensorFlow等第三方代码

库,并具备手工搭建多层人工神经网络模型

的能力;二是深度学习模型训练的过程往往

需要消耗大量的计算资源,若开发人员硬件资

源受限,将无法进行大规模图像识别模型的

构建;三是图像识别模型一旦训练完成后,缺

度:不良驾驶行为》.报告指出分心驾驶、疲劳

驾驶等不良驾驶行为是造成2019年度中国道

路交通事故的最主要原因.因此如何有效识

别车辆司机驾驶状态,对分心驾驶、疲劳驾驶

等危险行为进行及时预警,对减少车辆交通

事故的发生具有重大意义

[1]

.

近年来,随着行车记录仪的普及,通过对

驾驶人员实时影像检测,快速识别不良行为

并告警已逐渐成为解决不良驾驶行为的主流

收稿日期:2020-09-13

基金项目:福州职业技术学院校级科研项目(FZYKJJJB201901).

作者简介:林峰,福建漳州人,福州职业技术学院工程师;刘永志,福州职业技术学院教授(福建福州350108).

85

2021年

乏便捷的手段将其快速部署,实用性不强

[5-8]

机器学习PAI平台是阿里云计算有限公

.

司开发的一款在线机器学习平台.基于阿里

云自身丰富的技术积累和强大的云计算资

源,开发者只需准备训练数据集,PAI平台可

提供数据预处理、数据分析、数据可视化、模

型评估、模型发布等一站式服务.AutoLearning

自动学习模块是机器学习PAI平台中的重要

组件之一.在图像识别问题上,只要训练集数

据质量得到保证,AutoLearning自动学习模块

就能快速训练足够精确的模型,并提供一键

发布模型的服务

[9]

机器学习PAI平台,

.鉴于此

结合Auto

,本文利用阿里云

Learning自动学

习模块,构建了线上驾驶行为识别模型,并进

行了相关验证和发布试验.

1机器学习PAI平台

机器学习PAI平台(PlatformofArtificialIn⁃

telligence

了一站式的机器学习解决方案

)是一款阿里云人工智

.PAI

能平

平台起初

台,提供

仅服务于阿里巴巴集团内部业务,致力于让

阿里巴巴集团内部开发者能够高效、简洁、标

准地使用人工智能技术.随着平台技术的不

断积累,2018年机器学习PAI平台正式商业

化,目前已积累了数万企业客户和个人开发

者,是国内领先的线上机器学习平台之一.机

器学习PAI平台具有如下优点:①支持一站式

机器学习,使用者只需要准备好训练数据(注

意:数据通常存放在阿里云OSS或MaxCom⁃

pute

程、模型训练、

系统中),数据上传、

模型评估及模型部署等环节均

数据预处理、特征工

可在阿里云PAI平台中操作实现.②对接阿里

云DataWorks大数据平台,支持SQL、UDF、

UDAF

高.③

MR

成模

DataWorks

,灵活性较

86

学报

第4期

台周期性调度,且调度任务可区分生产环境

和开发环境,确保数据安全性.

机器学习PAI平台主要提供了可视化建

模PAI-Studio、交互式AI研发PAI-DSW,以及

自动化建模AutoLearning三种使用模式.其中

Auto

支持在线标注、

Learning模式提供了自动机器学习服务,

自动模型训练、超参优化及模

型评估等常见机器学习操作.使用者只需准

备少量标注数据,设置训练时长,就可以得到

深度优化的人工智能算法模型.

2基于机器学习PAI平台的驾驶行为

识别

2.1数据准备

本文实验数据来源于大数据算法竞赛平

台Kaggle(赛题:StateFarmDistractedDriverDe⁃

tection

22

约占

424

),涉及26位司机、10种驾驶行为,合计

40

KB

.每

.原

640×480

量较大

为方便实验,抽选了具有代表性的两名司机

机编号:p021、p022)的样本数据,并随机

拆分为训练集(图片数量:1100)和测试集(图

片数量:220).其中图片示例如图1所示,数据

集分布见表1.

图1训练样本示例

(司

林峰,等:阿里云机器学习PAI平台在驾驶行为识别上的应用

表1数据集分布

类别代码驾驶行为说明训练集测试集合计

c0

c1

normal

texting

driving

-right

20040240

c2talkingonthephone-right

100120

c3

100

20

120

c4talking

texting-left100

20

120

c5operating

onthe100

20

120

c6drinking

the

phone

radio

-left

100

20

120

c7

hair

reaching

andmake

behind

100

20

120

c8up

100

20

120

c9talkingtopassenger

100

20

20120

合计

1

100

100220

20

1

120

320

阿里云PAI平台中图像识别模型依赖的

训练数据需存储于OSS平台中.OSS(Object

Storage

海量数据规模的分布式存储服务,

Service,对象存储服务)平台

具有稳定、

提供面向

可靠、安全、低成本的特点.在OSS平台中创

建存储空间(亦称之为Bucket),新建目录,并

通过专用客户端工具oss-browser,将1100张训

练集图片进行上传.值得注意的是,需要创建

相应的RAM角色(角色名:AutoLearningRole),

并赋予AliyunOSSFullAccess权限,阿里云PAI

平台才能访问OSS平台图像数据用于模型训

练.具体角色创建及赋权操作可见阿里云相

关帮助文档,此处不作赘述.

2.2创建AutoLearning实例

进入阿里云机器学习PAI平台,在“自动

学习(AutoLearning)”栏目中,创建实例.其中

在“创建实例”对话框中,选择实例类型为“图

片分类”,并设置标注配置文件OSS路径.标

注配置文件为CSV文本文件,需手工生成,用

于指定训练集中各图片所属类别.文件内容

包含样本ID、图片文件OSS路径,以及类别标

注等信息,内容格式如下所示:

0

distracted_driver_detection/train/img_"}

,{"tfspath":"oss://-cn-shanghai.

,{"option"

aliyuncs.

:"c0"}

com/

2.3模型训练及评估

在AutoLearning自动学习页面中,通过随

机抽查,确认训练图片标注无误后,即可进入

模型训练及评估阶段.点击页面下方“完成标

注”按钮,弹出“开始训练”对话框.配置最大

训练时长为60分钟后,点击“开始训练”按钮.

截止本文撰写时,阿里云PAI平台AutoLearn⁃

“最大训练时长

ing自动学习模块仍处于公测阶段

”不能超过60分钟

配置参数

对训练模

型所消耗的阿里云计算资源无需付费.经过

约11分钟时长的训练,驾驶行为识别模型指

标数据已达到预期:准确率99.08%,模型训练

结束.

2.4模型部署和测试使用

模型训练完毕后,可进行EAS部署.阿里

云EAS(ElasticAlgorithmService,弹性算法服

务)支持将所训练的模型发布为在线预测服

务,通过RESTfulAPI形式供第三方系统或平

台使用.本文以流行的Python编程语言作为

实例,本地测试客户端通过阿里云提供的

eas-prediction

心代码如下所示

库,

.

进行模型在线接口调用,核

from

#引入模块

from

eas_prediction

eas_prediction

importPredictClient

#初始化客户端

importStringRequest

client=PredictClient

_token

("接口

("接口公网

TOKEN码

URL

")

地址")

#

构造请求参数

request=StringRequest

#预测

('{"image":"待预测图片base64编码"}')

response=t

print(se_

()

在线预测服务返回

))

结果为JSON字符

串,提供了上传图片所属各类别的概率,形如:

{"class_probs":{"c9":2.4398683962090217e-08,"c8":

87

2021年

1.79963e-06,……},"success":true,"request_id":

"ff281367-4d25-435b-8cca-69b653ed5e48",

08,……],"predictions":3,"class":3}

"c6","probs":[3.242876633891001e-09,5.3566e-

"class_name":

学报

第4期

通过使用PAI平台在线预测服务,结合上

述核心Python代码,对含220张驾驶图片的测

试集进行了预测分析,比对真实情况,220张

图片驾驶行为均被准确识别,准确率为100%.

同时经过测试,平均每张图片预测耗时1160

毫秒,不超过1.5秒,满足驾驶行为检测性能

要求.

3传统本地线下模式比对

为与机器学习PAI平台方式进行对比分

析,本文使用Python编程语言,依托深度学习

开源库Keras(版本号:2.2.5)、TensorFlow(版本

号:1.15.3),开发了CNN卷积神经网络模型.

所设计的本地模型包含了卷积层、池化层、全

连接层等结构,合计参数12946890个.使用

上述与机器学习PAI平台方式相同的1100张图

片进行模型训练,在个人计算机中(CPU:1.8

GHz、4核,内存:10GB、DDR3)耗时约222分

钟(3.7小时),模型准确度及损失函数(cate⁃

gorical_crossentropy)逐渐收敛,如图2所示.

表2

项目

训练耗时/min

训练集准确率/%

测试集准确率/%

每帧识别耗时/ms

模型发布

主要工作内容

机器学习PAI平台模式

11

99.08

100

1160

支持一键自动发布

数据准备

①OSS存储(标准型):0.12元/GB/月;

图2线下模型准确度、损失函数收敛曲线

通过对含220张图片的测试集进行测试,

成功预测193张图片所属驾驶行为,准确率为

87.73%,此外平均每张图片预测耗时43毫秒.

结合模型训练耗时、测试集准确率、平均每帧

图片预测耗时及费用等因素,将本地开发模

式与在线PAI平台模式进行对比,具体情况见

表2.基于PAI平台AutoLearning模式的方法

两种模型训练模式对比

传统本地线下模式

222

98.73

87.73

43

需要代码开发支持

数据准备、代码开发、模型评估等

费用

③EAS服务(1CPU核心+4GB内存):0.4元/小时.

②AutoLearning训练:公测阶段免费;

基于第三方开源平台,免费使用

88

林峰,等:阿里云机器学习PAI平台在驾驶行为识别上的应用

具有如下特点:①操作人员不需要掌握额外

的编程方法和深度学习技术,能够将主要精

力集中于训练数据的采集和标注上.②依托

阿里云IT技术积累,图像分类模型准确率较

高.③可弹性提供模型训练依赖的计算资源.

④易于将模型发布为线上服务,方便其他系

统或平台使用.⑤资费合理,使用者无需承担

测试、发布等一站式服务.

过高的费用,即可享受机器学习模型的训练、

影响分析[J].安全与环境学报,2016,16(6):174-178.

[2]陈军,陆娇蓝,刘尧,等.基于云计算的多特

征疲劳驾驶检测系统研究与设计[J].计算机测量与

控制,2015,23(10):3341-3343.

[3]张辉,钱大琳,邵春福,等.驾驶人分心状态

判别支持向量机模型优化算法[J].交通运输系统工

程与信息,2018,18(1):127-132.

[4]RAOX,LINF,CHENZ,cteddriv⁃

ingrecognitionmethodbasedondeepconvolutionalneural

network[J].JAmbIntelHumComp,2019(8):193-200.

[5]郑远攀,李广阳,李晔.深度学习在图像识别

4结语

本文基于阿里云机器学习PAI平台,结合

中的应用研究综述[J].计算机工程与应用,2019,55

(12):20-36.

[6]周飞燕,金林鹏,董军.卷积神经网络研究综

述[J].计算机学报,2017(6):1-23.

[7]李林,张盛兵,吴鹃.基于深度学习的实时图

像目标检测系统设计[J].计算机测量与控制,2019

(7):15-19.

[8]邢艳芳,段红秀,何光威.TensorFlow在图像识

别系统中的应用[J].计算机技术与发展,2019,29

(5):192-196.

[9]焦嘉烽,李云.大数据下的典型机器学习平

台综述[J].计算机应用,2017,37(11):3039-3047,

3052.

AutoLearning自动学习模块,利用1100张含10

种驾驶状态的车内影像数据,构建了一个高

性能的线上驾驶行为识别模型.该方案解决

了传统本地线下模型训练方式深度依赖开发

能力和计算资源的缺陷,后续计划将进一步

丰富数据集,提升模型在多场景、多尺度情况

下驾驶行为识别准确率.

参考文献:

[1]崔健,赵建有.驾驶分心对隧道段行车安全

(责任编辑:王前)

ApplicationofAliyunPAIPlatforminDrivingBehaviorRecognition

(FuzhouPolytechnic,Fuzhou350108,China)

LINFeng,LIUYong-zhi

Abstract:Withthepopularizationofdrivingrecorderswithdualcamerafunction,howtoanalyzethereal-

timeimagesofthedriverinthecartoidentifythedriver'sstateandprovidetimelywarningofdangerous

behaviorssuchasdistracteddrivingandfatiguedrivinghasbecomeahotresearchtopicinrecentyears.

eltrainingtakesabout11

min,andtherecognitionaccuracyisupto99.08%.Inaddition,thispaperverifiesthefeasibilityofthe

andprovidesanewreferencemethodfordrivingbehaviordetectionbasedonimagerecognition.

Keywords:PAIplatform;AutoLearning;drivingbehavior;machinelearning

BasedonthePAIplatform,thisarticleusestheAutoLearningmoduletoconstructanonlinedeeplearn⁃

PAIplatformsolutionbasedonthecomparisonwiththetraditionallocalofflinemodeltrainingmethod,

89


本文标签: 模型 训练 学习 平台 驾驶