admin 管理员组文章数量: 1087135
2024年4月15日发(作者:线程和进程有什么区别知乎)
2021年
第4期
学报
第42卷
总第313期
阿里云机器学习PAI平台
在驾驶行为识别上的应用
林峰,刘永志
摘要:随着具有车内外双拍摄功能行车记录仪的普及,如何通过分析车内驾驶人员实时影像,
识别驾驶者状态,对分心驾驶、疲劳驾驶等危险行为进行及时预警已成为近年来研究的热点问题之
一.该文基于阿里云机器学习PAI平台,利用AutoLearning自动学习模块,对1100张含10种驾驶状
态的车内影像数据构建了线上深度学习模型,模型训练耗时约11分钟,识别准确率可达99.08%,并通
过与传统本地线下模型训练方式的对比,验证了基于PAI平台方案的可行性,为基于图像识别的驾
驶行为检测提供了一种新的参考方法.
关键词:PAI平台;AutoLearning;驾驶行为;机器学习
中图分类号:TP181文献标志码:A文章编号:1008-7974(2021)04-0085-05
DOI:10.13877/22-1284.2021.04.014
发布了《道路交通安全调研报告——2019年
2020年4月,中国社会福利基金会等机构
方案
[2-3]
.在该方案中,基于深度学习的图像
识别技术被广泛使用,并已在实践中被证实
具有较高的性能和准确性
[4]
.但是传统的深
度学习图像识别技术存在以下不足:一是需
要开发人员掌握深度学习相关理论知识,能
够熟练使用Keras、TensorFlow等第三方代码
库,并具备手工搭建多层人工神经网络模型
的能力;二是深度学习模型训练的过程往往
需要消耗大量的计算资源,若开发人员硬件资
源受限,将无法进行大规模图像识别模型的
构建;三是图像识别模型一旦训练完成后,缺
度:不良驾驶行为》.报告指出分心驾驶、疲劳
驾驶等不良驾驶行为是造成2019年度中国道
路交通事故的最主要原因.因此如何有效识
别车辆司机驾驶状态,对分心驾驶、疲劳驾驶
等危险行为进行及时预警,对减少车辆交通
事故的发生具有重大意义
[1]
.
近年来,随着行车记录仪的普及,通过对
驾驶人员实时影像检测,快速识别不良行为
并告警已逐渐成为解决不良驾驶行为的主流
收稿日期:2020-09-13
基金项目:福州职业技术学院校级科研项目(FZYKJJJB201901).
作者简介:林峰,福建漳州人,福州职业技术学院工程师;刘永志,福州职业技术学院教授(福建福州350108).
85
2021年
乏便捷的手段将其快速部署,实用性不强
[5-8]
机器学习PAI平台是阿里云计算有限公
.
司开发的一款在线机器学习平台.基于阿里
云自身丰富的技术积累和强大的云计算资
源,开发者只需准备训练数据集,PAI平台可
提供数据预处理、数据分析、数据可视化、模
型评估、模型发布等一站式服务.AutoLearning
自动学习模块是机器学习PAI平台中的重要
组件之一.在图像识别问题上,只要训练集数
据质量得到保证,AutoLearning自动学习模块
就能快速训练足够精确的模型,并提供一键
发布模型的服务
[9]
机器学习PAI平台,
.鉴于此
结合Auto
,本文利用阿里云
Learning自动学
习模块,构建了线上驾驶行为识别模型,并进
行了相关验证和发布试验.
1机器学习PAI平台
机器学习PAI平台(PlatformofArtificialIn⁃
telligence
了一站式的机器学习解决方案
)是一款阿里云人工智
.PAI
能平
平台起初
台,提供
仅服务于阿里巴巴集团内部业务,致力于让
阿里巴巴集团内部开发者能够高效、简洁、标
准地使用人工智能技术.随着平台技术的不
断积累,2018年机器学习PAI平台正式商业
化,目前已积累了数万企业客户和个人开发
者,是国内领先的线上机器学习平台之一.机
器学习PAI平台具有如下优点:①支持一站式
机器学习,使用者只需要准备好训练数据(注
意:数据通常存放在阿里云OSS或MaxCom⁃
pute
程、模型训练、
系统中),数据上传、
模型评估及模型部署等环节均
数据预处理、特征工
可在阿里云PAI平台中操作实现.②对接阿里
云DataWorks大数据平台,支持SQL、UDF、
UDAF
高.③
、
生
MR
成模
等
型
多
的
种
实
数
验
据
流
处
程
理
支
方
持
式
DataWorks
,灵活性较
平
86
学报
第4期
台周期性调度,且调度任务可区分生产环境
和开发环境,确保数据安全性.
机器学习PAI平台主要提供了可视化建
模PAI-Studio、交互式AI研发PAI-DSW,以及
自动化建模AutoLearning三种使用模式.其中
Auto
支持在线标注、
Learning模式提供了自动机器学习服务,
自动模型训练、超参优化及模
型评估等常见机器学习操作.使用者只需准
备少量标注数据,设置训练时长,就可以得到
深度优化的人工智能算法模型.
2基于机器学习PAI平台的驾驶行为
识别
2.1数据准备
本文实验数据来源于大数据算法竞赛平
台Kaggle(赛题:StateFarmDistractedDriverDe⁃
tection
22
约占
424
),涉及26位司机、10种驾驶行为,合计
40
张
KB
图
存
片
储
.每
空
张
间
图
.原
片
始
尺
数
寸
据
均
集
为
体
640×480
量较大
,
,
为方便实验,抽选了具有代表性的两名司机
机编号:p021、p022)的样本数据,并随机
拆分为训练集(图片数量:1100)和测试集(图
片数量:220).其中图片示例如图1所示,数据
集分布见表1.
图1训练样本示例
(司
林峰,等:阿里云机器学习PAI平台在驾驶行为识别上的应用
表1数据集分布
类别代码驾驶行为说明训练集测试集合计
c0
c1
normal
texting
driving
-right
20040240
c2talkingonthephone-right
100120
c3
100
20
120
c4talking
texting-left100
20
120
c5operating
onthe100
20
120
c6drinking
the
phone
radio
-left
100
20
120
c7
hair
reaching
andmake
behind
100
20
120
c8up
100
20
120
c9talkingtopassenger
100
20
20120
合计
1
100
100220
20
1
120
320
阿里云PAI平台中图像识别模型依赖的
训练数据需存储于OSS平台中.OSS(Object
Storage
海量数据规模的分布式存储服务,
Service,对象存储服务)平台
具有稳定、
提供面向
可靠、安全、低成本的特点.在OSS平台中创
建存储空间(亦称之为Bucket),新建目录,并
通过专用客户端工具oss-browser,将1100张训
练集图片进行上传.值得注意的是,需要创建
相应的RAM角色(角色名:AutoLearningRole),
并赋予AliyunOSSFullAccess权限,阿里云PAI
平台才能访问OSS平台图像数据用于模型训
练.具体角色创建及赋权操作可见阿里云相
关帮助文档,此处不作赘述.
2.2创建AutoLearning实例
进入阿里云机器学习PAI平台,在“自动
学习(AutoLearning)”栏目中,创建实例.其中
在“创建实例”对话框中,选择实例类型为“图
片分类”,并设置标注配置文件OSS路径.标
注配置文件为CSV文本文件,需手工生成,用
于指定训练集中各图片所属类别.文件内容
包含样本ID、图片文件OSS路径,以及类别标
注等信息,内容格式如下所示:
0
distracted_driver_detection/train/img_"}
,{"tfspath":"oss://-cn-shanghai.
,{"option"
aliyuncs.
:"c0"}
com/
2.3模型训练及评估
在AutoLearning自动学习页面中,通过随
机抽查,确认训练图片标注无误后,即可进入
模型训练及评估阶段.点击页面下方“完成标
注”按钮,弹出“开始训练”对话框.配置最大
训练时长为60分钟后,点击“开始训练”按钮.
截止本文撰写时,阿里云PAI平台AutoLearn⁃
“最大训练时长
ing自动学习模块仍处于公测阶段
”不能超过60分钟
,
,
配置参数
对训练模
型所消耗的阿里云计算资源无需付费.经过
约11分钟时长的训练,驾驶行为识别模型指
标数据已达到预期:准确率99.08%,模型训练
结束.
2.4模型部署和测试使用
模型训练完毕后,可进行EAS部署.阿里
云EAS(ElasticAlgorithmService,弹性算法服
务)支持将所训练的模型发布为在线预测服
务,通过RESTfulAPI形式供第三方系统或平
台使用.本文以流行的Python编程语言作为
实例,本地测试客户端通过阿里云提供的
eas-prediction
心代码如下所示
库,
.
进行模型在线接口调用,核
from
#引入模块
from
eas_prediction
eas_prediction
importPredictClient
#初始化客户端
importStringRequest
client=PredictClient
_token
("接口
("接口公网
TOKEN码
URL
")
地址")
#
(
构造请求参数
)
request=StringRequest
#预测
('{"image":"待预测图片base64编码"}')
response=t
print(se_
()
在线预测服务返回
(
的
))
结果为JSON字符
串,提供了上传图片所属各类别的概率,形如:
{"class_probs":{"c9":2.4398683962090217e-08,"c8":
87
2021年
1.79963e-06,……},"success":true,"request_id":
"ff281367-4d25-435b-8cca-69b653ed5e48",
08,……],"predictions":3,"class":3}
"c6","probs":[3.242876633891001e-09,5.3566e-
"class_name":
学报
第4期
通过使用PAI平台在线预测服务,结合上
述核心Python代码,对含220张驾驶图片的测
试集进行了预测分析,比对真实情况,220张
图片驾驶行为均被准确识别,准确率为100%.
同时经过测试,平均每张图片预测耗时1160
毫秒,不超过1.5秒,满足驾驶行为检测性能
要求.
3传统本地线下模式比对
为与机器学习PAI平台方式进行对比分
析,本文使用Python编程语言,依托深度学习
开源库Keras(版本号:2.2.5)、TensorFlow(版本
号:1.15.3),开发了CNN卷积神经网络模型.
所设计的本地模型包含了卷积层、池化层、全
连接层等结构,合计参数12946890个.使用
上述与机器学习PAI平台方式相同的1100张图
片进行模型训练,在个人计算机中(CPU:1.8
GHz、4核,内存:10GB、DDR3)耗时约222分
钟(3.7小时),模型准确度及损失函数(cate⁃
gorical_crossentropy)逐渐收敛,如图2所示.
表2
项目
训练耗时/min
训练集准确率/%
测试集准确率/%
每帧识别耗时/ms
模型发布
主要工作内容
机器学习PAI平台模式
11
99.08
100
1160
支持一键自动发布
数据准备
①OSS存储(标准型):0.12元/GB/月;
图2线下模型准确度、损失函数收敛曲线
通过对含220张图片的测试集进行测试,
成功预测193张图片所属驾驶行为,准确率为
87.73%,此外平均每张图片预测耗时43毫秒.
结合模型训练耗时、测试集准确率、平均每帧
图片预测耗时及费用等因素,将本地开发模
式与在线PAI平台模式进行对比,具体情况见
表2.基于PAI平台AutoLearning模式的方法
两种模型训练模式对比
传统本地线下模式
222
98.73
87.73
43
需要代码开发支持
数据准备、代码开发、模型评估等
费用
③EAS服务(1CPU核心+4GB内存):0.4元/小时.
②AutoLearning训练:公测阶段免费;
基于第三方开源平台,免费使用
88
林峰,等:阿里云机器学习PAI平台在驾驶行为识别上的应用
具有如下特点:①操作人员不需要掌握额外
的编程方法和深度学习技术,能够将主要精
力集中于训练数据的采集和标注上.②依托
阿里云IT技术积累,图像分类模型准确率较
高.③可弹性提供模型训练依赖的计算资源.
④易于将模型发布为线上服务,方便其他系
统或平台使用.⑤资费合理,使用者无需承担
测试、发布等一站式服务.
过高的费用,即可享受机器学习模型的训练、
影响分析[J].安全与环境学报,2016,16(6):174-178.
[2]陈军,陆娇蓝,刘尧,等.基于云计算的多特
征疲劳驾驶检测系统研究与设计[J].计算机测量与
控制,2015,23(10):3341-3343.
[3]张辉,钱大琳,邵春福,等.驾驶人分心状态
判别支持向量机模型优化算法[J].交通运输系统工
程与信息,2018,18(1):127-132.
[4]RAOX,LINF,CHENZ,cteddriv⁃
ingrecognitionmethodbasedondeepconvolutionalneural
network[J].JAmbIntelHumComp,2019(8):193-200.
[5]郑远攀,李广阳,李晔.深度学习在图像识别
4结语
本文基于阿里云机器学习PAI平台,结合
中的应用研究综述[J].计算机工程与应用,2019,55
(12):20-36.
[6]周飞燕,金林鹏,董军.卷积神经网络研究综
述[J].计算机学报,2017(6):1-23.
[7]李林,张盛兵,吴鹃.基于深度学习的实时图
像目标检测系统设计[J].计算机测量与控制,2019
(7):15-19.
[8]邢艳芳,段红秀,何光威.TensorFlow在图像识
别系统中的应用[J].计算机技术与发展,2019,29
(5):192-196.
[9]焦嘉烽,李云.大数据下的典型机器学习平
台综述[J].计算机应用,2017,37(11):3039-3047,
3052.
AutoLearning自动学习模块,利用1100张含10
种驾驶状态的车内影像数据,构建了一个高
性能的线上驾驶行为识别模型.该方案解决
了传统本地线下模型训练方式深度依赖开发
能力和计算资源的缺陷,后续计划将进一步
丰富数据集,提升模型在多场景、多尺度情况
下驾驶行为识别准确率.
参考文献:
[1]崔健,赵建有.驾驶分心对隧道段行车安全
(责任编辑:王前)
ApplicationofAliyunPAIPlatforminDrivingBehaviorRecognition
(FuzhouPolytechnic,Fuzhou350108,China)
LINFeng,LIUYong-zhi
Abstract:Withthepopularizationofdrivingrecorderswithdualcamerafunction,howtoanalyzethereal-
timeimagesofthedriverinthecartoidentifythedriver'sstateandprovidetimelywarningofdangerous
behaviorssuchasdistracteddrivingandfatiguedrivinghasbecomeahotresearchtopicinrecentyears.
eltrainingtakesabout11
min,andtherecognitionaccuracyisupto99.08%.Inaddition,thispaperverifiesthefeasibilityofthe
andprovidesanewreferencemethodfordrivingbehaviordetectionbasedonimagerecognition.
Keywords:PAIplatform;AutoLearning;drivingbehavior;machinelearning
BasedonthePAIplatform,thisarticleusestheAutoLearningmoduletoconstructanonlinedeeplearn⁃
PAIplatformsolutionbasedonthecomparisonwiththetraditionallocalofflinemodeltrainingmethod,
89
版权声明:本文标题:阿里云机器学习PAI平台在驾驶行为识别上的应用 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://roclinux.cn/b/1713172933a622443.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论