一个VoiceXML语音浏览器的设计和实现-Linux大棚

admin 管理员组

文章数量: 1087139

2024年4月19日发(作者：反码的取值范围)

维普资讯

・

ｌ５４・　计算机应用研究　２００２钜　

一

个ＶｏｉｃｅＸＭ　Ｌ语音浏览器的设计和实现　

张先锋，金连甫，陈平　

（浙江大学兰德软俘技术研究中心，浙江杭州３１００２７）　

摘　要：电话是目前人们最常使用的交流工具之一。Ｉｎｔｅｍｅｔ的出现为人们提供了空前巨大的信息资源。　

如何使电话使用ｈａｔｅｍｅｔ资源显得至关重要。作为语音浏览技术以及语音互联网的核心，ＶｏｉｃｅＸＭＬ突破　

性地实现了互联网与电话网的融合。首先阐述基于ＶｏｉｃｅＸＭＬ的语音平台，然后再着重讲述其中的语音　

浏览器部分的设计和实现。　

关键词：ＶｉｏｃｅＸＭＬ；语音浏览器；解释ＸＭＬ；ＥＣＭＡＳｃｒｉｐｔ；ＪａｖａＳｃｒｉｐｔ　

中图法分类号：ＴＰ３１２　文献标识码：Ａ　文章编号：１００１．３６９５（２００２）１０．０１５４－Ｏ４　

Ｔｈｅ　Ｄｅｓｉｇｎ　ａｎｄ　Ｉｍｐｌｅｍｅｎｔａｔｉｏｎ　ｏｆ　ａ　ＶｏｉｃｅＸＭＬ　Ｂｒｏｗｓｅｒ　

ＺＨＡＮＧ　Ｘｉａｎ－ｆｅｎｇ，ＪＩＮ　ｌＪａｎ—ｆｕ，ＣＨＥＮ　Ｐｉｎｇ　

（Ｉｎｓｔｉｔｕｔｅ　ｏ厂Ｌａｎｄ　Ｓｏｔｆｗａｒｅ　Ｔ￣ｍｏｌｏｇｙ，Ｚｈｅｊｕ￣ｎｇ　Ｕｎｉｖｅｒｓｉｔｙ，Ｈａｎｇｚｈｏｕ　ｚ『　３１００２７，Ｃｈｍａ）　

Ａｌｔａｒａｅｔ：Ｔｅｌｅｐｈｏｎｅ　ｉｓ　ｏｎｅ　ｏｆ　ｔｈｅ　ｍｏｓｔ　ｃｏｍｍｏｎｌｙ　ｕｓｅｄ　ｃｏｍｍｕｎｉｃａｔｉｏｎ　ｔｏｏｌｓ．Ｍｅａｎｗｈｉｌｅ　ｔｈｅ　Ｉｎｔｅｍｅｔ　ｐｍ、，ｉｄｅｓ　ａ　ｈｕｇｅ　ｑｕａｎｔｉｔｙ　ｏｆ　

ｉｎｆｏｒｍａｄｏｎ　Ｈ　ｕｒｃｅｓ．Ｔｈｕｓ　ｉｔ　ｉｓ　ｉｍｐｏｒｔａｎｔ　ｔｏ　ｕｓｅ　Ｉｎｔｅｍｅｔ　Ｆｅｓｏｕｒｅｅ￥ｂｙ　ｔｅｌｅｐｈｏｎｅ、Ａｓ　ｔｈｅ　ｏ０ｆ℃ｏｆ　ｖｏｉｃｅ　ｂｒｏｗｓｉｎｇ　ｔｅｃｈｎｏｌｏｇｙ　ａｎｄ　ｖｏｉｃｅ　

Ｉｎｔｅｍｅｔ，ｔｈｅ　ｖｏｉｃｅＸＭＬ　ｉｍｐｌｅｍｅｎｔｓ　ｔｈｅ　ｃｏｍｂｉｎａｔｉｏｎ　ｏｆ　Ｉｎｔｅｍｅｔ　ａｎｄ　ＰＳＴＮ、Ｔｈｅ　ｐａｐｅｒ　ｆｉｒｓｔ　ｄｅｓｃｒｉｂｅｓ　ｔｈｅ　Ｖｏｉｃｅ　ｐｌａｔｆｏｒｍ　ｂａｓｅｄ　

ＶｏｉｅｅＸＭＬ，ｔｈｅｎ　ｅｍｐｈａｓｉｚｅｓ　ｏｎ　ｔｈｅ　ｄｅｓｉｇｎ　ａｎｄ　ｉｍｐｌｅｍｅｎｔａｔｉｏｎ　ｏｆ　ｈｔｅ　ｖｏｉｅｅＸＭＬ　ｂｒｏｗｓｅｒ、　

Ｋｅｙ　ｗｏｒｄｓ：ＶｏｉｅｅＸＭＬ；ＶｏｉｅｅＸＭＬ　Ｂｒｏｗｓｅｒ；Ｉｎｔｅｐｒｅｔｅ　ＸＭＬ；ＥＣＭＡＳｃｆｉ￣；ＪａｖａＳｃｒｉｐｔ　

１　基于ＶｏｉｃｅＸＭＬ的语音平台的总体框架介绍　２　ＶｏｉｃｅＸＭＬ的体系结构和重要的概念介绍　

Ｖｏｉｃｅ　ＸＭＬ是一个新的ＸＭＬ　Ｓｃｈｅｍａ用来制定通过　

ＶｏｉｃｅＸＭＬ规范１．０中使用的体系结构如图２所示　

语音对话访问Ｗｅｂ的内容和其交互语音应答的传递标　

准。ＶｏｉｃｅＸＭＬ建立在与基于ｗｅＩ）的相同模型上。在这　

种应用模型中，除ＨＴＭＬ解释程序（Ｗｅｂ浏览器）被　

ＶｏｉｃｅＸＭＬ解释程序取代，语音取代作为用户接口媒介的　

鼠标和键盘外，ＶｏｉｃｅＸＭＬ结构与可视Ｗｅｂ模型的结构基　

本相同。除其核心能力外，ＶｏｉｃｅＸＭＬ提供更先进的功能　

图２　ＶｏｉｃｅＸＭＬ体系结构模型　

特性，包括本地验证和处理、音频回放和记录，以及支持　

它由以下四个部分组成：　

上下文特有的修剪，并支持可重用的附属对话。图ｌ表　

（１）文件服务器（Ｄｏｃｕｍｅｎｔ　Ｓｅｒｖｅｒ）　处理“解释器”经　

示了ＶｏｉｃｅＸＭＩ　模型与Ｗｅｂ模型的关系。　

由“解释器语境”发送的请求，产生ＶｏｉｃｅＸＭＬ页面并回　

应给“解释器”，由“解释器”做进一步处理。　

（２）解释器（ＶｏｉｃｅＸＭＬ　Ｉｎｔｅｒｐｒｅｔｅｒ）。ＶｏｉｃｅＸＭＬ解释程　

序是一个计算机程序，它解释一个ＶｏｉｃｅＸＭＬ文件，引导　

和控制用户与执行平台之间的交互作用。　

（３）解释器语境（ＶｏｉｃｅＸＭＬ　Ｉｎｔｅｒｐｒｅｔｅｒ　Ｃｏｎｔｅｘｔ）。　

图１　ＶｏｉｃｅＸＭＬ采用的Ｗｅｂ模型　

ＶｏｉｃｅＸＭＬ解释程序语境也是一个计算机程序，用一个　

在这样的体系结构中，各种终端通过ＰｓＴＮ网络连　

ＶｏｉｃｅＸＭＬ解释程序解释一个ＶｏｉｃｅＸＭＬ文件，并且可以　

接到语音网关，而通过语音网关来访问后台的数据服　

与执行平台相互作用而与ＶｏｉｃｅＸＭＬ解释程序无关。　

务、应用服务，或者通过互联网络访问各个语音ＩＣＰ：　

（４）实现平台（１ｍｐｌｉｍｅｎｔａｔｉｏｎ　Ｐｌａｆｆｏｍａ）。实现平台包　

含了与电话有关的硬件设备和一些ＣＴ资源，由“解释　

收稿日期：２００２－０４－０６；修返日期：２００２—０５．０８　

器”和“解释器语境”控制。它将针对用户的动作和系统　

维普资讯

第１０期　张先锋等：一个ＶｏｉｅｅＸＭＬ语音浏览器的设计和实现　・１５５・　

状况产生事件（Ｅｖｅｎｔ）。这些事件将被“解释器”或者“解　

●在文件绒别定义的语法，并且是争局激话状怂　

释器语境”处理：当一个电话呼叫到来时，实现平台发　

・在应用级别定义的语法，并且是应用激活状态　

送一个消息到“解释器”，“解释器”从“解释器语境”巾获　

⑥事件（Ｅｖｅｎｔｓ）：事件是ＶｏｉｃｅＸＭＬ规范１．０中定义　

得相应的文件服务器地址，“解释器”发送请求给“文件　

的一种处理异常的机制。当用户没有提供解释器预期　

服务器”，得到起始页面。然后语音交白　过程歼始，“解　

的输入，或者用户提供的输入不合法时，或者用户需要　

释器”解释页面输出语音提示，用户输入语音，控制对话　

帮助时，实现平台都会抛出事件。当解释器发现在　

过程进行，得到需要的内容，一直到结束　

ｖｏｉｃｅＸＭＬ文件中有语义错误时，它也会抛出事件。事件　

下面介绍ＶｏｉｃｅＸＭＬ中重要的概念定义以利予分析　

将会被Ｃａｔｃｈ元素捕获并处理。　

的展开：　

⑦链接（Ｌｉｎｋｓ）。链接实际上是一种语法，当用户的　

①对话（Ｄｉａｌｏｇｓ）和附属对话（Ｓｕｂｄｉ，．ｄｏｇｓ）。ＶｏｉｃｅＸＭＬ　

输入符合这个语法时，控制将转移到由这个链接指定的　

规范１．０定义了两种对话：表单（Ｆｏｒｍ）和菜单（Ｍｅｎｕ）。　

一

个ＵＲＩ　链接也可以被用来抛出异常：　

Ｆ０丌ｎ定义了一组域变量（Ｆｉｅｌｄ　Ｉｔｅｍ　Ｖａｒｉａｂｌｅｓ）用来收集用　

⑧可执行内容。它指一段执行逻辑，它们出现在　

户输入的数据。每一个域（Ｆｉｅｌｄ）可以指定一个语法　

Ｂｌｏｃｋ元素、Ｆｉｌｌｅｄ元素、事件处理元素Ｃａｔｃｈ中。另外Ｉｆ　

（Ｇｒａｎｕｎａｒ），这个语法定义丁，用户输入的范围。附属对话　

元素是属于可执行内容的，ｆｆ元素本身又包含町执行内　

就像是一次函数调用，它提供了一个机制，调用新的对　

容。可以说，可执行内容是ＶｏｉｃｅＸＭＬ中最基本的动作　

话，并且在新对话结束时返回到调用子对话状态。在调　

单位，它们是ＶｏｉｃｅＸＭＬ语义的最终执行者。　

用子对话时，局部数据、语法和状态信息需要被保存并　

在子对话返回时被回复。子对话提供了一种机制，一些　

３　Ｖｏｉｃｅ　Ｂｒｏｗｓｅｒ的设计和实现　

常用的对话过程被定义成子对话后可以在多个文件　

３．１集成ＸＭＬ　Ｐａｒｓｅｒ　

（Ｄｏｃｕｍｅｎｔ）中使用，也可以将一个复杂的交互分解为多　

一

个子对话从而能够更好地组织。　

个ＶｏｉｃｅＸＭＬ文件首先是一个ＸＭＬ文件，在进行　

②会议（Ｓｅｓｓｉｏｎｓ）。当用户开始和解释器交互时，会　

ＶｏｉｃｅＸＭＬ语义分析之前，必须先对它进行ＸＭＬ解析，这　

议就开始了，在ＶｏｉｅｅＸＭＬ文件被装载，卸载的过程中，　

需要一个ＸＭＬ　Ｐｕｒｓｅｒ　在语音浏览器的设计过程中，我　

会议一直存在；当用户或者解释器请求结束，或者所有　

们采用了ＤＯＭ接口，主要是因为在对ＶｏｉｃｅＸＭＬ语言解　

的ＶｏｉｃｅＸＭＬ文件都到达＿ｒ结束状态，会议才结束。　

释的过程中，需要反复浏览不同的节点元素，采用ＤＯＭ　

③应用（Ａｐｐｌｉｃａｔｉｏｎｓ）。一个应用是指一组文件，这　

树结构会方便许多。在该程序实现中，ＸＭＬ　Ｐａｒｓｅ－．采用　

组文件共享一个根文件（Ａｐｐｌｉｃａｔｉｏｎ　Ｒｏｏｔ　Ｄｏｃｕｍｅｎｔ）。当　

Ｘｅｒｅｅｓ—Ｃ　ＸＭＬ　Ｐａｒｓｅｒ。Ｘｅｒｅｅｓ是一组词法分析器，它兼容　

用户和应用中的任何一个文件交互时，根文件都要被加　

ＸＭＩ　。Ｘｅｒｃｅｓ词法分析器对Ｊａｖａ和Ｃ＋＋可用。Ｘｅｒｃｅｓ—Ｃ　

载。并且只要用户和这个应用中的文件交互，根文件就　

是以ｃ语言写成，它使得应用程序可读写ＸＭＬ数据　

一

直处于有效状态。直到用户请求另一个应用中的文　

Ｘｅｒｅｅｓ．Ｃ的详细资料见文献［５］。　

件，前一个应用的根文件才被卸载。当根文件被加载　

３．２集成ＥＣＭＡＳｃｒｉｐｔ解释器　

时，在根文件中声明的变量对于应用中的其它文件都是　

ＶｏｉｃｅＸＭＬ的语义在很大程度上是利用ＥＣＭＡＳｃｒｉｐｔ　

可用的，根文件中的语法也处于激活状态。图２表示了　

实现的，ＶｏｉｅｅＸＭＬ解释器的状态信息大多是用　

在同一个应用的文件转移时，这些文件共享一个根文　

ＥＣＭＡＳｃｒｉｐｔ解释器保存的。ＥＣＭＡＳｅｒｉｐｔ是ＥＣＭＡ（欧洲计　

件。　

算机制造商协会）定义的一种ＪａｖａＳｃｒｉｐｔ标准　它是一种　

面向对象的编程语言，能够执行计算、操作对象。　

：

罾二硇　

ＶｏｉｃｅＸＭＬ规范１．０中涉及ＥＣＭＡＳｃｒｉｐｔ的使用主要有三　

图２共享根文件　

个方面：变量、表达式、作用域和＜ｓｃｒｉｐｔ＞元素标记，由　

④文件（Ｄｏｃｕｍｅｎｔ）。一个ＶｏｉｃｅＸＭＬ文件类似于一　

于篇幅原因在此不做详细解释。在该浏览器中集成了　

个ＨＴＭＬ文件，它定义了：　

Ｓｐｉｄｅｒ　Ｍｏｎｅｙ　Ｊａｖａ．Ｓｃｒｉｐｔ解释器。Ｓｐｉｄｅｒ　Ｍｏｎｅｙ是由Ｍｏｚｉｌｌａ　

・语音提示（语音合成）　・输出的录音　

实现的一种Ｃ语言ＪａｖａＳｃｒｉｐｔ解释器ｌ４一：　

・需要被识别的词语和句子　・需要被识别的ｌＹＩ＇ＭＦ按键　

・语音输入　・对话控制　・电话控制　

３．３解释ＶｏｉｃｅＸＭＬ　

⑤语法（Ｇｒａｍｍａｒｓ）。每一个对话可以有一个或者多　

在前面分析中，我们知道了：　

个语法。语法规定了用户在交互过程中的语音输入范　

・浏览器的体系结构主要包括了ｖｏｉｃｅＸＭＬ解释器　

围和许可的ＤＴＭＦ按键。　

和解释器语境两部分；　

在最简单的情况下，只有从属于对话的语法才被激　

・浏览器需要利用ＸＭＬ　Ｐａｒｓｅｒ完成ＸＭＬ语义的分　

活，在复杂的情况下，其它的语法也可以被激活：　

析，从ＶｏｉｃｅＸＭＬ文件生成ＤＯＭ树；　

・在ｘ　话内部定义的语法　

・浏览器需要利用Ｊａｖ＇ａＳｃｒｉｐｔ解释器执行脚本，声　

●被链接引用的外部语法　

明变量，管理变量作用域，以及记录解释过程中产生的　

维普资讯

・　ｌ５６　・　计算机应用研究　２００２在　

状态信息　

队列，然后激活相应的语法等待语音识别的结果或者是　

・ＶｏｉｃｅＸＭＬ解释器需要具备如下功能：①对话管　

事件的发生。　

理，主要就是ＦＩＡ算法的实现；②事件处理，主要就是非　

・如果是一个＜Ｉｎｉｔｉａｌ＞元素，ＦＩＡ将Ｉｎｉｔｉｌａ元素中　

正常对话流程的管理；③语法管理，在搜集用户输入的　

的提示语音根据Ｐｒｏｍｐｔ　Ｃｏｕｎｔｅｒ和Ｐｒｏｍｐｔ　Ｃｏｎｄｉｔｉｏｎｓ形成　

过程中需要激活（Ａｃｔｉｖｅ）相应的语法。　

一

个提示音队列，然后激活相应的语法等待语音识别的　

可执行内容的实现，这是ＶｏｉｅｅＸＭＬ中最基本的动　

结果或者是事件的发生　

作单位，它们是ＶｏｉｃｅＸＭＬ语义的最终执行者。　

・如果是＜Ｂｌｏｃｋ＞元素，ＦＩＡ将Ｂｌｏｃｋ元素的Ｆｏｒｍ　

３．３．１表单（Ｆｏｒｍｓ）功能部分　

Ｉｔｅｍ　Ｖａｉａｂｌｅ的值置为Ｔｒｕｅ，执行Ｂｌｏｃｋ的内容，然后跳过　

Ｆｏｒｓｍ是ＶｏｉｃｅＸＭＬ页面的关键组成部分。一个表单　

处理阶段。在Ｂｌｃｏｋ中，不需要获取用户输入，直接进入　

包含如下内容：　

下一次循环迭代。　

（１）一组表单项目（Ｆｏｒｍ　Ｉｔｅｍｓ）。这些表单项目被表　

⑤处理阶段。其目的是处理搜集阶段获得的用户　

单解释算法（Ｆｏｒｍ　ｈｅｒｐｒｅｔａｔｉｏｎ　Ａｌｇｏｒｉｔｈｍ，ＦＩＡ）解释执行。　

输入或者事件，处理过程如下：　

表单项目又可分为以下两个：　

・如果有事件发生（如Ｎｏｉｎｐｕｔ或者是Ｈａｎｇｕｐ），找　

①字段项目（Ｆｉｅｌｄ　Ｉｔｅｍ）定义了一个项目变量用来　

到相应的Ｃａｔｃｈ元素并且执行。这可能导致ＦＩＡ结束　

获取用户的输入。　

（如Ｅｘｉｔ事件），或者导致ＦＩＡ进入下一次迭代循环过程　

②控制项目（Ｃｏｎｔｒｏｌ　Ｉｔｅｍ）用来帮助获取用户输入。　

（如执行缺省的事件处理器）。　

（２）非项目变量的变量。　

・如果用户的输入与某一个＜Ｌｉｎｋ＞元素的语法　

（３）事件处理者。　

相匹配，则执行Ｌｉｎｋ所链接的转移动作，或者是Ｌｉｎｋ指　

（４）“填充”（Ｆｉｌｌｅｄ）动作。这是一段执行逻辑，当　

定的事件被触发，这个事件在当前的语境内被处理。　

Ｆｉｌｅｄ　Ｉｔｅｍ得到了输入值时，“Ｆｉｌｌｅｄ”动作被触发执行。　

・如果用户输入与另外的Ｆｏｒｍ的语法相匹配，而　

ＦＩＡ算法是解释表单元素的，是解释器的核心，它包括以　

不是当前的Ｆｏｒｍ，则当前Ｆｏｒｍ的ＦＩＡ过程结束，进入另　

下动作：　

外Ｆｏｒｍ的ＦＩＡ过程。　

①初始化阶段。当解释器遇到一个＜Ｆｏｒｍ＞元素　

・如果用户输入与当前Ｆｏｒｍ的某个语法相匹配，　

时，要对Ｆｏｒｍ作初始化。内部的语音提示计数器置ｌ，　

那么，将输入语法的Ｓｌｏｔ值赋予对应的ｎｅｌｄ　Ｉｔｅｍ　

利用ＪａｖａＳｃｒｉｐｔ解释器声明所有的变量，并给这些变量赋　

Ｖａｒｉａｂｌｅ。　

值（缺省为Ｕｎｄｅｆｉｎｅｄ，或者是Ｅｘｐｒ的值）。　

＜Ｆｉｌｅｄ＞元素的动作被触发执行。　

②主循环。主循环有三个阶段：　

按顺序执行每个＜Ｆｉｌｌｅｄ＞元素的动作。如果有＜　

・选择阶段（Ｓｅｌｅｃｔ　Ｐｈａｓｅ）。因为＜Ｆｏｒｍ＞元素可以　

Ｇｏｔｏ＞或者＜Ｔｈｒｏｗ＞元素，则立刻终止当前＜Ｆｉｌｌｅｄ＞元　

包含多个Ｆｏｒｍ　Ｉｔｅｍ，选择阶段的任务就是从多个Ｆｏ邢　

素的动作，ＦＩＡ或者结束，或者进入下一次迭代。　

Ｉｔｅｍ中选择当前需要解释的Ｆｏｒｍ　Ｉｔｅｍ。　

处理过程结束后，就进入下一个选择阶段，开始下　

一

・搜集阶段（Ｃｏｌｅｅｔ　＇ｈｐａｓｅ）。在搜集阶段，解释器用语　

次迭代。　

音提示用户输入正确的数据，并激活相应的语法检测输入，　

３．３．２事件功能部分　

然后识别出用户的语音，得到输入数据或者是事件。　事件功能部分需要完成这几个动作：　

・处理阶段（Ｐｒｏｃｅｓｓ　Ｐｈａｓｅ）。如果在搜集阶段得到　

・事件触发　・事件捕获　・事件处理　

了输入数据，则执行＜Ｆｉｌｌｅｄ＞元素处理这些数据；如果　事件触发与事件捕获动作我们采用Ｃ＋＋的异常机　

得到的是事件，则执行事件处理器处理事件。　制实现，当解释器遇到了＜＇Ｉ￣ｌｒｏｗ＞元素，或者是＜ＨｅｌＤ＞　

③选择阶段。它的目的是选择下一个Ｆｏｒｍ　Ｉｅｔｍ进　

等需要抛出事件时，调用ｃ＋＋的引发异常语句：　

行解释。选择的过程是这样的：　

ｔｈｒｏｗ　ｎＥｖｅｎｔ；／／其中ｎＥｖｅｎｔ为一个整数值　

・如果在上一次循环迭代的处理阶段明确指定了　

抛出异常的同时，将事件的类型，事件所在的Ｉｔｅｍ　

下一个Ｆｏｒｍ　Ｉｔｅｍ（＜Ｇｏｔｏ　Ｎｅｘｔｉｔｅｍ＞），则选择这个Ｆｏｒｍ　

节点、ｏＦｒｍ节点记录在解释器语境中：　

Ｉｔｅｍ。　

ｃｏｎｔｅｘｔ．ｓｔｒＥｖｅｎｔ＝ｅｖｅｎｔ；／／ｅｖｅｎｔ为某一事件，ＬＬ　３￣ｎ　ｈｅｌｐ　

・否则按照Ｆｏｒｍ　Ｉｔｅｍ在文件中的顺序，选择第一　

在ＦＩＡ算法中利用Ｃ＋＋的异常捕获机制：　

个Ｇｕａｒｄ　Ｃｏｎｄｉｔｉｏｎ是Ｆａｌｓｅ的ＦＯｍ１　Ｉｔｅｍ。　

（　ａｔｃｈ（ｉｎｔ　ｅｒｒ）　

・如果所有的Ｇｕａｒｄ　Ｃｏｎｄｉｔｉｏｎ都是Ｔｒｕｅ，说明解释　

完毕，ＦＩＡ做＜Ｅｘｉｔ＞操作。　

④搜集阶段。其目的是获取用户输入或事件。搜　

ｉｆ（ｅｌｌ＂＝ｎＥｖｅｎｔ）／／有事件发生，继续，然后进入ＦＩＡ的处理阶段　

ｃｏｎｔｉｎｕｅ；　

集阶段的动作取决于选择阶段选择的Ｆｏｒｍ　ｈｅｍ类型：　

・如果是Ｆｉｌｅｄ　Ｉｔｅｍ，ＦＩＡ将Ｆｉｅｌｄ　Ｉｔｅｍ中的提示语音　

根据Ｐｒｏｍｐｔ　Ｃｏｕｎｔｅｒ和Ｐｒｏｍｐｔ　Ｃｏｎｄｉｔｉｏｎｓ形成一个提示音　

在ＦＩＡ的处理阶段中，对事件进行处理，要经过以　

维普资讯

第１０期　张先锋等：一个ＶｏｉｃｅＸＭＬ语音浏览器的设计和实现　・１５７・　

下步骤：　

解释器语境　解释器　

（１）从解释器语境中提取发生的事件．事件所在的　

ＤＯＭ付信息　Ｆ１Ａ算法　

Ｉｔｅｍ节点、Ｆｏｒｍ节点。　

作用域　事件处理　

（２）处理Ｆｏｒｍ节点中的事件处理记数器　

变量空间　语法对象管理　

（３）从Ｉｔｅｍ节点开始搜索事件处理器（就是＜Ｃａｔｃｈ　

脚本解释　可执行内容管理　

语法对象集　

＞元素）。　

（４）如果Ｉｔｅｍ节点中没有事件处理器，则往ｈｅｍ节　

图３语音浏览器的功能结构　

点的父节点搜索ｃ　４　结论　

要

…

孽　量｝叟　了　霉罩　誊　、　￣＆　１１．，ＩＴＩｔｌ　／Ｊ＇　妄　

：　

．　

对　誊皇　旱二　蒿　某　ｖ。ｉ　ｘＭＬ　茬　芋　

、　

　。’

●＜ｒ

Ｍ　规范　

寸　鬟麓器　埋　二

Ｇ　ａｍｍａｒ＞元素和＜Ｄ

，

＝『＝　寸象　

　手

ｔｎ１ｆ＞元素的Ｕ

垄　。

苎　ｆ

个　孳　

Ｊ＇　。　以　三　网　善。　三　壶　

ＲＩ

要皇　象。在　

中守义的外部语法　一　

粟　。

、　、

弄　杀　。　

，　

ｌＩ“。、　．Ｉ１。　

、

“

：●＜Ｃ　Ｇ｜ｈａｎｍ　二量素和　［１］　Ｅｘｔｅｎｓｉｂｌｅ　Ｍａｒｋｕｐ　Ｉ丑“ｇｕａｇｅ（ＸＭＬ）１．０［ＥＢ／ＯＬ］．ｈｔ

・＜ｏｐｔｉ

ｏｉ

。ｎ＞元　

ｃｅ＞元素　

＞元素中定义的内部语法对象　

ｗｗｗ・ｗ３・ｏｒ

．　

ｔｐ：／／　

ｇ／ＴＲ／２０００／ＲＥＣ—ｘｍｌ一２０００１００６，２００１—１１・　

詈　

ｍ　

１２０

－

２

０　０　１　１０

２

３／　，２０　０

１－　１１　．

．

与语音识别的位置相关的量　蠢　

够　孥　

：　要置　薏　寸

是孽　登　

，

竺ｔ

ｉ　

主　

零　

；　

Ｒ２００　　１。／　ＷＥＤ－　ｖ。ｏｉＬｃｅ　ｘ

即

：

／／

ＩＵ：．．１ＩＵ／．

ＬＩＬＩ．１

．

－

１．１

．

啪

．

。

Ｉ＇

，￣

．　，

，

所以语法对象的位置信息是　ｊ　ｓｐｉｄ　ｎｏ　ｖ

，

２００ｌ—ｌ

ｉ　

∥　．　。　ｍ　．　．。　

。　

这里就不再详细叙述了

一　

墨　坌　实现比较直接，由于篇幅有限，　作者简介：

……一

。　

３．４语音浏览器的整体功能结构　主　詈　主　誉　，　：墓　

叠　

＊ｃ

三　信息篆　凳　慧　：　拥　

．

・

基于

Ｗ　

……　

．

－

：

。

．

ｅｂ的海量存储柔性分布式文件服务器设计　

冀装　嘉蓑　

～　…

蕃善　

…　～　

软件平台对并行性问题的研究和＊

。　九　。。。＊　

’　

＊

＊’

？用位操作编　

．．Ｌｉｎｕｘ￣＂ＰＣ

苎　曼　一种技术　

璺銎　篓型　．　

　设备驱动程序研究　

．．．玻璃　

能信息检索体系结构的研究　

．　基于形状的图像检索的关蠢　研究　

；　；　

：　

本文标签：语音事件用户语法

版权声明：本文标题：一个VoiceXML语音浏览器的设计和实现内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://roclinux.cn/b/1713492200a637378.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

Linux大棚 – 不忘初心的技术博客，浮躁时代的安静角落

一个VoiceXML语音浏览器的设计和实现

更多相关文章

配置用户通过Telnet登录设备的身份认证（AAA本地认证）

华为存储OceanStor 18500 V3 登录DeviceManager页面默认用户admin的密码忘记解决方法

Linux下如何开启允许root用户远程登录

windows@添加本地用户账户@用户账户修改@pin码登录问题@切换本地用户账户登录

联通HG8347R WO-36光猫 当前用户不允许登录解决办法

2020年，不可错过的技术圈十大“翻车”事件

盘点：2016年度WiFi行业十大事件

十大事件与Java相关的四十个名字(转载)

win7在安装时跳过输入用户名界面，直接开启管理员用户

windows10系统下指定用户配置FTP服务器及多用户登录

解决在Windows和Windows Server的应用程序日志中记录了”事件ID 4107”或”事件ID 11”错误问题...

Linux-系统随你玩之--用户及用户组管理

Linux系统下的用户和用户组的创建和管理

如何查看Windows事件日志

Windows Server 出现多个匿名登陆用户的问题解决

2023最新ChatGPT网站源码发布 支持用户付费套餐并能够赚取收益

实操：将C盘用户配置文件移动到非系统盘（windows10系统）

Windows10-用户账户控制、Windows远程桌面

计算机用户注销怎么找回,win7电脑关机键变注销怎么恢复【图文】

刚刚，OpenAI 官宣：GPT-4.1 免费开放！ChatGPT 用户全体升级！

发表评论

推荐文章

javascript - How to uncheck the select all checkbox in Ext.selection.CheckboxModel - Stack Overflow

c - OpenSSL tpm2 provider - support for password protected TPM private key - Stack Overflow

javascript - How to change the display text of md-select box while maintaining the model? - Stack Overflow

javascript - Is there a way to use the 3D Views or 3D Perspective in Google Maps API? - Stack Overflow

Windows 启动盘制作与使用

热门文章

javascript - Click event - get the target where the mousedown started instead of the mouseup - Stack Overflow

javascript - Material UI vertical Slider. How to change the thickness of the rail in vertical material UI Slider (React) - Stack

javascript - Stop ng-mouseenter and ng-mouseout from triggering on inner elements - Stack Overflow

javascript - React Native: Can&#39;t find variable: require - Stack Overflow

c - Why is an address with an offset added passed to free? - Stack Overflow

What&#39;s the best way to do integration testing for a Javascript heavy UI in a rails app? - Stack Overflow

javascript - How to import JS library from node_modules - Stack Overflow

javascript - Load JSON at runtime rather than dynamically via AJAX - Stack Overflow

ChatGPT：OpenAI Codex—一款基于云的软件工程 AI 代理，赋能 ChatGPT，革新软件开发模式

win10卸载程序灾难性故障_win10一直弹出卸载或更改应用程序的具体处理方法

最新文章

javascript - How do I toggle the readonly attribute of all child element with jquery - Stack Overflow

javascript - Might it be possible to block an entire US state from accessing my site, using PHP? - Stack Overflow

c++ - Is dereferencing std::span::end always undefined? - Stack Overflow

javascript - Delay function execution if it has been called recently - Stack Overflow

javascript - Google Maps Autocomplete List - Stack Overflow

Windows 安装和连接使用 PgSql数据库

cmd打开计算机D盘,Win7利用cmd命令进入d盘文件夹的操作方法

如何在VMare中制作Windows Embedded Standard 7 (WES 7)

开机、注销后自动登录Windows

【教程】Python Flask快速学习

Exploring the Finest Accommodations: A Comprehensive Guide to Ruston LA Hotels

The Enchanting Experience of ScaliniTella NYC: A Culinary Gem in the Heart of Manhattan

Exploring the Exquisite Aloft Chicago O'Hare: A Blend of Modern Luxury and Convenience

A Culinary Journey: Discovering the Finest Dining Experiences in Waco, TX

A Culinary Journey: Discovering the Finest Dining Experiences in Athens, GA

联通HG8347R WO-36光猫当前用户不允许登录解决办法

2023最新ChatGPT网站源码发布支持用户付费套餐并能够赚取收益

javascript - React Native: Can't find variable: require - Stack Overflow

What's the best way to do integration testing for a Javascript heavy UI in a rails app? - Stack Overflow