首页编程正文内容

[NLG]Do Neural Dialog Systems Use the Conversation History Effectively? An Empirical Study?

编程

更新时间：2026-05-08 13:46:43 64

admin 管理员组

文章数量: 1184232

摘要：

为了发现对话历史是否真的被有效的利用了，本文介绍了10种干扰来评测对话历史是否真正被利用。发现transformer-seq2seq 和rnn seq2seq并没有很好地利用这些信息

主要工作：

首先有一个前提：如果模型对于对话历史的改变不敏感的话，那么他基本上没有利用多少对话历史。

在之前的工作中已经发现：

1.lstm的作用范围只被周围的大约150个词所影响
2.无论是生成摘要还是机器翻译，生成并没有利用好前面所携带的信息
3.rnn长距离依赖要比transformer好，transformer适用于词义消歧

本文要测试transformer，rnn，以及是否加attention对于对话历史的利用

实验：

其中x1,x2,...xn是对话历史，如果是A，B两个人对话的话，相当于A的所有话，yi表示B之前说的话，现在要利用A说的所有话和B在第i句之前的所有话来预测第i句的概率。通过这个loss函数来优化。

扰动类型分别对于句子和词语有：1.随机打乱句子顺序 2. 将对话翻转顺序 3.随机删掉某些句子 4.保留最近的K个句子

实验结果：

结论：

在大多数情况下模型在困惑度上只有很小的改变，甚至当改变非常明显时也变化不大，这意味着模型使用的信息只是提供给他们的信息中很少一部分。
transformer 对词序的变化不敏感，这意味着他们能学习词袋表示
注意力机制的使用使得模型使用更多的来自于对话早期的信息（当只使用一句话时困惑度增加的非常剧烈）
尽管 transformer 模型收敛更快且有着更低的困惑度，但是他们似乎不能捕捉到对话历史中的动态变化且对扰动不是很敏感

一句话总结：

用一系列实验证明了，当前的模型对于dialogue history的利用并不多。可以利用这些实验作为对NLG生成的一个eval。

本文标签： dialog Systems NLG Neural Conversation

版权声明：本文标题：[NLG]Do Neural Dialog Systems Use the Conversation History Effectively? An Empirical Study? 内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://roclinux.cn/b/1754604571a3020332.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

ORID焦点呈现法（Focused Conversation Method）

编程

9月前

百度百科上对ORID的描述：即焦点呈现法（Focused Conversation Method），是一种通过催化师（主持人、引导讲师）引导来开展的结构化汇谈（会议、交谈）形式。该方法常被用作对事实进行分析和感觉某一工具和方法。（O实践-客

探索 Rag-Conversation-Zep：在Zep平台中构建RAG会话应用

编程

9月前

引言在构建现代对话应用中，检索增强生成（RAG）技术正逐渐成为主流。这篇文章将向您介绍如何在Zep平台上利用RAG模版来构建一个高效的对话系统。我们将详细探讨如何使用Ze

ZIgzag conversation

编程

9月前

public class test {public static void main(String[] args){System.out.println(Zigzag("ABCDEM",4));}public st

ServiceNow-Chats Conversation Essentials

编程

9月前

Conversation EssentialsLearn how to create, find, and manage your conversations better with these tips and tricks.Starti

an example of a conversation you might have at a mobile carrier store

编程

9月前

You: Hi, I just arrived in the U.S., and I need to buy a SIM card and register a mobile number. Can you help me with tha

A private conversation

编程

9月前

A private conversationLast week,I went to the theatre.I had a very good seat.The play was very interesting.I did not enj

How to Keep a Conversation Going & Never Run Out of Things to Say

编程

9月前

发布时间：2013-01-25文章出自：www.lifehack原文链接：点击查看One of the BIGGEST problems you may face when

Mms conversation部分学习总结

编程

9月前

一、代码结构Conversation中整体结构主要包括com.Android.mms.data和com.android.mms.ui，如名字所示，大概就是数据处理部分和UI部分。数据部分主要

JTA Entity JPA 事务(Transaction) 会话(Conversation)

编程

9月前

JTA 深度历险 - 原理与实现 JTA使用 EntityManager使用方法 - mergeflushcreateNaiveQuery EntityManager方法简介 EJB之JPA(EntityManager — 类似于3千问

Seam的conversation存在性能问题，要正确使用

编程

9月前

近半年的项目实践让我们注意到了seam2.0.2的conversation的性能问题。测试人员抱怨系统速度慢的时候，我们一开始以为是由于数据库查询导致的性能问题。但是经过各方面排查，我们发现一个不

【一】情感对话 Towards Emotional Support Dialog Systems 论文阅读

编程

9月前

【一】情感支撑对话论文最近进展 Emotion Support Conversation 今天给大家介绍一下Towards Emotional Support Dialog Systems这篇由黄老师团队发表在2021 ACL的数据集。

【论文阅读】对训练集数据进行变换以保护隐私 Digestive neural networks: A novel defense strategy against inference

编程

8月前

本文在联邦学习场景下，提出了一种 Digestive neural networks （后称DNN，区别于传统的DNN），类似于输

2019A Comprehensive Survey on Graph Neural Networks被700

编程

7月前

摘要1 引言在这项调查中，我们提供了数据挖掘和机器学习领域中图神经网络（GNN）的全面概述。我们提出了一种新的分类法，将最新的图神经网络分为四类&am

综述笔记：A comprehensive survey on Graph Neural Networks

编程

7月前

一、GNN分类在清华大学的综述中，GNN被分为5类：Graph Convolutional Networks图卷积网络，Graph Attention Networks图

Complex-Valued Neural Networks: A Comprehensive Survey【2022年复数网络综述】

编程

7月前

论文可下载地址：(PDF) A Survey of Complex-Valued Neural Networks (researchgate) DOI:10.1109JAS.2022.105743 亮点 1.

综述论文“A Comprehensive Survey on Graph Neural Networks”

编程

7月前

arXiv在2019年12月4号上传的关于GNN综述论文“A Comprehensive Survey on Graph Neural Networks“。摘要：近年来，深度学习彻底改变了许多机器学习任务，从图像分类和视频处理到语音识别和

SysML for Systems Engineering A Model-Based Approach 资源介绍

编程

5月前

SysML for Systems Engineering A Model-Based Approach 资源介绍去发现同类优质开源项目:https:gitcode 在此仓库中，我们提供了《SysML fo

单目深度估计-NeW CRFs: Neural Window Fully-connected CRFs for Monocular Depth Estimation

编程

4月前

原文链接：单目深度估计-NeW CRFs: Neural Window Fully-connected CRFs for Monocular Depth Estimation · 语雀 Abstract 从单个图像

EdgeGPT对话状态管理终极指南：深入解析Conversation类工作原理

编程

4月前

EdgeGPT对话状态管理终极指南：深入解析Conversation类工作原理【免费下载链接】EdgeGPT Reverse engineered API of Microsofts Bing Chat AI 项

【读书笔记】《Computer Systems: A Programmer’s Perspective》第4章 Processor Architecture

编程

4月前

《Computer Systems: A Programmer’s Perspective》第4章 Processor Architecture4.1 The Y86-64 Instruction Set Architecture4.1

发表评论

全部评论 0

暂无评论

Linux大棚 – 不忘初心的技术博客，浮躁时代的安静角落

[NLG]Do Neural Dialog Systems Use the Conversation History Effectively? An Empirical Study?

摘要：

主要工作：

实验：

实验结果：

结论：

一句话总结：

更多相关文章

ORID焦点呈现法（Focused Conversation Method）

探索 Rag-Conversation-Zep：在Zep平台中构建RAG会话应用

ZIgzag conversation

ServiceNow-Chats Conversation Essentials

an example of a conversation you might have at a mobile carrier store

A private conversation

How to Keep a Conversation Going &amp; Never Run Out of Things to Say

Mms conversation部分学习总结

JTA Entity JPA 事务(Transaction) 会话(Conversation)

Seam的conversation存在性能问题，要正确使用

【一】情感对话 Towards Emotional Support Dialog Systems 论文阅读

【论文阅读】对训练集数据进行变换以保护隐私 Digestive neural networks: A novel defense strategy against inference

2019A Comprehensive Survey on Graph Neural Networks被700

综述笔记：A comprehensive survey on Graph Neural Networks

Complex-Valued Neural Networks: A Comprehensive Survey【2022年复数网络综述】

综述论文“A Comprehensive Survey on Graph Neural Networks”

SysML for Systems Engineering A Model-Based Approach 资源介绍

单目深度估计-NeW CRFs: Neural Window Fully-connected CRFs for Monocular Depth Estimation

EdgeGPT对话状态管理终极指南：深入解析Conversation类工作原理

【读书笔记】《Computer Systems: A Programmer’s Perspective》 第4章 Processor Architecture

发表评论

推荐文章

不求人！联想一键还原操作指南，让你轻松修复电脑

WiFi共享精灵：让免费WiFi触手可及，无需复杂的设置，轻松连接！

Word安全模式不求人？VBA为你解锁教程

Linux中删除用户的方法_root删除用户

如何在Linux中查找您的路由器的IP地址_linux查看路由器ip

热门文章

启动之路：深入ARM I.MX6ULL的内部机制 - 内部BOOT ROM、IVT、Boot Data、DCD与led.bin揭秘

idea安装插件plugins时无法加载插件三种解决方法（亲测有效且速度飞起）_idea插件加载不出来

如何使用jQuery动态添加删除文本框

CMOS模拟器实战教学工具详解

文件的删除与恢复

常见到的ip地址为什么都是以192.168开头_192.168为什么大部分都是

电脑重装系统如何远程控制电脑操作_远程重装系统怎么操作

彻底删除oracle的垃圾表_删除oracle 垃圾表

正斜杠 ，又称左斜杠，符号是""；反斜杠，也称右斜杠，符号是""。

EasyRecovery的魔力：瞬间还原你的珍贵照片记忆！

最新文章

一文教会你AIX系统备份：mksysb实用指南

SWF文件备份失败？这些步骤让你轻松搞定

Win10系统备份轻松搞定：掌握captureimage命令的关键技巧

Linux系统安全小贴士：掌握备份与恢复，安心每一天

省时省心！三步完成电脑系统高效备份！

Ubuntu系统维护秘籍：备份步骤详解，保护你的劳动成果！

Linux系统不哭：高效备份与快速恢复方案

Ubuntu系统安全大计，备份技巧大公开

GHOST教程：系统备份和还原，小白也能变成高手！

Linux备份与恢复必修课：SWF文件安全策略从入门到精通

Exploring the Finest Accommodations: A Comprehensive Guide to Ruston LA Hotels

The Enchanting Experience of ScaliniTella NYC: A Culinary Gem in the Heart of Manhattan

Exploring the Exquisite Aloft Chicago O'Hare: A Blend of Modern Luxury and Convenience

A Culinary Journey: Discovering the Finest Dining Experiences in Waco, TX

A Culinary Journey: Discovering the Finest Dining Experiences in Athens, GA

电脑设备管理器在哪里？一次让我抓狂又兴奋的寻找经历

与GWX的持久战：一段关于Windows10升级弹窗的私人记忆

以管理员身份运行：那些年我们追过的权限与踩过的坑

How to Keep a Conversation Going & Never Run Out of Things to Say

【读书笔记】《Computer Systems: A Programmer’s Perspective》第4章 Processor Architecture

正斜杠，又称左斜杠，符号是""；反斜杠，也称右斜杠，符号是""。