admin 管理员组文章数量: 1086019
Good
吴军数学之美又看了一遍,写的有深有浅,比如这次,有不同的感觉。
统计预言模型的数据稀疏问题解决方案–古德图灵估计
接上
这里引入Good-turning估计
Good-turning的主要思想是从概率的总量中分配少量的比例给零概率项。
假定在语料库中出现 r 次数的词有
当 r 较小时,我们使用
dr=(r+1)Nr+1Nr
这样可以保证
N=∑rdrNr
这里我们考虑一个经验,一般来说 r 越大,词的数量
本文标签: Good
版权声明:本文标题:Good 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://roclinux.cn/p/1698283009a291257.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论