admin 管理员组文章数量: 1184232
one
最近在看tf框架,挺有意思的。在文本分类部分中再一次看到了one-hot编码,查了些资料,在此做一个记录。
我们先来看一个one-hot编码的例子。
假设字典中包含以下元素。
dict = [我,我们,爱,中国,你好,有趣]
一般的字典会包含10^6乃至更多的字词,在这里我们仅仅举例。
那么对于以下词语,如何进行one-hot编码呢?
‘我们’:(0,1,0,0,0,0)
‘中国’:(0,0,0,1,0,0)
‘你好’:(0,0,0,0,1,0)
就是词语在字典中出现的位置。
同时,词语进行one-hot编码后得到的向量与词典维度相同。
这不禁让我疑问:怎么解决维度爆炸这种情况呢?
本文标签: one
版权声明:本文标题:one 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://roclinux.cn/b/1686517231a4873.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论