admin 管理员组文章数量: 1184232
【王喆
学习总结
(1)Flink 是最具代表性的批流一体的大数据平台。特点:让批处理和流处理共用一套代码,从而既能批量处理已落盘的数据,又能直接处理实时数据流。
(2)Flink 提高推荐系统实时性:用户数据进入数据流,即进入数据消息队列后,会被分割成一定时长的时间窗口,之后 Flink 会按照顺序来依次处理每个时间窗口内的数据,计算出推荐系统需要的特征。这个处理是直接在实时数据流上进行的,所以相比原来基于 Spark 的批处理过程,实时性有了大幅提高。
(3)Flink的实时性实践:利用 Flink 我们可以实时地获取到用户刚刚评价过的电影,然后通过实时更新用户 Embedding,就可以实现 SparrowRecsys 的实时推荐了。
(4)实时推荐系统的适用场景(快消产品):
- 新闻咨询类
- 短视频
- 婚恋类、陌生人社交类
- 直播类
- 电商类
- 音乐、电台类
文章目录
- 学习总结
- 一、实时性是影响推荐系统效果的关键因素
- 二、批流一体的数据处理体系
- 2.1 传统
本文标签: 王喆
版权声明:本文标题:【王喆 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://roclinux.cn/b/1687568277a116744.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论