admin 管理员组

文章数量: 1184232

说说Flink的连接器connector有哪些,怎么用?

标题: ‘说说Flink的连接器connector有哪些,怎么用?’
日期: 2021-07-31 10:26:51
标签: [flink,connector]
分类: 数据仓库

flink作为一个计算引擎，是缺少存储介质的，那么数据从哪儿来，到哪儿去，就需要连接器了，链接各种类型数据库，各种类型组件进行数据的抽取、计算、存储等，下面来看看flink都有哪些connector，怎么使用的？

介绍

看看目前支持的connector：
这是官方给出的：

有些支持数据源，有些不支持数据源，有些支持无边界流式处理，有些不支持，具体看上图。

我们目前市面上用的比较多的数据库，大概是以下几种：

# 支持jdbc
mysql mongodb postgresql oracle db2 sybase sqlserver hive 
# 不支持jdbc
hbase es 文件 消息队列（kafka rabbitmq rocketmq）

使用

kafka

CREATE TABLE MyUserTable (-- declare the schema of the table`user` BIGINT,`message` STRING
) WITH (-- declare the external system to connect to'connector' = 'kafka','topic' = 'topic_name','scan.startup.mode' = 'earliest-offset', -- 还有可选从最近offset开始消费：latest-offset'properties.bootstrap.servers' = 'localhost:9092', --kafka broker连接串'format' = 'json'   -- declare a format for this system
)

hbase

注意hbase目前只支持1.4和2.2版本

-- register the HBase table 'mytable' in Flink SQL
CREATE TABLE hTable (rowkey INT,family1 ROW<q1 INT>,family2 ROW<q2 STRING, q3 BIGINT>,family3 ROW<q4 DOUBLE, q5 BOOLEAN, q6 STRING>,PRIMARY KEY (rowkey) NOT ENFORCED
) WITH ('connector' = 'hbase-1.4','table-name' = 'mytable','zookeeper.quorum' = 'localhost:2181'
);-- use ROW(...) construction function construct column families and write data into the HBase table.
-- assuming the schema of "T" is [rowkey, f1q1, f2q2, f2q3, f3q4, f3q5, f3q6]
INSERT INTO hTable
SELECT rowkey, ROW(f1q1), ROW(f2q2, f2q3), ROW(f3q4, f3q5, f3q6) FROM T;

jdbc

jdbc连接需要添加对应的driver到flink lib里
mysql：点这里
postgresql：点这里
oracle：点这里下载ojdbc8.jar
这是常用的，其他的在网上都能搜得到

-- register a MySQL table 'users' in Flink SQL
CREATE TABLE MyUserTable (id BIGINT,name STRING,age INT,status BOOLEAN,PRIMARY KEY (id) NOT ENFORCED
) WITH ('connector' = 'jdbc','url' = 'jdbc:mysql://localhost:3306/mydatabase','table-name' = 'users','driver' = 'com.jdbc.mysql.Driver','username' = 'xxx','password' = 'xxx'
);

es

es只能做sink不能做source

CREATE TABLE myUserTable (user_id STRING,user_name STRINGuv BIGINT,pv BIGINT,PRIMARY KEY (user_id) NOT ENFORCED
) WITH ('connector' = 'elasticsearch-7','hosts' = 'http://localhost:9200','index' = 'users'
);

文件

可以是服务器本地文件，也可以是hdfs文件，区别就是文件路径描述符的区别：

CREATE TABLE MyUserTable (column_name1 INT,column_name2 STRING,...part_name1 INT,part_name2 STRING
) PARTITIONED BY (part_name1, part_name2) WITH ('connector' = 'filesystem',           -- required: specify the connector'path' = 'file:///path/to/whatever',  -- required: path to a directory'path' = 'hdfs:///path/to/whatever',  -- required: path to a directory'format' = '...',                     -- required: file system connector requires to specify a format,-- Please refer to Table Formats-- section for more details'partition.default-name' = '...',     -- optional: default partition name in case the dynamic partition-- column value is null/empty string-- optional: the option to enable shuffle data by dynamic partition fields in sink phase, this can greatly-- reduce the number of file for filesystem sink but may lead data skew, the default value is false.'sink.shuffle-by-partition.enable' = '...',...
)

另外还有几种特殊的connector：

datagen

datagen会按照字段指定的类型，随机生成对应的数据

CREATE TABLE Orders (order_number BIGINT,price        DECIMAL(32,2),buyer        ROW<first_name STRING, last_name STRING>,order_time   TIMESTAMP(3)
) WITH ('connector' = 'datagen'
)

print

每一个写入该表的数据，都会标准输出到日志里

CREATE TABLE print_table (f0 INT,f1 INT,f2 STRING,f3 DOUBLE
) WITH ('connector' = 'print'
);

blackhole

这个connector会吞噬一切数据，往这个表里写的数据都会消失，主要用于测试性能。

CREATE TABLE blackhole_table (f0 INT,f1 INT,f2 STRING,f3 DOUBLE
) WITH ('connector' = 'blackhole'
);

参考官网链接：
flink connectors

其实每个connector都支持指定类型的format格式方式，下期文章介绍如何指定格式化，可以指定那些格式化。
点个关注呗。

不积跬步无以至千里，不积小流无以成江海。

欢迎关注我的微信公众号，比较喜欢分享知识，也喜欢宠物，所以做了这2个公众号：

喜欢宠物的朋友可以关注：【电巴克宠物Pets】

想知道狗狗怕蚊子吗？扫二维码查看，有惊喜。

一起学习，一起进步。

本文标签：说说Flink的连接器connector有哪些怎么用

版权声明：本文标题：说说Flink的连接器connector有哪些,怎么用? 内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://roclinux.cn/b/1687156959a70452.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

Linux大棚 – 不忘初心的技术博客，浮躁时代的安静角落

说说Flink的连接器connector有哪些,怎么用?

说说Flink的连接器connector有哪些,怎么用?

标题: ‘说说Flink的连接器connector有哪些,怎么用?’ 日期: 2021-07-31 10:26:51 标签: [flink,connector] 分类: 数据仓库

介绍

使用

kafka

hbase

jdbc

es

文件

datagen

print

blackhole

更多相关文章

说说Flink的连接器connector有哪些,怎么用?

枚举类型是什么意思,怎么用?

一步到位：科大讯飞教师wife密码教你怎么设置无线路由器

无线路由器设置全攻略，掌握后WiFi畅通无阻！

发表评论

推荐文章

旅游攻略：Django开发的西安景区推荐系统源码全解析，让你玩转古城！

斐讯K2路由器刷机不求人，新手也能成为大神！

打包H264码流到FLV文件_h264 转 flv

谷歌浏览器如何设置允许弹出窗口_google弹窗跳不出来

电脑硬盘分区：新购电脑的必修课与进阶指南

热门文章

2022显卡市场大梳理：最新天梯图让你一目了然

教你如何将笔记本设置为无线路由器共享无线网络给手机

Android 屏蔽home键

企业IT运维实战：批量修改192.168.0.1密码的自动化方案

【亲测免费】 msvcr110.dll 资源文件说明

树莓派IP地址查找

逆向工程进阶：利用SWF文件深入分析恶意代码的技巧

电脑网速太慢让你抓狂？统信系统用户试试这些优化技巧！

揭开 Realtek HD Audio 及 Realtek(R) Audio 的2nd Output 面纱：技术揭秘

存储难题一扫光：电脑硬盘分区知识深度剖析

最新文章

一文教会你AIX系统备份：mksysb实用指南

SWF文件备份失败？这些步骤让你轻松搞定

Win10系统备份轻松搞定：掌握captureimage命令的关键技巧

Linux系统安全小贴士：掌握备份与恢复，安心每一天

省时省心！三步完成电脑系统高效备份！

Ubuntu系统维护秘籍：备份步骤详解，保护你的劳动成果！

Linux系统不哭：高效备份与快速恢复方案

Ubuntu系统安全大计，备份技巧大公开

GHOST教程：系统备份和还原，小白也能变成高手！

Linux备份与恢复必修课：SWF文件安全策略从入门到精通

Exploring the Finest Accommodations: A Comprehensive Guide to Ruston LA Hotels

The Enchanting Experience of ScaliniTella NYC: A Culinary Gem in the Heart of Manhattan

Exploring the Exquisite Aloft Chicago O'Hare: A Blend of Modern Luxury and Convenience

A Culinary Journey: Discovering the Finest Dining Experiences in Waco, TX

A Culinary Journey: Discovering the Finest Dining Experiences in Athens, GA

电脑设备管理器在哪里？一次让我抓狂又兴奋的寻找经历

与GWX的持久战：一段关于Windows10升级弹窗的私人记忆

以管理员身份运行：那些年我们追过的权限与踩过的坑

标题: ‘说说Flink的连接器connector有哪些,怎么用?’
日期: 2021-07-31 10:26:51
标签: [flink,connector]
分类: 数据仓库