当前位置: 首页 > news >正文

一个网站做两个语言模板可以吗中国现代公路建设有限公司网站

一个网站做两个语言模板可以吗,中国现代公路建设有限公司网站,青岛做网站哪家公司好,上海好牛网站建设流处理是 Flink 的核心#xff0c;流处理的数据集用 DataStream 表示。数据流从可以从各种各样的数据源中创建#xff08;消息队列、Socket 和 文件等#xff09;#xff0c;经过 DataStream 的各种 transform 操作#xff0c;最终输出文件或者标准输出。这个过程跟之前文…流处理是 Flink 的核心流处理的数据集用 DataStream 表示。数据流从可以从各种各样的数据源中创建消息队列、Socket 和 文件等经过 DataStream 的各种 transform 操作最终输出文件或者标准输出。这个过程跟之前文章中介绍的 Flink 程序基本骨架一样。本篇介绍 DataStream 相关的入门知识。Flink 101为了学习 Flink 的朋友能查看到每个例子的源码我创建了一个 GitHub 项目github.com/duma-repo/a… 这里会存放每一篇文章比较重要的示例的源码目前支持 Java 和 Scala仍在不断完善中。代码下载后可以在本地运行也可以打包放在集群上运行。同时欢迎各位将优质的资源提交到项目中。简单示例import org.apache.flink.api.common.functions.FlatMapFunction; import org.apache.flink.api.java.tuple.Tuple2; import org.apache.flink.streaming.api.datastream.DataStream; import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment; import org.apache.flink.streaming.api.windowing.time.Time; import org.apache.flink.util.Collector;public class WindowWordCount {public static void main(String[] args) throws Exception {StreamExecutionEnvironment env StreamExecutionEnvironment.getExecutionEnvironment();DataStreamTuple2String, Integer dataStream env.socketTextStream(localhost, 9999).flatMap(new Splitter()).keyBy(0).timeWindow(Time.seconds(5)).sum(1);dataStream.print();env.execute(Window WordCount);}public static class Splitter implements FlatMapFunctionString, Tuple2String, Integer {Overridepublic void flatMap(String sentence, CollectorTuple2String, Integer out) throws Exception {for (String word: sentence.split( )) {out.collect(new Tuple2String, Integer(word, 1)); //空格分割后每个单词转换成 (word, 1) 二元组输出}}}}复制代码这个例子跟之间介绍 WordCount 的例子类似这里详细介绍下涉及的 API 和含义数据源socketTextStream 是从 socket 创建的数据流可以使用 nc -l 9000 创建 socket 客户端发送数据transformflatMap 将输入的数据按照空格分割后扁平化处理flat即为扁平的意思keyBy 会按照指定的 key 进行分组这里就是将单词作为 keytimeWindow 指定时间窗口这里是 5s 处理一次sum 是聚合函数将分组好的单词个数求和输出print 将处理完的数据输出到标准输出流中可以在控制台看到输出的结果。调用 execute 方法提交 JobData Source经过以上的介绍我们知道常见的数据源有 socket、消息队列和文件等。对于常见的数据源 Flink 已经定义好了读取函数接下来一一介绍。基于文件readTextFile(path)读文本文件默认是文件类型是 TextInputFormat并且返回类型是 StringreadFile(fileInputFormat, path)读文件需要指定输入文件的格式readFile(fileInputFormat, path, watchType, interval, typeInfo)以上两个方法内部都会调用这个方法参数说明 fileInputFormat - 输入文件的类型 path - 输入文件路径 watchType - 取值为 FileProcessingMode.PROCESS_CONTINUOUSLY 和 FileProcessingMode.PROCESS_ONCEFileProcessingMode.PROCESS_CONTINUOUSLY - 当输入路径下有文件被修改整个路径下内容将会被重新处理FileProcessingMode.PROCESS_ONCE - 只扫描一次便退出。因此这种模式下输入数据只读取一次 interval - 依赖 watchType 参数对于 FileProcessingMode.PROCESS_CONTINUOUSLY 每隔固定时间单位毫秒检测路径下是否有新数据 typeInfo - 返回数据的类型需要注意在底层 Flink 将读文件的过程分为两个子任务 —— 文件监控和数据读取reader。监控任务由 1 个 task 实现而读取的任务由多个 task 实现数量与 Job 的并行度相同。监控任务的作用是扫描输入路径周期性或者只扫描一次取决于 watchType当数据可以被处理时会将数据分割成多个分片将分片分配给下游的 reader 。一个分片只会被一个 reader 读取一个 reader 可以读取多个分片。基于 SocketsocketTextStream从 socket 数据流中读数据基于 CollectionfromCollection(Collection)从 Java.util.Collection 类型的数据中创建输入流collection 中的所有元素类型必须相同fromCollection(Iterator, Class)从 iterator (迭代器中创建输入流Class 参数指定从 iterator 中的数据类型fromElements(T ...)从给定的参数中创建输入流 所有参数类型必须相同fromParallelCollection(SplittableIterator, Class)从 iterator 中创建并行的输入流Class 指定 iterator 中的数据类型generateSequence(from, to)从 from 至 to 之间的数据序列创建并行的数据流自定义addSource可以自定义输入源通过实现 SourceFunction 接口来自定义非并行的输入流也可以实现 ParallelSourceFunction 接口或集成 RichParallelSourceFunction 类来自定义并行输入流当然也可以定义好的数据源如KafkaaddSource(new FlinkKafkaConsumer08(...))DataStream 的 transform 之前已经介绍了一些 transfrom 函数如map、flatMap 和 filter 等。同时还有窗口函数window、timeWindow 等聚合函数sum、reduce 等。更多的 transform 函数以及使用将会单独写一篇文章介绍。Data SinkData Sink 便是数据的输出。同 Data Source 类似 Flink 也内置了一些输出函数如下 writeAsText(path) / TextOutputFormat将数据作为 String 类型输出到指定文件writeAsCsv(...) / CsvOutputFormat将 Tuple 类型输出到 , 分隔的 csv 类型的文件。行和列的分隔符可以通过参数配置默认的为 \n 和 ,print() / printToErr()将数据打印到标准输出流或者标准错误流可以指定打印的前缀。writeUsingOutputFormat() / FileOutputFormat输出到 OutputFormat 类型指定的文件支持对象到字节的转换。writeToSocket根据 SerializationSchema 将数据输出到 socket addSink自定义输出函数如自定义将数据输出到 Kafka小结本篇文章主要介绍了 Flink Streaming 编程的基本骨架。详细介绍了 Streaming 内置的 Data Source 和 DataSink 。下篇将继续介绍 Flink Streaming 编程涉及的基本概念。代码地址 github.com/duma-repo/a… 欢迎关注公众号「渡码」 转载于:https://juejin.im/post/5d09814651882528fd530789
http://icebutterfly214.com/news/23922/

相关文章:

  • 2025年11月美白面霜产品排名榜:持证美白温和修护全解析
  • 2025年11月货架厂家综合排行:专业顾问的客观评价与选择指南
  • 2025年11月市场证明机构排行:五家机构综合性能对比评估
  • 树莓派安装ubuntu22后apt安装软件报错:E: Sub-process /usr/bin/dpkg returned an error code (2)
  • springboot+easyui实现本学院学生去向登记表
  • powerGrid靶机复盘WP
  • 2025 年 11 月财税合规服务厂家推荐排行榜,电商/跨境电商/出口退税/公司注销/股权设计/平台报送/海外公司/审计报告全案解决方案
  • 2025 年 11 月疥螨阴虱药剂厂家推荐排行榜,扑灭司林/5%扑灭司林,苯甲酸苄酯/25%苯甲酸苄酯,15%胺氯菊百灭宁,科灭达公司推荐
  • Vibe Coding - 免费使用gpt-5、grok-code-fast-1进行氛围编程
  • 大家好
  • 前端框架深度解析:Vue 从入门到实战,掌握渐进式开发核心 - 实践
  • 浅谈dp中的最优化、计数问题
  • 2025北京一对一辅导/补习/培训/家教/网课推荐榜:金博教育领衔,3家优质机构凭个性化服务出圈,适配多元学习需求
  • CF1463E Plan of Lectures
  • 251107
  • P3978 概率论
  • 2025-11-07 PQ v.Next日志记录
  • 2025-11-07 早报新闻
  • R语言实现多组样本两两t检验的完整教程
  • SDOI 2024游记兼退役游记
  • NOIP 模拟赛 3 比赛总结
  • 2025年TWS耳机磁铁厂家权威推荐榜单:手机磁铁/钕铁硼磁铁/稀土磁铁源头厂家精选
  • 2025 年 11 月深圳店铺装修公司推荐排行榜,餐饮店铺装修,商场店铺装修,连锁店铺装修,零售店铺装修设计公司推荐
  • 护手仪ESD整改-ASIM阿赛姆
  • 2025年市面上成都小程序机构top10推荐:杰诚智享领跑行业
  • 气氛
  • 2025年热门成人自考机构推荐
  • 小 E 的传奇一生
  • 2025 年 11 月全自动加袋机厂家推荐排行榜,FFS/25公斤/吨袋/吨包全自动上袋机,肥料/铜精粉全自动吨袋上袋机,无锡江苏全自动吨包上袋机公司推荐
  • 2025 年 11 月包装称厂家推荐排行榜,全自动/定量/FFS重膜/高速/锂电/零排放/螺旋/吨袋包装称,铜精粉/肥料吨包包装称公司精选