Flink自学系列教程之--DataStream-API简介(二)

Apache Flink 是一个分布式大数据处理引擎,可对有限数据流和无限数据流进行有状态计算。可部署在各种集群环境,对各种大小的数据规模进行快速计算。

阅读全文

Flink自学系列教程之--Flink的几个重要概念(一)

Apache Flink 是一个分布式大数据处理引擎,可对有限数据流和无限数据流进行有状态计算。可部署在各种集群环境,对各种大小的数据规模进行快速计算。

Event-time

处理时间(process time)很好理解,指的是机器的本地时间,会产生不一致的、不可重复的结果。相反,事件时间(Event-time)能够产生一致的、可重复的结果。然而,相比基于处理时间的应用,基于事件时间的应用需要额外的配置。支持事件时间的流处理引擎的内部比仅仅支持处理时间的流处理引擎的内部更为复杂。

阅读全文

浅析数据库缓冲池与SQL查询成本


  如果我们想要查找多行记录,查询时间是否会成倍地提升呢?其实数据库会采用缓冲池的方式提升页(page)的查找效率。数据库的缓冲池在数据库中起到了怎样的作用?如何查看一条 SQL 语句需要在缓冲池中进行加载的页的数量呢?

阅读全文

Flink自学系列教程


  Apache Flink 是一个分布式大数据处理引擎,可对有限数据流和无限数据流进行有状态计算。可部署在各种集群环境,对各种大小的数据规模进行快速计算。

阅读全文

Hello World

Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub.

阅读全文