热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Flink博客记录

Flink一、Flink记录1.1内存管理1.1.1Flink内存管理https:www.cnblogs.comlightenp13053828.html1.1.2Fli

Flink


一、Flink 记录


1.1 内存管理


1.1.1 Flink内存管理

https://www.cnblogs.com/lighten/p/13053828.html


1.1.2 Flink_Flink TaskManager 内存模型 ,以及相关内存配置参数

https://blog.csdn.net/u010003835/article/details/106294342


1.2 Flink 记录


–>> 一文搞懂 Flink 的 Exactly Once 和 At Least Once

https://mp.weixin.qq.com/s/QcL33ghaM-riceOr218oXg


1.2.1 Kafka偏移量提交

https://stackoverflow.com/questions/54585740/commit-kafka-offsets-manually-in-flink


1.2.2 Flink savepoint

https://zhuanlan.zhihu.com/p/94594551

https://zhuanlan.zhihu.com/p/79526638


1.2.3 checkpoint


1.2.3.1 checkpoint 并行度改变后,状态重分配

https://blog.csdn.net/lvwenyuan_1/article/details/98511963


1.2.3.2 checkpoint 恢复

https://mp.weixin.qq.com/s/rncSvPKdFrT2tFMs6TZpcA


1.2.4 反压

http://wuchong.me/blog/2016/04/26/flink-internals-how-to-handle-backpressure/


1.2.5 序列化

http://wuchong.me/blog/2016/04/29/flink-internals-memory-manage/

https://developer.aliyun.com/article/721997


1.2.6 CPU L1 L2 L3 是什么,作用是什么?

https://blog.csdn.net/u010632165/article/details/106795478


1.2.7 Flink on yarn 指定节点

在这里插入图片描述

https://blog.csdn.net/weixin_47235286/article/details/121883864

yarn-session.sh -n 2 -jm 1024 -tm 1024 -d -s 2-n 2 表示指定两个容器
-jm 1024 表示jobmanager 1024M内存
-tm 1024表示taskmanager 1024M内存
-d --detached 任务后台运行
-s 指定每一个taskmanager分配多少个slots(处理进程)。建议设置为每个机器的CPU核数。一般情况下,vcore的数量等于处理的slot(-s)的数量
-nm,--name YARN上为一个自定义的应用设置一个名字
-q,--query 显示yarn中可用的资源 (内存, cpu核数)
-qu,--queue <arg> 指定YARN队列.
-z,--zookeeperNamespace <arg> 针对HA模式在zookeeper上创建NameSpace

Flink JobListener


Flink 维表更新处理办法

https://zhuanlan.zhihu.com/p/490835750


Flink trigger


https://blog.csdn.net/qq_31866793/article/details/102842570
https://www.jianshu.com/p/e32e04a1d6c4
—>>> https://blog.csdn.net/weixin_43495317/article/details/124241897


Flink 多个source watermark

https://my.oschina.net/qiangzigege/blog/2993330?p&#61;{{currentPage&#43;1}}


异步 Asyc

https://blog.csdn.net/qq_46045632/article/details/122588486?utm_medium&#61;distribute.pc_aggpage_search_result.none-task-blog-2aggregatepagefirst_rank_ecpm_v1~rank_v31_ecpm-1-122588486.pc_agg_new_rank&utm_term&#61;flink&#43;%E5%AE%9E%E6%97%B6%E6%9F%A5%E8%AF%A2&#43;%E7%BB%B4%E8%A1%A8&spm&#61;1000.2123.3001.4430


Flink 流批一体的实践与探索

https://blog.csdn.net/zhaodedong/article/details/105424236


监控


Flink 任务实时监控最佳实践

https://mp.weixin.qq.com/s?__biz&#61;Mzg3MDE0MjUzMA&#61;&#61;&mid&#61;2247484144&idx&#61;1&sn&#61;12462bf23cbb4e318857dd53375666b5&chksm&#61;ce9305ddf9e48ccb64e5712ee399b2a10fe1b1fcb7081211109af90da961d6c8a59135860bc0&mpshare&#61;1&scene&#61;23&srcid&#61;0808f76eX4ygFWId3wSbDzbT&sharer_sharetime&#61;1628421639852&sharer_shareid&#61;d73403798b935b929a6ed550a277d0ee#rd


二、FlinkSQL


CDH FlinkSQL 集成 hive

https://www.jianshu.com/p/e964ba3fb8f8


FlinkSQL平台化


Flink SQL on Zeppelin - 打造自己的可视化Flink SQL开发平台

https://mp.weixin.qq.com/s/QbBCO4ul6-hofl-AErld9g


大数据开发之Flink SQL建设实时数仓实践

https://blog.csdn.net/m0_58371965/article/details/122577670


基于 Flink &#43; Hive 构建流批一体准实时数仓

https://mp.weixin.qq.com/s?__biz&#61;MzU3Mzg4OTMyNQ&#61;&#61;&mid&#61;2247489376&idx&#61;1&sn&#61;000fda2c695c88a6542f5cebb3207b64&chksm&#61;fd3b9922ca4c1034b8bc0bff6d091c31c13b41443c3a71f5420007d91bc24b60bb102d6a9a94&xtrack&#61;1&scene&#61;90&subscene&#61;93&sessionid&#61;1601205791&clicktime&#61;1601205953&enterid&#61;1601205953&ascene&#61;56&devicetype&#61;android-26&version&#61;3.0.31.2998&nettype&#61;cmnet&abtest_COOKIE&#61;AAACAA%3D%3D&lang&#61;zh_CN&exportkey&#61;AeaDMVfzSL04VBtRUGcfL2Q%3D&pass_ticket&#61;%2BVHG5JT6TAPRJ0%2BEgPbDiMJd0tzudJm5cBMmrmzu1D1RF1aDyY2nyEIuVQLSQS23&wx_header&#61;1&platform&#61;win


自定义函数

https://www.alibabacloud.com/help/zh/doc-detail/69462.html


三、FlinkCDC


–>> Flink1.11中的CDC Connectors操作实践

https://mp.weixin.qq.com/s/h0RvUH8upF8Cqn7PKfo6Qw


Flink CDC 和 kafka 进行多源合并和下游同步方案

https://blog.csdn.net/qq_24505127/article/details/122761938


FlinkCDC &#43; hudi &#43; hive

https://www.csdn.net/tags/NtjacgzsNTgwODEtYmxvZwO0O0OO0O0O.html

在这里插入图片描述

在这里插入图片描述


—>>> hudi

https://blog.csdn.net/m0_66705151/category_11623872.html


监控


flink自定义metrics监控kafka消费

https://blog.csdn.net/zyy_2018/article/details/119537150

http://t.zoukankan.com/qiu-hua-p-13910809.html


Calcite记录


Apache Calcite 处理流程详解

http://matt33.com/2019/03/07/apache-calcite-process-flow/


flink sql 知其所以然&#xff08;六&#xff09;| flink sql 约会 calcite&#xff08;看这篇就够了&#xff09;

https://mp.weixin.qq.com/s/SxRKp368mYSKVmuduPoXFg


Calcite应用指南

https://blog.csdn.net/hxcaifly/article/details/88661252


基于Calcite自定义SQL解析器

https://blog.csdn.net/weixin_38381496/article/details/117418643


Calcite中定制自已SQL解析器

https://www.jianshu.com/p/e4f883a3b969
https://zhuanlan.zhihu.com/p/65345335


Apache Calcite学习资料

https://zhuanlan.zhihu.com/p/76510053


Calcite系列博客


https://blog.csdn.net/jyh2005/category_9706931.html


https://blog.csdn.net/qxc1281/category_8479654.html


https://www.jianshu.com/nb/35041702


–>https://blog.csdn.net/qq_31183071/category_9427896.html


–>https://blog.csdn.net/weixin_44112790/category_10882344.html


优化


Flink 单并行度内使用多线程&#xff0c;提高写入性能10倍

https://blog.csdn.net/qq_23160237/article/details/103821970


源码分析

–>https://blog.jrwang.me/tags/flink/
https://www.cnblogs.com/ljygz/tag/%E5%AE%9E%E6%97%B6%E8%AE%A1%E7%AE%97/default.html?page&#61;1


实践


Flink 容器化在唯品会的实践

https://mp.weixin.qq.com/s/Bl8HlJ_59ulbwqPNpi2CiA


部署


Flink on K8S

https://cloud.tencent.com/developer/article/1763130


Flink sql 消费kafka的顺序是怎么样的? 解答为什么第二次运行sql的结果和第一次不同

https://blog.51cto.com/u_15278282/4895929


–>> Flink on Yarn 远程 debug 应用提交流程及源码分析

https://zhuanlan.zhihu.com/p/444605072


Flink on yarn 源码分析

https://blog.csdn.net/jhkkhtd/article/details/118029480?spm&#61;1001.2014.3001.5502


Flink on yarn

https://blog.csdn.net/xc_zhou/article/details/124371043?utm_term&#61;flink%E9%A1%B5%E9%9D%A2%E6%8F%90%E4%BA%A4job&utm_medium&#61;distribute.pc_aggpage_search_result.none-task-blog-2allsobaiduweb~default-3-124371043-null-null&spm&#61;3001.4430


Flink 系列博客


王知无

https://blog.csdn.net/u013411339/category_8631091.html


大数据之flink

https://www.cnblogs.com/huanghanyu/category/1758541.html


浪尖

https://blog.csdn.net/rlnlo2pnefx9c/category_10872751.html


Flink 开源项目


zhisheng

https://github.com/zhisheng17/flink-learning


flink-recommandSystem-demo

https://github.com/CheckChe0803/flink-recommandSystem-demo


Flink问题记录汇总

https://developer.aliyun.com/ask/288158?spm&#61;a2c6h.13066369.0.0.14375f93zjXkcc
https://developer.aliyun.com/ask/258515


推荐阅读
  • 深入解析Struts、Spring与Hibernate三大框架的面试要点与技巧 ... [详细]
  • 在iOS开发中,基于HTTPS协议的安全网络请求实现至关重要。HTTPS(全称:HyperText Transfer Protocol over Secure Socket Layer)是一种旨在提供安全通信的HTTP扩展,通过SSL/TLS加密技术确保数据传输的安全性和隐私性。本文将详细介绍如何在iOS应用中实现安全的HTTPS网络请求,包括证书验证、SSL握手过程以及常见安全问题的解决方法。 ... [详细]
  • 2012年9月12日优酷土豆校园招聘笔试题目解析与备考指南
    2012年9月12日,优酷土豆校园招聘笔试题目解析与备考指南。在选择题部分,有一道题目涉及中国人的血型分布情况,具体为A型30%、B型20%、O型40%、AB型10%。若需确保在随机选取的样本中,至少有一人为B型血的概率不低于90%,则需要选取的最少人数是多少?该问题不仅考察了概率统计的基本知识,还要求考生具备一定的逻辑推理能力。 ... [详细]
  • 本文详细介绍了如何安全地手动卸载Exchange Server 2003,以确保系统的稳定性和数据的完整性。根据微软官方支持文档(https://support.microsoft.com/kb833396/zh-cn),在进行卸载操作前,需要特别注意备份重要数据,并遵循一系列严格的步骤,以避免对现有网络环境造成不利影响。此外,文章还提供了详细的故障排除指南,帮助管理员在遇到问题时能够迅速解决,确保整个卸载过程顺利进行。 ... [详细]
  • 本文作为探讨PHP依赖注入容器系列文章的开篇,将首先通过具体示例详细阐述依赖注入的基本概念及其重要性,为后续深入解析容器的实现奠定基础。 ... [详细]
  • Java Web开发中的JSP:三大指令、九大隐式对象与动作标签详解
    在Java Web开发中,JSP(Java Server Pages)是一种重要的技术,用于构建动态网页。本文详细介绍了JSP的三大指令、九大隐式对象以及动作标签。三大指令包括页面指令、包含指令和标签库指令,它们分别用于设置页面属性、引入其他文件和定义自定义标签。九大隐式对象则涵盖了请求、响应、会话、应用上下文等关键组件,为开发者提供了便捷的操作接口。动作标签则通过预定义的动作来简化页面逻辑,提高开发效率。这些内容对于理解和掌握JSP技术具有重要意义。 ... [详细]
  • Java集合框架特性详解与开发实践笔记
    Java集合框架特性详解与开发实践笔记 ... [详细]
  • 分布式开源任务调度框架 TBSchedule 深度解析与应用实践
    本文深入解析了分布式开源任务调度框架 TBSchedule 的核心原理与应用场景,并通过实际案例详细介绍了其部署与使用方法。首先,从源码下载开始,详细阐述了 TBSchedule 的安装步骤和配置要点。接着,探讨了该框架在大规模分布式环境中的性能优化策略,以及如何通过灵活的任务调度机制提升系统效率。最后,结合具体实例,展示了 TBSchedule 在实际项目中的应用效果,为开发者提供了宝贵的实践经验。 ... [详细]
  • 如何正确配置与使用日志组件:Log4j、SLF4J及Logback的连接与整合方法
    在当前的软件开发实践中,无论是开源项目还是日常工作中,日志框架都是不可或缺的工具之一。本文详细探讨了如何正确配置与使用Log4j、SLF4J及Logback这三个流行的日志组件,并深入解析了它们之间的连接与整合方法,旨在帮助开发者高效地管理和优化日志记录流程。 ... [详细]
  • 本文详细介绍了在 Docker 环境中部署 Zookeeper 镜像的最佳实践与步骤。首先,通过 `docker search zookeeper` 命令查找可用的 Zookeeper 镜像。接着,使用 `docker pull zookeeper` 或 `docker pull jplock/zookeeper` 命令下载所需的镜像。文章还涵盖了配置文件的优化、网络设置以及容器运行时的注意事项,为用户提供了一套完整的部署方案。 ... [详细]
  • Python内置模块详解:正则表达式re模块的应用与解析
    正则表达式是一种强大的文本处理工具,通过特定的字符序列来定义搜索模式。本文详细介绍了Python内置的`re`模块,探讨了其在字符串匹配、验证和提取中的应用。例如,可以通过正则表达式验证电子邮件地址、电话号码、QQ号、密码、URL和IP地址等。此外,文章还深入解析了`re`模块的各种函数和方法,提供了丰富的示例代码,帮助读者更好地理解和使用这一工具。 ... [详细]
  • Hadoop 2.6 主要由 HDFS 和 YARN 两大部分组成,其中 YARN 包含了运行在 ResourceManager 的 JVM 中的组件以及在 NodeManager 中运行的部分。本文深入探讨了 Hadoop 2.6 日志文件的解析方法,并详细介绍了 MapReduce 日志管理的最佳实践,旨在帮助用户更好地理解和优化日志处理流程,提高系统运维效率。 ... [详细]
  • 在第二课中,我们将深入探讨Scala的面向对象编程核心概念及其在Spark源码中的应用。首先,通过详细的实战案例,全面解析Scala中的类和对象。作为一门纯面向对象的语言,Scala的类设计和对象使用是理解其面向对象特性的关键。此外,我们还将介绍如何通过阅读Spark源码来进一步巩固对这些概念的理解。这不仅有助于提升编程技能,还能为后续的高级应用开发打下坚实的基础。 ... [详细]
  • 构建高可用性Spark分布式集群:大数据环境下的最佳实践
    在构建高可用性的Spark分布式集群过程中,确保所有节点之间的无密码登录是至关重要的一步。通过在每个节点上生成SSH密钥对(使用 `ssh-keygen -t rsa` 命令并保持默认设置),可以实现这一目标。此外,还需将生成的公钥分发到所有节点的 `~/.ssh/authorized_keys` 文件中,以确保节点间的无缝通信。为了进一步提升集群的稳定性和性能,建议采用负载均衡和故障恢复机制,并定期进行系统监控和维护。 ... [详细]
  • 【并发编程】全面解析 Java 内存模型,一篇文章带你彻底掌握
    本文深入解析了 Java 内存模型(JMM),从基础概念到高级特性进行全面讲解,帮助读者彻底掌握 JMM 的核心原理和应用技巧。通过详细分析内存可见性、原子性和有序性等问题,结合实际代码示例,使开发者能够更好地理解和优化多线程并发程序。 ... [详细]
author-avatar
手机用户2502854133
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有