Chai's Blog

Home
About
Archive
Portfolio

Archive

keep hungry keep foolish

Show All ⁶⁰ Flink ¹⁸ Spark ¹⁸ Kafka ¹¹ Others ¹¹ Zookeeper ²

Flink-StreamTask启动流程分析

StreamTask OperatorChain分析

Spark Shufflewrite分析

Spark SortShuffleWriter流程分析

SparkSQL JOIN选择策略

Spark ByPassMergeSortShuffleHandler流程分析

Spark UnsafeShuffleWriter流程分析

Flink-TaskExecutor内存分析

Flink-on-Yarn-Per-job分析

平台开发那些事

Zeppelin on Flink小试牛刀

Flink on yarn setup Guide

Flink Configuration Guide

2019

Flink 用户自定义函数实现

Flink Async-IO 源码分析

Flink checkpoint流程源码分析

Kafka事务

Flink-Kafka-Exactly-Once 测试

Json4s 版本不兼容问题分析

多线程相关梳理

异常Kafka'修复'记

Flink流流关联（interval join）总结

Flink1.8-on-hdp-yarn踩坑记

Spark-sql join那些事

Spark-VS-Flink部署模式对比

Kafka-日志存储、清理规则、消息大小估算

KafkaScheduler 调度分析

Kafka消费打印消息格式的设置

Kafka的topic创建流程

String-转成-Boolean

如何判断一个kafka集群是否稳定

2018

Could-not-find-a-'KafkaClient'-entry-in-the-JAAS-configuration-异常分析

让JVM进程退出正确姿势

JobManager & TaskManager 启动流程分析

Flink-VS-Spark

Spark-VS-Flink---流处理中的Time&Window

Flink-部署模式

linux服务器的物理CPU，CPU核数，逻辑CPU及Hadoop的Vcore

Spark框架安全认证实现

Sql-On-Hadoop的流程简要分析

一张图了解Kerberos访问流程

一个“脚本执行夯死”问题的分析

HADOOP和ZOOKEEPER的kerberos认证

Spark应用配置文件汇总

为何Zookeeper的日志直接打印到控制台（console）

SparkStreaming-VS-Structed-Streaming

Kafka-Produce流程

Structed-Streaming-页面job显示不连续原因分析

yarn-cluster模式spark应用客户端与集群的通信端口

StructedStreaming 流程分析

Spark 应用分片介绍

KafkaLeader选举时机和选举策略

Spark-on--hdp-Yarn-Cluster-踩坑(timeline-service)

Spark-on--hdp-Yarn-Cluster-踩坑(hdp-version)

mvn编译异常“was-cached-in-the-local-repository,-resolution-will-not-be-rea

Kafka沟通机制

找出进程消失的“案发现场

大数据爬坑收录

Spark 配置

2017

Spark metrics

Copyright © Chai's Blog 2020
Powered by Hux Blog |