Waiting for the right person!

Is you?


  • 首页

  • 分类

  • 标签

  • 归档

  • 关于

2019-10-28-flink kafka获取数据实时写入hdfs.md

发表于 2019-10-28 | 分类于 Flink |

Flink 写入hdfs

阅读全文 »

flink 入门实战

发表于 2019-10-22 | 分类于 Flink |

Flink 入门记录

阅读全文 »

python 单例模式

发表于 2019-10-18 | 分类于 Python |

虽然一直都知道单例模式,但是一直都没有系统的了解

阅读全文 »

flume 自定义es sink

发表于 2019-10-14 | 分类于 Flume |

自定义flume sink

阅读全文 »

hive 常用sql记录

发表于 2019-09-17 | 分类于 BigData |

记录一些hive常用的sql

阅读全文 »

一文读懂大数据各组件.md

发表于 2019-09-12 | 分类于 BigData |

随着慢慢深入学习大数据的个个组件,记录一下这些组件的功能与使用。

阅读全文 »

pyspark df添加列

发表于 2019-09-05 | 分类于 BigData |

编写pyspark任务,对df添加新的列。
使用自定义函数和自带的函数。

阅读全文 »

hive表迁移到spark on hdfs集群(跨集群迁移)

发表于 2019-09-04 | 分类于 BigData |

由于源数据在于旧的hbase集群的hdfs上,并未开启8020端口,没办法直接通过文件迁移到新集群。只能通过pyspark 读取hive表数据,写入新的集群的hdfs中。

阅读全文 »

zeppelin安装搭建

发表于 2019-08-20 | 分类于 Docker |

安装搭建zeppelin,测试zeppelin查询hbase/phoenix表

阅读全文 »

Ganglia-api

发表于 2019-08-09 | 分类于 Docker |

ganglia-api添加到ganglia镜像中

阅读全文 »
1 2 … 6
孙晓聪

孙晓聪

25岁的我还不知道在追寻什么!!!

56 日志
13 分类
RSS
GitHub
Creative Commons
推荐阅读
  • 阮一峰的网络日志
  • R的极客理想系列
  • GuangchuangYu
  • cloudman博客(云相关openstack,k8s)
  • 大数据,机器学习
© 2019 - 2019 孙晓聪