数据工程师必备技能

  1. 基础知识
    • 线性代数
    • 矩阵理论
    • 概率论
    • 随机过程
    • 图论
    • 数值分析
    • 最优化理论
    • 机器学习
    • 数据挖掘
  2. 平台
    • Linux
  3. 语言
    • Python
    • Linux shell
  4. 基础库
    • numpy
    • pandas
    • sklearn
    • matplotlib or seaborn
  5. 框架
    • TensorFlow
    • Pytorch
    • Keras
  6. 常用模型
    • CNN
    • RNN(LSTM)
    • GAN
  7. 常用架构(包括transfer learning的方法)
    • VGG
    • Inception
  8. 竞赛平台
    • Kaggle
  9. 常用技巧
    • 爬虫
    • 数据清洗
    • 假设与推断