数据科学知识体系概览
问题
Python 数据科学涉及哪些核心库和知识?
答案
知识体系
| 主题 | 核心内容 | 面试重要度 |
|---|---|---|
| NumPy | ndarray、广播、向量化、内存布局 | ⭐⭐⭐⭐⭐ |
| Pandas | DataFrame、分组聚合、时间序列 | ⭐⭐⭐⭐⭐ |
| 数据处理 | ETL、缺失值、特征工程 | ⭐⭐⭐⭐ |
| 数据可视化 | Matplotlib、Seaborn、Plotly | ⭐⭐⭐ |
技术栈生态
| 层次 | 库 | 说明 |
|---|---|---|
| 数值基础 | NumPy、SciPy | 多维数组、科学计算 |
| 数据处理 | Pandas、Polars | 表格数据处理 |
| 可视化 | Matplotlib、Seaborn、Plotly | 图表绑定 |
| 机器学习 | Scikit-learn | 传统 ML 算法 |
| 深度学习 | PyTorch、TensorFlow | 神经网络 |
| Notebook | Jupyter | 交互式编程 |