三层栈
应用层 LLM API(OpenAI / Claude) + RAG / Agent 框架
↓
模型层 Hugging Face Transformers / Diffusers
↓
计算层 PyTorch / NumPy / Pandas
不同任务用什么
| 任务 | 主力工具 |
|---|---|
| 数据清洗 / 分析 | Pandas |
| 数学 / 数组运算 | NumPy |
| 经典 ML(回归/分类/聚类) | scikit-learn |
| 训练神经网络 | PyTorch(2026 主流) |
| 用现成模型(NLP/CV) | Hugging Face Transformers |
| 调用 LLM(最常见) | OpenAI / Anthropic SDK |
| 搭 LLM 应用 | LangChain / LlamaIndex / 直接 SDK |
| 部署 API | FastAPI + Pydantic |
| 本地跑 LLM | Ollama / vLLM |
为什么是 PyTorch 不是 TensorFlow
研究界绝大多数论文用 PyTorch;工业界 PyTorch 与 TF 都常见,但新项目用 PyTorch 的占比持续上升。Hugging Face / LLaMA / Stable Diffusion 等开源生态主要构建在 PyTorch 之上。TF 还在维护,但新项目优先 PyTorch。
不需要从底层开始
很多新手以为做 AI 必须先学 NumPy 一年——错。今天 90% 的 AI 工作是"调 LLM API + 写业务逻辑"。
# 这就是 2026 最常见的 AI 代码
from anthropic import Anthropic
client = Anthropic()
msg = client.messages.create(
model="claude-opus-4-7",
max_tokens=1024,
messages=[{"role": "user", "content": "你好"}],
)
print(msg.content[0].text)
不涉及 NumPy / PyTorch / 模型训练。
学习路径建议
1. NumPy / Pandas(数据基础,2-3 篇)
2. sklearn(经典 ML 走一遍,2 篇)
3. PyTorch + 一个完整训练(理解原理,4 篇)
4. Transformer + Hugging Face(看懂模型,2 篇)
5. LLM API + Prompt + RAG + Agent(实战重头戏)
6. 微调 / 本地部署 / 应用部署(按需)
不必每一篇都精通——大多数日常工作只需要其中 30%。
下一篇正式开始:NumPy 入门。