PyTorch学习记录

PyTorch是一个Python机器学习框架

Python基础

类

class Person:
    def __init__(self, name, age):
        self.name = name
        self.age = age

    def print_info(self):
        print(f"Name: {self.name}, Age: {self.age}")

person1 = Person("Alice", 30)
person1.print_info()

继承

class Student(Person):		# ()内是父类
    def __init__(self, name, age, student_id):
        super().__init__(name, age)		# 调用父类的构造函数
        self.student_id = student_id

    def print_info(self):
        super().print_info()
        print(f"Student ID: {self.student_id}")

with

用法很像C#的using，用于创建一个运行时上下文，当内部代码运行异常时，也能保证资源及时释放

with open("example.txt", "w") as file:
    file.write(content)

PyTorch基础

张量

Tensors

Tensors很像矩阵、向量，在PyTorch中使用Tensors编码输入和输出

构造

import torch
import numpy as np

# 直接构造
data = [[1, 2],[3, 4]]
x_data = torch.tensor(data)
# 使用numpy array转换
np_array = np.array(data)
x_np = torch.from_numpy(np_array)
# 构造一个指定大小的Tensors
shape = (2,3,)
rand_tensor = torch.rand(shape)		# 生成一个2x3的Tensors，内容是随机
ones_tensor = torch.ones(shape)		# 生成一个2x3的Tensors，内容全为1
zeros_tensor = torch.zeros(shape)	# 生成一个2x3的Tensors，内容全为0

数据集

Datasets

PyTorch提供了一些预加载的数据集

加载数据集

from torch.utils.data import Dataset
from torchvision import datasets
from torchvision.transforms import ToTensor

# 下载FashionMNIST数据集
training_data = datasets.FashionMNIST(
    root="data",	# 数据集存放在data文件夹(相对于当前.py的位置)
    train=True,		# 标记是训练数据还是测试数据
    download=True,	# 如果本地文件夹中找不到数据，就去网络上下载
    transform=ToTensor()
)

train_dataloader = DataLoader(training_data, batch_size=64)

规范数据集

Tramsforms

数据格式可能不符合算法输入需要，于是需要用Transforms做处理

training_data = datasets.FashionMNIST(
    root="data",
    train=True,
    download=True,
    transform=ToTensor(),
    target_transform=Lambda(lambda y: torch.zeros(10, dtype=torch.float).scatter_(0, torch.tensor(y), value=1))
)

ToTensor()的作用是将图片、数组转化为FloatTensor，将图片像素的值缩放到[0, 1]

torch.zeros(10, dtype=torch.float)创建了一个10x1的的张量，其内容全为0.0f

scatter_(0, torch.tensor(y), value=1)的作用是将10x1张量的第y位设为1

生成NN

Neural Network

获取设备

device = (
    "cuda"
    if torch.cuda.is_available()
    else "mps"
    if torch.backends.mps.is_available()
    else "cpu"
)

NN类

class NeuralNetwork(nn.Module):		# 继承自nn.Module
    def __init__(self):
        super().__init__()
        self.flatten = nn.Flatten()		# Flatten的作用是将二维图片转化为像素数组
        self.linear_relu_stack = nn.Sequential(		# 按顺序执行模块
            nn.Linear(28*28, 512),		# 创建一个线性层，有28*28个输入特征，512个输出特征
            nn.ReLU(),	# 将线性层转化为非线性
            nn.Linear(512, 512),
            nn.ReLU(),
            nn.Linear(512, 10),
        )

    def forward(self, x):
        x = self.flatten(x)		
        logits = self.linear_relu_stack(x)
        return logits

自动差异化

训练NN最常用的算法是反向传播（back propagation），这是一种根据损失函数（loss function）的梯度（gradient）调整参数的方法

梯度下降法：目标是搜索出一个函数值尽可能小的位置，函数的极小值很有可能是函数的最小值，每次迭代时都将自变量减去 “学习率 x 偏导数”，最后偏导趋近平缓，自变量趋于稳定，且位于极值点处

损失函数

损失函数是用于计算模型输出与目标间的差异，常见的损失函数有：

Loss Function	用途	意义
nn.MSELoss	回归任务	Mean Square Error
nn.NLLLoss	分类	Negative Log Likelihood
nn.CrossEntropyLoss	分类	nn.LogSoftmax + nn.NLLLoss

优化循环

我们需要循环迭代，来调整模型的参数

learning_rate = 1e-3
epochs = 5
loss_fn = nn.CrossEntropyLoss()
optimizer = torch.optim.SGD(model.parameters(), lr=learning_rate)	# 使用随机梯度下降来优化参数
for t in range(epochs):
    print(f"Epoch {t+1}\n-------------------------------")
    train_loop(train_dataloader, model, loss_fn, optimizer)
    test_loop(test_dataloader, model, loss_fn)

每一个循环被称为一个epoch，每一个epoch包含两个部分：

训练循环：训练迭代测试集，试图收敛到最佳参数
测试循环：测试模型性能是否有提升

训练循环

batch_size = 64

def train_loop(dataloader, model, loss_fn, optimizer):
    size = len(dataloader.dataset)
    model.train()
    for batch, (X, y) in enumerate(dataloader):
        # 计算预测值和loss
        pred = model(X)
        loss = loss_fn(pred, y)
        # 反向传播
        loss.backward()			# 计算loss的梯度
        optimizer.step()		# 根据梯度更新参数
        optimizer.zero_grad()	# 清空之前计算的梯度
        
        if batch % 100 == 0:
            loss, current = loss.item(), batch * batch_size + len(X)
            print(f"loss: {loss:>7f}  [{current:>5d}/{size:>5d}]")

测试循环

def test_loop(dataloader, model, loss_fn):
    model.eval()
    size = len(dataloader.dataset)
    num_batches = len(dataloader)
    test_loss, correct = 0, 0

    with torch.no_grad():
        for X, y in dataloader:
            pred = model(X)
            test_loss += loss_fn(pred, y).item()
            correct += (pred.argmax(1) == y).type(torch.float).sum().item()

    test_loss /= num_batches
    correct /= size
    print(f"Test Error: \n Accuracy: {(100*correct):>0.1f}%, Avg loss: {test_loss:>8f} \n")

保存和加载模型

torch.save(model, 'model.pth')
model = torch.load('model.pth')

参考

Learn the Basics