1.1 引言

数据管理的最新技术, 计算机科学的重要分支

1.1.1 相关概念

数据 Data: 信息的符号记录

数据库 Database: 长期存储中计算机内, 有组织的, 可共享的相关数据的集合

数据库管理系统 DBMS: 位于用户和操作系统之间的一层数据管理软件

数据库系统 DBS: 计算机硬件为基础的记录保持系统, 包括数据库, DBMS, 应用系统, 管理员和用户, 有时还包括计算机硬件

阅读全文 »

计算机网络的起源

1954 年发明 transceiver, 终端到通讯线路到计算机的远程联机系统: 计算机网络的雏形

计算机网络的构建

直接连接: 硬件资源利用率低, 成本高, 线路利用率低
交换网: 先连接到交换机, 交换机再连接到硬件资源, 硬件资源和线路利用率高

交换机连交换机, 构成更复杂的网络

计算机网络的设计目标之一: 通过某种方式组建高效的网络系统, 提升计算机资源和线路的利用率.

阅读全文 »

猛猛玩了一天丝之歌, 好玩确实是好玩, 难也确实是难, 玩了几个小时心力交瘁, 感觉路边随便一个小怪都能一下打我两滴血, 一怒之下做了张图.

昨天晚上发生了一件很扯淡的事, 但我在抢购丝之歌没来得及写, 今天太累了不想写, 有空再说吧.

GitHub链接

低阶 API, 中阶 API, 高阶 API, 登神长阶 API.

低阶 API

线性回归模型

生成随机测试数据.

n = 400
X = 10*torch.rand([n,2])-5.0 # torch.rand是均匀分布
w0 = torch.tensor([[2.0],[-3.0]])
b0 = torch.tensor([[10.0]])
Y = X@w0 + b0 + torch.normal(0.0,2.0,size = [n,1]) # @表示矩阵乘法,增加正态扰动
阅读全文 »

GitHub链接

Pytorch 的动态计算图.

动态计算图

Pytorch 的计算图由节点和边组成, 节点表示张量或者 Function, 边表示张量和 Function 之间的依赖关系.

Pytorch 的计算图是动态图:

  • 计算图的正向传播是立即执行的, 无需等待完整的计算图创建完毕, 每条语句都会在计算图中动态添加节点和边, 并立即执行正向传播得到计算结果.
  • 计算图在反向传播后立即销毁. 如果在程序中使用了 backward 方法执行了反向传播, 或者利用torch.autograd.grad方法计算了梯度, 那么创建的计算图会被立即销毁, 下次调用需要重新创建.
阅读全文 »

GitHub链接

自动微分机制.

神经网络通常依赖反向传播求梯度来更新网络参数, 求梯度过程通常复杂且易出错, 而深度学习框架可以帮我们自动求梯度.

Pytorch 一般通过反向传播方法求梯度, 该方法求得的梯度存在对应自变量张量的 grad 属性下, 也可以调用torch.autograd.grad函数求梯度.

阅读全文 »

终于拿到了心心念念的 Switch2, 也玩上了心心念念的动森.

下一步准备蹲个便宜点的旷野之息卡带, 主机游戏是真的贵啊. 动森想去别人的岛都得开个 VIP, 唉日本人也太坏了.

其实我有点想在这写点类似开荒日志之类的东西, 想想还是算了, 太蠢了.

GitHub链接

张量的基本概念.

数据类型

张量的数据类型 (dtype) 基本和numpy.array一致, 但不支持 str 类型. 包括:

torch.float64(torch.double),
torch.float32(torch.float),
torch.float16,
torch.int64(torch.long),
torch.int32(torch.int),
torch.int16,
torch.int8,
torch.uint8,
torch.bool

一般使用torch.float32类型.

阅读全文 »

GitHub链接

时间序列数据建模.

准备数据

通过继承 torch.utils.data.Dataset 实现自定义时间序列数据集.

torch.utils.data.Dataset 是一个抽象类, 加载自定义数据只需要继承该类并覆写__len__方法返回数据集大小和__getitem__方法返回第 i 个样本即可.

阅读全文 »
0%