25-5-23-云计算week2讲义整理

当然,下面是 **COMP5349 Week 2: Cloud Storage** 的重点内容**整理与归纳**,帮助你查漏补缺、系统复习。

------

## 📦 Week 2 云存储讲义重点总结(Cloud Storage)

------

### 🔹 一、云存储类型(Cloud Storage Types)

#### 1. Storage as SaaS(面向终端用户)

- 类似本地硬盘,支持共享、协作、版本控制。
- 示例:**Google Drive**、**OneDrive**、**Dropbox**、**iCloud**

#### 2. Storage as IaaS / PaaS(面向开发者或系统)

- 提供底层存储服务,控制权更多。
- 示例:**AWS S3**、**EBS**、**EFS**、**Azure Storage**、**Google Cloud Storage**

#### 3. AWS 各存储服务对比(重点)

| 服务 | 接入方式 | 最大容量 | 延迟 | 成本 |
| ------------------ | --------------- | -------- | ------ | ------ |
| **S3** | API(SDK、CLI) | 无限 | 高 | 非常低 |
| **EBS(SSD)** | 挂载至 EC2 | 16 TiB | 低 | 低 |
| **Instance Store** | 直接附加 | 305 TB | 非常低 | 非常低 |
| **EFS** | NFS 协议 | 无限 | 中等 | 中等 |

------

### 🔹 二、Amazon S3:分布式对象存储(Object Store)

#### 1. 对象存储 vs 文件存储

- 文件存储:层次结构(文件夹、文件)
- 对象存储:每个对象包含
- **唯一 ID**
- **元数据**
- **内容本身**

#### 2. S3 基本概念

- **Bucket**:类比文件夹,是对象的容器,名称全球唯一;
- **Object**:每个“文件”是一个对象,通过 HTTPS API 上传/下载;
- **Key Name**:对象的“路径”,可用 `/` 模拟文件夹结构(伪目录)。

#### 3. URL 样式(两种)

- Path-style: `https://s3.ap-northeast-1.amazonaws.com/bucket-name`
- Virtual-hosted-style: `https://bucket-name.s3-ap-northeast-1.amazonaws.com`

------

### 🔹 三、S3 常见使用场景(Common Use Cases)

| 场景 | 描述 |
| ------------ | ------------------------------------------ |
| 媒体托管 | 视频/音频文件托管,结合 CloudFront CDN |
| 静态网站托管 | 可托管 HTML/JS/CSS 网站 |
| 数据分析 | 存储原始数据、处理后数据,结合 EMR、Athena |
| 备份归档 | 多区域冗余存储,支持数据生命周期管理 |

------

### 🔹 四、S3 存储选项(Storage Classes)

| 类型 | 用途 | 可用区 | 最小存储时间 | 其他限制 |
| ---------------------- | -------------------- | ------ | ------------ | --------------- |
| S3 Standard | 通用、频繁访问 | ≥3 | 无 | - |
| S3 Intelligent-Tiering | 自动分层 | ≥3 | 无 | 自动优化成本 |
| S3 Standard-IA | 不常访问 | ≥3 | 30 天 | 128 KB 最小计费 |
| S3 One Zone-IA | 不常访问、低冗余 | 1 | 30 天 | 更便宜但风险高 |
| S3 Glacier Instant | 归档、快速取回 | ≥3 | 90 天 | 有取回费用 |
| S3 Glacier Flexible | 归档、可配置取回速度 | ≥3 | 90 天 | - |
| S3 Glacier Deep | 法规/超长期归档 | ≥3 | 180 天 | 成本最低 |

#### S3 生命周期管理(Lifecycle)

- 自动将对象迁移至其他存储类别;
- 可设置过期删除对象。

------

### 🔹 五、S3 版本控制(Versioning)

#### 功能说明:

- 防止意外删除、覆盖;
- **开启后上传同名对象**会生成不同版本;
- **删除操作**仅添加“删除标记”(Delete Marker)而非真正删除;

#### 行为对比:

| 操作 | 开启版本控制 | 未开启版本控制 |
| ------------ | ------------ | -------------- |
| 上传同名对象 | 创建新版本 | 覆盖旧对象 |
| 删除对象 | 添加删除标记 | 真正删除 |
| 指定版本删除 | 删除特定版本 | 不适用 |

------

### 🔹 六、S3 数据一致性(Consistency)

- 读写一致性模型

- 所有区域支持 **读后写一致性(Read-after-write)**
- GET、PUT、DELETE 等操作立即可见

- 对大数据工作负载友好,简化数据处理。

------

### 🔹 七、S3 冗余 vs 版本控制(Redundancy vs Versioning)

| 功能 | 目的 | 是否默认 | 是否收费 |
| ------------ | ---------------- | ------------ | ---------------------- |
| **冗余存储** | 容灾、高可用 | ✅ 默认开启 | ❌ |
| **版本控制** | 数据保护、防误删 | ❌ 需手动开启 | ✅ 可能产生额外存储费用 |

------

## 🔁 八、S3 跨区域复制(Replication)

#### 概念:

- 自动将对象从源桶复制到目标桶;
- 要求两边都开启版本控制。

#### 应用场景:

- 增强灾备(Disaster Recovery);
- 满足法规合规;
- 降低读取延迟(跨区域部署)。

#### 删除操作的复制行为:

| 删除类型 | 默认行为 | 可选行为 |
| --------------------- | ------------------ | ------------------------------ |
| 删除对象(无版本 ID) | 仅源桶添加删除标记 | 可启用删除标记复制 |
| 删除指定版本 | 仅源桶删除该版本 | 需 **手动删除** 目标桶对应版本 |

------

## ✅ Week 2 总结表

| 模块 | 内容关键词 | 重要性 |
| ------------ | ------------------------------------- | ------ |
| 云存储类型 | SaaS / IaaS / PaaS / 本地硬盘 | ⭐⭐ |
| S3 基本结构 | Bucket, Object, Key Name | ⭐⭐⭐ |
| S3 使用场景 | 媒体托管 / 静态网站 / 数据分析 / 归档 | ⭐⭐⭐ |
| 存储类别 | Standard / IA / Glacier 等 | ⭐⭐⭐ |
| 生命周期管理 | 自动迁移、到期删除 | ⭐⭐ |
| 版本控制 | 多版本、删除标记机制 | ⭐⭐⭐ |
| 跨区域复制 | 版本控制要求、删除行为 | ⭐⭐ |

------

如果你需要我帮你 **制作图解**(比如 S3 存储类对比图、版本控制流程图、生命周期策略图等),我也可以为你生成。需要的话,欢迎告诉我你想看的内容类型,我马上为你生成可视化图表。

~  ~  The   End  ~  ~


 赏 
感谢您的支持,我会继续努力哒!
支付宝收款码
tips
文章二维码 分类标签:归档TypechoAutoUpload
文章标题:25-5-23-云计算week2讲义整理
文章链接:https://www.fangshaonian.cn/archives/83/
最后编辑:2025 年 11 月 10 日 18:31 By 方少年
许可协议: 署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)
(*) 8 + 3 =
快来做第一个评论的人吧~