25-5-23-云计算week2讲义整理
本文最后由方少年更新于2025 年 11 月 10 日,已超过20天没有更新。如果文章内容或图片资源失效,请留言反馈,将会及时处理,谢谢!
当然,下面是 **COMP5349 Week 2: Cloud Storage** 的重点内容**整理与归纳**,帮助你查漏补缺、系统复习。
------
## 📦 Week 2 云存储讲义重点总结(Cloud Storage)
------
### 🔹 一、云存储类型(Cloud Storage Types)
#### 1. Storage as SaaS(面向终端用户)
- 类似本地硬盘,支持共享、协作、版本控制。
- 示例:**Google Drive**、**OneDrive**、**Dropbox**、**iCloud**
#### 2. Storage as IaaS / PaaS(面向开发者或系统)
- 提供底层存储服务,控制权更多。
- 示例:**AWS S3**、**EBS**、**EFS**、**Azure Storage**、**Google Cloud Storage**
#### 3. AWS 各存储服务对比(重点)
| 服务 | 接入方式 | 最大容量 | 延迟 | 成本 |
| ------------------ | --------------- | -------- | ------ | ------ |
| **S3** | API(SDK、CLI) | 无限 | 高 | 非常低 |
| **EBS(SSD)** | 挂载至 EC2 | 16 TiB | 低 | 低 |
| **Instance Store** | 直接附加 | 305 TB | 非常低 | 非常低 |
| **EFS** | NFS 协议 | 无限 | 中等 | 中等 |
------
### 🔹 二、Amazon S3:分布式对象存储(Object Store)
#### 1. 对象存储 vs 文件存储
- 文件存储:层次结构(文件夹、文件)
- 对象存储:每个对象包含
- **唯一 ID**
- **元数据**
- **内容本身**
#### 2. S3 基本概念
- **Bucket**:类比文件夹,是对象的容器,名称全球唯一;
- **Object**:每个“文件”是一个对象,通过 HTTPS API 上传/下载;
- **Key Name**:对象的“路径”,可用 `/` 模拟文件夹结构(伪目录)。
#### 3. URL 样式(两种)
- Path-style: `https://s3.ap-northeast-1.amazonaws.com/bucket-name`
- Virtual-hosted-style: `https://bucket-name.s3-ap-northeast-1.amazonaws.com`
------
### 🔹 三、S3 常见使用场景(Common Use Cases)
| 场景 | 描述 |
| ------------ | ------------------------------------------ |
| 媒体托管 | 视频/音频文件托管,结合 CloudFront CDN |
| 静态网站托管 | 可托管 HTML/JS/CSS 网站 |
| 数据分析 | 存储原始数据、处理后数据,结合 EMR、Athena |
| 备份归档 | 多区域冗余存储,支持数据生命周期管理 |
------
### 🔹 四、S3 存储选项(Storage Classes)
| 类型 | 用途 | 可用区 | 最小存储时间 | 其他限制 |
| ---------------------- | -------------------- | ------ | ------------ | --------------- |
| S3 Standard | 通用、频繁访问 | ≥3 | 无 | - |
| S3 Intelligent-Tiering | 自动分层 | ≥3 | 无 | 自动优化成本 |
| S3 Standard-IA | 不常访问 | ≥3 | 30 天 | 128 KB 最小计费 |
| S3 One Zone-IA | 不常访问、低冗余 | 1 | 30 天 | 更便宜但风险高 |
| S3 Glacier Instant | 归档、快速取回 | ≥3 | 90 天 | 有取回费用 |
| S3 Glacier Flexible | 归档、可配置取回速度 | ≥3 | 90 天 | - |
| S3 Glacier Deep | 法规/超长期归档 | ≥3 | 180 天 | 成本最低 |
#### S3 生命周期管理(Lifecycle)
- 自动将对象迁移至其他存储类别;
- 可设置过期删除对象。
------
### 🔹 五、S3 版本控制(Versioning)
#### 功能说明:
- 防止意外删除、覆盖;
- **开启后上传同名对象**会生成不同版本;
- **删除操作**仅添加“删除标记”(Delete Marker)而非真正删除;
#### 行为对比:
| 操作 | 开启版本控制 | 未开启版本控制 |
| ------------ | ------------ | -------------- |
| 上传同名对象 | 创建新版本 | 覆盖旧对象 |
| 删除对象 | 添加删除标记 | 真正删除 |
| 指定版本删除 | 删除特定版本 | 不适用 |
------
### 🔹 六、S3 数据一致性(Consistency)
- 读写一致性模型
:
- 所有区域支持 **读后写一致性(Read-after-write)**
- GET、PUT、DELETE 等操作立即可见
- 对大数据工作负载友好,简化数据处理。
------
### 🔹 七、S3 冗余 vs 版本控制(Redundancy vs Versioning)
| 功能 | 目的 | 是否默认 | 是否收费 |
| ------------ | ---------------- | ------------ | ---------------------- |
| **冗余存储** | 容灾、高可用 | ✅ 默认开启 | ❌ |
| **版本控制** | 数据保护、防误删 | ❌ 需手动开启 | ✅ 可能产生额外存储费用 |
------
## 🔁 八、S3 跨区域复制(Replication)
#### 概念:
- 自动将对象从源桶复制到目标桶;
- 要求两边都开启版本控制。
#### 应用场景:
- 增强灾备(Disaster Recovery);
- 满足法规合规;
- 降低读取延迟(跨区域部署)。
#### 删除操作的复制行为:
| 删除类型 | 默认行为 | 可选行为 |
| --------------------- | ------------------ | ------------------------------ |
| 删除对象(无版本 ID) | 仅源桶添加删除标记 | 可启用删除标记复制 |
| 删除指定版本 | 仅源桶删除该版本 | 需 **手动删除** 目标桶对应版本 |
------
## ✅ Week 2 总结表
| 模块 | 内容关键词 | 重要性 |
| ------------ | ------------------------------------- | ------ |
| 云存储类型 | SaaS / IaaS / PaaS / 本地硬盘 | ⭐⭐ |
| S3 基本结构 | Bucket, Object, Key Name | ⭐⭐⭐ |
| S3 使用场景 | 媒体托管 / 静态网站 / 数据分析 / 归档 | ⭐⭐⭐ |
| 存储类别 | Standard / IA / Glacier 等 | ⭐⭐⭐ |
| 生命周期管理 | 自动迁移、到期删除 | ⭐⭐ |
| 版本控制 | 多版本、删除标记机制 | ⭐⭐⭐ |
| 跨区域复制 | 版本控制要求、删除行为 | ⭐⭐ |
------
如果你需要我帮你 **制作图解**(比如 S3 存储类对比图、版本控制流程图、生命周期策略图等),我也可以为你生成。需要的话,欢迎告诉我你想看的内容类型,我马上为你生成可视化图表。
文章标题:25-5-23-云计算week2讲义整理
文章链接:https://www.fangshaonian.cn/archives/83/
最后编辑:2025 年 11 月 10 日 18:31 By 方少年
许可协议: 署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)