Rust内存管理揭秘：深度剖析指针与智能指针

指针和智能指针是Rust内存管理的基石。理解它们不仅能帮助你编写更高效、安全的代码，还能让你在开发中更好地控制和管理资源。本文将引导你从基础知识开始，逐步深入探讨指针在Rust中的应用，帮助你成为一名更加出色的Rust开发者。

指针

什么是指针

指针是计算机引用无法立即直接访问的数据的一种方式（类比书的目录）
数据在物理内存（RAM）中是分散的存储着
地址空间是检索系统
指针就被编码为内存地址，使用 usize 类型的整数表示。
- 一个地址就会指向地址空间中的某个地方
地址空间的范围是 OS 和 CPU 提供的外观界面
- 程序只知道有序的字节序列，不会考虑系统中实际 RAM 的数量

名词解释

内存地址（地址），就是指代内存中单个字节的一个数
- 内存地址是汇编语言提供的抽象
指针（有时扩展称为原始指针），就是指向某种类型的一个内存地址
- 指针是高级语言提供的抽象
引用，就是指针。如果是动态大小的类型，就是指针和具有额外保证的一个整数
- 引用是 Rust 提供的抽象

Rust 的引用

引用始终引用的是有效数据
引用与 usize 的倍数对齐
引用可以为动态大小的类型提供上述保障

Rust 的引用和指针

static B: [u8; 10] = [99, 97, 114, 114, 121, 116, 111, 119, 101, 108]; static C: [u8; 11] = [116, 104, 97, 110, 107, 115, 102, 105, 115, 104, 0]; fn main() { let a = 42; let b = &B; let c = &C; println!("a: {}, b: {:p}, c: {:p}", a, b, c); }

运行

point_demo on  master [?] is 📦 0.1.0 via 🦀 1.67.1 via 🅒 base ➜ cargo run Compiling point_demo v0.1.0 (/Users/qiaopengjun/rust/point_demo) Finished dev [unoptimized + debuginfo] target(s) in 0.44s Running `target/debug/point_demo` a: 42, b: 0x1023dc660, c: 0x1023dc66a point_demo on  master [?] is 📦 0.1.0 via 🦀 1.67.1 via 🅒 base ➜

一个更加逼真的例子
- 使用更复杂的类型展示指针内部的区别

use std::mem::size_of; static B: [u8; 10] = [99, 97, 114, 114, 121, 116, 111, 119, 101, 108]; static C: [u8; 11] = [116, 104, 97, 110, 107, 115, 102, 105, 115, 104, 0]; fn main() { // let a = 42; // let b = &B; // let c = &C; // println!("a: {}, b: {:p}, c: {:p}", a, b, c); let a: usize = 42; let b: Box&lt;[u8]> = Box::new(B); let c: &[u8; 11] = &C; println!("a (unsigned 整数):"); println!(" 地址: {:p}", &a); println!(" 大小: {:?} bytes", size_of::&lt;usize>()); println!(" 值: {:?}\n", a); println!("b (B 装在 Box 里):"); println!(" 地址: {:p}", &b); println!(" 大小: {:?} bytes", size_of::&lt;Box&lt;[u8]>>()); println!(" 指向: {:p}\n", b); println!("c (C 的引用):"); println!(" 地址: {:p}", &c); println!(" 大小: {:?} bytes", size_of::&lt;&[u8; 11]>()); println!(" 指向: {:p}\n", c); println!("B (10 bytes 的数组):"); println!(" 地址: {:p}", &B); println!(" 大小: {:?} bytes", size_of::&lt;[u8; 10]>()); println!(" 值: {:?}\n", B); println!("C (11 bytes 的数字):"); println!(" 地址: {:p}", &C); println!(" 大小: {:?} bytes", size_of::&lt;[u8; 11]>()); println!(" 值: {:?}\n", C); }

运行

point_demo on  master [?] is 📦 0.1.0 via 🦀 1.67.1 via 🅒 base ➜ cargo run Compiling point_demo v0.1.0 (/Users/qiaopengjun/rust/point_demo) Finished dev [unoptimized + debuginfo] target(s) in 0.19s Running `target/debug/point_demo` a (unsigned 整数): 地址: 0x16dda9a08 大小: 8 bytes 值: 42 b (B 装在 Box 里): 地址: 0x16dda9a10 大小: 16 bytes 指向: 0x12b606ba0 c (C 的引用): 地址: 0x16dda9a30 大小: 8 bytes 指向: 0x10208d7ba B (10 bytes 的数组): 地址: 0x10208d7b0 大小: 10 bytes 值: [99, 97, 114, 114, 121, 116, 111, 119, 101, 108] C (11 bytes 的数字): 地址: 0x10208d7ba 大小: 11 bytes 值: [116, 104, 97, 110, 107, 115, 102, 105, 115, 104, 0] point_demo on  master [?] is 📦 0.1.0 via 🦀 1.67.1 via 🅒 base ➜

对 B 和 C 中文本进行解码的例子
- 它创建了一个与前图更加相似的内存地址布局

use std::borrow::Cow; use std::ffi::CStr; use std::os::raw::c_char; static B: [u8; 10] = [99, 97, 114, 114, 121, 116, 111, 119, 101, 108]; static C: [u8; 11] = [116, 104, 97, 110, 107, 115, 102, 105, 115, 104, 0]; fn main() { let a = 42; let b: String; let c: Cow&lt;str>; unsafe { let b_ptr = &B as * const u8 as *mut u8; b = String::from_raw_parts(b_ptr, 10, 10); let c_ptr = &C as *const u8 as *const c_char; c = CStr::from_ptr(c_ptr).to_string_lossy(); } println!("a: {}, b: {}, c: {}", a, b, c); }

Raw Pointers（原始指针）

Raw Pointer （原始指针）是没有 Rust 标准保障的内存地址。
- 这些本质上是 unsafe 的
语法：
- 不可变 Raw Pointer：*const T
- 可变的 Raw Pointer：*mut T
- 注意：*const T，这三个标记放在一起表示的是一个类型
- 例子：*const String
const T 与mut T 之间的差异很小，相互可以自由转换
Rust 的引用（&mut T 和 &T）会编译为原始指针
- 这意味着无需冒险进入 unsafe 块，就可以获得原始指针的性能
例子：把引用转为原始指针

fn main() { let a: i64 = 42; let a_ptr = &a as *const i64; println!("a: {} ({:p})", a, a_ptr); }

解引用（dereference）：通过指针从 RAM 内存提取数据的过程叫做对指针进行解引用（dereferencing a pointer）
例子：把引用转为原始指针

fn main() { let a: i64 = 42; let a_ptr = &a as *const i64; let a_addr: usize = unsafe {std::mem::transmute(a_ptr)}; println!("a: {} ({:p}...0x{:x})", a, a_ptr, a_addr + 7); }

关于 Raw Pointer 的提醒

在底层，引用（&T 和 &mutT）被实现为原始指针。但引用带有额外的保障，应该始终作为首选使用
访问 Raw Pointer 的值总是 unsafe 的
Raw Pointer 不拥有值的所有权
- 在访问时编译器不会检查数据的合法性
允许多个 Raw Pointer 指向同一数据
- Rust 无法保证共享数据的合法性

使用 Raw Pointer 的情况

不可避免
- 某些 OS 或第三方库需要使用，例如与C交互
共享对某些内容的访问至关重要，运行时性能要求高

Rust 指针生态

Raw Pointer 是 unsafe 的
Smart Pointer（智能指针）倾向于包装原始指针，附加更多的能力
- 不仅仅是对内存地址解引用

Rust 智能指针

名称	简介	强项	弱项
Raw Pointer	mut T 和const T，自由基，闪电般块，极其 Unsafe	速度、与外界交互	Unsafe
`Box<T>`	可把任何东西都放在Box里。可接受几乎任何类型的长期存储。新的安全编程时代的主力军。	将值集中存储在 Heap	大小增加
`Rc<T>`	是Rust的能干而吝啬的簿记员。它知道谁借了什么，何时借了什么	对值的共享访问	大小增加；运行时成本；线程不安全
`Arc<T>`	是Rust的大使。它可以跨线程共享值，保证这些值不会相互干扰	对值的共享访问；线程安全	大小增加；运行时成本
`Cell<T>`	变态专家，具有改变不可变值的能力	内部可变性	大小增加；性能
`RefCell<T>`	对不可变引用执行改变，但有代价	内部可变性；可与仅接受不可变引用的Rc、Arc嵌套使用	大小增加；运行时成本；缺乏编译时保障
`Cow<T>`	封闭并提供对借用数据的不可变访问，并在需要修改或所有权时延迟克隆数据	当只是只读访问时避免写入	大小可能会增大
String	可处理可变长度的文本，展示了如何构建安全的抽象	动态按需增长；在运行时保证正确编码	过度分配内存大小
`Vec<T>`	程序最常用的存储系统；它在创建和销毁值时保持数据有序	动态按需增长	过度分配内存大小
`RawVec<T>`	是`Vec<T>`和其它动态大小类型的基石；知道如何按需给你的数据提供一个家	动态按需增长；与内存分配器一起配合寻找空间	不直接适用于您的代码
`Unique<T>`	作为值的唯一所有者，可保证拥有完全控制权	需要独占值的类型（如 String）的基础	不适合直接用于应用程序代码
`Shared<T>`	分享所有权很难，但他使生活更轻松	共享所有权；可以将内存与T的宽度对齐，即使是空的时候	不适合直接用于应用程序代码

参考

https://www.rust-lang.org/zh-CN
https://github.com/sunface/rust-course
https://www.itbaoku.cn/reference/docs/rust.html

chucklefeed

Rust内存管理揭秘：深度剖析指针与智能指针

Rust内存管理揭秘：深度剖析指针与智能指针

指针

什么是指针

名词解释

Rust 的引用

Rust 的引用和指针

Raw Pointers（原始指针）

关于 Raw Pointer 的提醒

使用 Raw Pointer 的情况

Rust 指针生态

Rust 智能指针

参考

数码科技

人工智能

科技创业

网络安全

行业观察

云南保山交警：一路段存在极大安全隐患，5月30日

燃油管压力传感器接头存安全隐患，斯泰兰蒂斯扩大召回部分进口朱丽叶汽车

连续发生3起安全事故，国家铁路局工程监管司对广湛高铁有关单位开展行政约谈

乌克兰与瑞典签署安全合作协议，加强两国安全领域合作

试行特种设备安全沙盒监管制度及其实施方案公开征求意见

国家安全部：境外间谍机关长期觊觎我稀土产业

以太坊交易签名算法

2024年排名前6的智能合约语言

比特币二层网络

zkSync 2.0 路线图更新：zkEVM 测试网将于五月上线，主网将于八月推出

可信设置如何运作？

验证智能合约代码的不同方法

chucklefeed

Rust内存管理揭秘：深度剖析指针与智能指针

Rust内存管理揭秘：深度剖析指针与智能指针

指针

什么是指针

名词解释

Rust 的引用

Rust 的引用 和 指针

Raw Pointers（原始指针）

关于 Raw Pointer 的提醒

使用 Raw Pointer 的情况

Rust 指针生态

Rust 智能指针

参考

数码科技

人工智能

科技创业

网络安全

行业观察

云南保山交警：一路段存在极大安全隐患，5月30日

燃油管压力传感器接头存安全隐患，斯泰兰蒂斯扩大召回部分进口朱丽叶汽车

连续发生3起安全事故，国家铁路局工程监管司对广湛高铁有关单位开展行政约谈

乌克兰与瑞典签署安全合作协议，加强两国安全领域合作

试行特种设备安全沙盒监管制度及其实施方案公开征求意见

国家安全部：境外间谍机关长期觊觎我稀土产业

以太坊交易签名算法

2024年排名前6的智能合约语言

比特币二层网络

zkSync 2.0 路线图更新：zkEVM 测试网将于五月上线，主网将于八月推出

可信设置如何运作？

验证智能合约代码的不同方法

Rust 的引用和指针