study/ZiuChen.github.io

Fork 0

mirror of https://github.com/ZiuChen/ZiuChen.github.io.git synced 2025-08-17 23:19:55 +08:00

ZiuChen 25f4e199cd docs: rust note

2024-04-07 21:28:58 +08:00

42 KiB

Raw Blame History

Rust

Rust 环境搭建

rustup 是一个用于管理 Rust 版本和相关工具的命令行工具。

Unix 系统:

$ curl --proto '=https' --tlsv1.2 https://sh.rustup.rs -sSf | sh

Windows 系统:

下载并安装 rustup-init.exe.

安装完毕后，在命令行执行：

rustc --version

可以看到输出的版本号信息，则 rust 已安装完毕。

Hello, Rust!

mkdir hello_rust

创建并编辑第一个 Rust 程序：

// main.rs
fn main() {
    println!("Hello, Rust!");
}

执行 rustc ./hello_rust/main.rs

可以看到在代码同目录下输出了二进制文件 main，在命令行中执行：

./main

可以看到输出：

> Hello, Rust!

下面我们分析一下这个程序：

在 Rust 中，函数名为 main 的函数是一个特殊的函数，它总是会被最先执行：

fn main() {

}

在函数体中的代码：

    println!("Hello, Rust!")

println! 是一个 Rust 宏（macro），它与函数调用的区别是它以 ! 结尾。

"Hello, Rust!" 是一个字符串，传递给了 println! 宏。

Rust 程序的编译和运行是独立进行的，这意味着你可以将编译产物直接发送给别人，别人不需要安装 Rust 也可以运行

这与 Ruby Python JavaScript 这类动态语言不同，Rust 是一门预编译静态语言（ahead-of-time compiled）

简单项目可以使用 rustc，但随着项目复杂度增长，我们可以使用 cargo 来管理项目中的三方依赖、管理真实世界中 Rust 程序开发的方方面面。

Cargo

# 初始化一个 Cargo 项目
cargo new hello_cargo

执行 cargo new 后会自动帮你初始化一个 Git 仓库，如果你是在一个现存的 Git 仓库中执行的初始化，那么就不会执行此操作。

除了帮你创建了一个 HelloWorld 代码，cargo 还创建了一个 cargo.toml 文件：

[package]
name = "hello_cargo"
version = "0.1.0"
edition = "2021"

# See more keys and their definitions at https://doc.rust-lang.org/cargo/reference/manifest.html

[dependencies]

[package]、[dependencies] 分别代表是一个片段：

其中 [package] 下的字段 name、version 和 edition 表示项目的名称、项目的版本和使用的 Rust 版本。
[dependenciese] 中记录着项目的第三方依赖，这些依赖被称为 crates

Cargo 期望所有的源代码都存放在 src/ 目录下，项目根目录中保存如 README、LICENSE 这类的文件。

在 Cargo 中构建和运行项目

执行 cargo build 可以构建项目：

cargo build

构建产物将输出在 target/debug/ 目录下，这是因为 cargo build 是调试构建（debug build）

执行：

cargo run

即可运行刚刚 build 输出的产物。如果你在 cargo run 之前未构建或修改了代码，cargo 会自动帮你完成 re-build 并执行代码。

cargo check

这个命令可以帮你完成代码的静态检查且不输出任何文件，由于它不需要准备输出构建产物，所以它比 cargo build 要快得多。

发布构建

与调试构建不同，可以执行：

cargo build --release

来构建一个用于生产环境的产物，这会在 target/release/ 下输出产物而不是 target/debug/ 下。

发布构建的产物往往有针对生产的更多优化，同时构建需要花费的时间也更长，这也是为什么要有调试构建与发布构建的区分：调试构建用于开发时更快的看到最终效果，需要经常快速地执行构建，而发布构建则是为了最终用户使用时构建的。

Gussing Game

写一个猜数游戏：

使用 use 标识符来从标准库中引入 io 库，之后就可以在当前作用域中通过 io:stdin() 读取到用户输入：

use std::io;

fn main() {
    println!("Guess the number!");

    println!("Please input your guess.");

    let mut guess = String::new();

    io::stdin()
        .read_line(&mut guess)
        .expect("Failed to read line");

    println!("You guessed: {guess}");
}

执行 cargo run 后测试一下：

Guess the number!
Please input your guess.
6
You guessed: 6

使用变量保存数据

在 Rust 中，使用 let 与 const 声明的变量默认都是不可变的，通过给 let 声明的变量加上 mut 标记，来让 guess 这个变量可变（mutatiable）

::new 中的 :: 表明：new 是 String 类型的一个关联函数，在一些语言中它被称之为静态方法（static function）

总的来说，let mut guess = String::new(); 这一行创建了一个可变变量，当前它绑定到一个新的 String 空实例上。

读取用户输入

如果在程序开头我们没有使用 use 来引入 io 库，在代码中我们也可以这样写：

std::io::stdin()

来动态地引入 io 库，通过 read_line 来从标准输入句柄获取用户输入。

将 &mut guess 传递给 read_line，其中 & 表明传递的是一个变量的引用，同时由于变量是不可变的，&mut 表示这个引用可以修改。

使用 Result 类型处理潜在错误

前文中我们说 read_line 会持续地将用户输入附加到传递给它的字符串中，它也会返回一个 Result 类型的值。

Result 类型是一个枚举类型，包含两种成员类型：

Ok: 表示操作成功，内部包含成功时产生的值；
Err: 表示操作失败，包含失败的前因后果。

这些 Result 类型的作用是处理错误信息，Result 的实例具有 expect 方法，如果 io:Result 实例的值是 Err，expect 会导致程序崩溃，并显示错误信息。

如果 read_line 返回 Err，则可能是来源于底层操作系统错误的结果。如果 Result 实例的值是 Ok，expect 会获取 Ok 中的值并原样返回。

在此例子中，这个值是用户输入到标准输入中的字节数。

使用 println! 占位符打印值

下面这两种 println! 是等价的，他们都可以将变量打印到指定位置：

println!("You guessed: {guess}");
println!("You guessed: {}", guess);

生成一个随机数

在 Rust 标准库中不包含随机数功能，我们可以使用 rand crate：

cargo add rand

安装后，我们到 Cargo.toml 中可以看到：

[dependencies]
rand = "0.8.5"

这里的 "0.8.5" 实际上是 "^0.8.5" 的简写，它表示至少是 0.8.5 但小于 0.9.0 的版本。

具体可以参看语义化版本（Semantic Versioning）

Cargo 通过 Cargo.lock 文件来保证每一次构建都是可以被重现的，任何人在任何时候重新构建代码都会产生相同的结果，Cargo 只会使用你指定的依赖版本。

如果 rand 库下周发布了 0.8.6 版本，新版本中修复了一个 BUG 但存在破坏性变更，如果你没有显式地在 Cargo.toml 中升级 rand 库，那 Cargo 会按照上一次构建成功时生成的 Cargo.lock 记录的第三方库版本来构建。

如果你确实要升级 crate，可以使用：

cargo update

来忽略 Cargo.lock 文件，并计算所有符合 Cargo.toml 声明的最新版本。

安装完了 rand crate，我们下面来生成一个随机数：

use std::io;
use rand::Rng;

fn main() {
    println!("Guess the number!");

    let secret_number = rand::thread_rng().gen_range(1..=100);

    println!("The secret number is: {secret_number}");

    println!("Please input your guess.");

    let mut guess = String::new();

    io::stdin()
        .read_line(&mut guess)
        .expect("Failed to read line");

    println!("You guessed: {guess}");
}

use rand:Rng; 其中，Rng 是一个 trait，它定义了随机数生成器实现的方法的话，此 trait 必须在作用域中。

我们调用 rand::thread_rng 函数提供实际使用的随机数生成器：它位于当前执行线程的本地环境中，从操作系统获取 seed。

随后调用随机数生成器的 gen_range 方法，它由 Rng trait 定义，获取一个范围表达式（Range expression）作为参数，并生成一个在此范围之间的随机数。

范围表达式使用 start..=end 这样的形式，如 1..=100 就代表 1 到 100 之间。

::: info 你不可能凭空知道应当 use 哪个 trait，以及应当从 crate 中调用哪个方法，因此每个 crate 都有说明文档。通过调用 cargo doc --open 来构建所有本地依赖提供的文档并在浏览器中打开。 :::

对比两个数字

// 此代码不可运行
use rand::Rng;
use std::cmp::Ordering;
use std::io;

fn main() {
    // --snip--

    println!("You guessed: {guess}");

    match guess.cmp(&secret_number) {
        Ordering::Less => println!("Too small!"),
        Ordering::Greater => println!("Too big!"),
        Ordering::Equal => println!("You win!"),
    }
}

我们引入 std::cmp::Ordering 到作用域中。Ordering 也是一个枚举，其成员包含 Less、Greater 和 Equal，这是在两个值进行比较时可能出现的三种结果。

cmp 方法用于比较两个值，并且可以在任何可比较的值上调用。它获取一个被比较值的引用：将 guess 与 secret_number 作比较。然后返回一个通过 use 引入作用域的 Ordering 枚举的成员。

使用 match 表达式，根据对 guess 和 secret_number 调用 cmp 返回的 Ordering 成员，来决定下一步应该要做什么。

match 表达式由众多的分支（arms）构成，每个分支都包含一个 pattern 以及 pattern 被匹配时要执行的代码。

尝试执行此代码，编译器会抛出错误：不匹配的类型（mismatched types）。Rust 有一个静态强类型系统，同时也有类型推断。

当我们写出 let guess = String::new(); 时，Rust 会帮我们推断出 guess 变量应当是 String 类型。

而 secret_number 是 1 - 100 之间的数字类型，而符合这个要求（1~100之间）的数字，在 Rust 中有下面几种：

i32 32位数字；
u32 32位无符号数字；
i64 64位数字
等等 ...

Rust 默认使用 i32，所以 Rust 默认为 secret_number 推断出的类型是 i32，导致了字符串与数字作对比的情况。

要将 String 转化为数字类型才能与 secret_number 作比较：

let guess: u32 = guess.trim().parse().expect("Please type a number!");

上面的代码将重新声明 guess 变量，这个特性叫隐藏（Shadowing），通过 guess.trim() 去除字符串头尾的空白字符（如用户输入 5 并按下空格后，在 Unix 系统中 guess 的值为 5\n，在 Windows 系统中 guess 的值为 5\r\n）

guess.parse() 方法会将字符串转换为其他类型，通过给 guess 显式指定类型来告诉 guess 方法转化的目标类型，这里的目标类型是 u32。

同时，为了防止字符串中包含特殊字符等原因导致 parse 执行失败，这里用 expect 来对转化是否成功进行提示：

如果 parse 不能从字符串生成一个数字，返回一个 Result 的 Err 成员时，expect 方法会使程序结束并打印附加的信息。
如果 parse 成功执行，那么它会返回 Result 的 Ok 成员，然后 expect 会返回 Ok 值中的数字。

使用循环来允许多次猜测

可以使用 loop 关键字来创建一个无限循环，给用户更多机会来猜数。

    println!("The secret number is: {secret_number}");

    loop {
        println!("Please input your guess.");

        // --snip--

        match guess.cmp(&secret_number) {
            Ordering::Less => println!("Too small!"),
            Ordering::Greater => println!("Too big!"),
            Ordering::Equal => {
                println!("You win!");
                break;
            },
        }
    }

当用户成功猜对后，会执行 break; 退出程序。

忽略非数字的猜测并继续游戏

目前的代码如果用户输入了非数字，会导致 parse 失败，进而导致程序退出，因此我们需要改写这部分的逻辑，将 expect 调用改为 match：

        // --snip--

        io::stdin()
            .read_line(&mut guess)
            .expect("Failed to read line");

        let guess: u32 = match guess.trim().parse() {
            Ok(num) => num,
            Err(_) => continue,
        };

        println!("You guessed: {guess}");

        // --snip--

这样当遇到错误时程序不再崩溃，而是进入到 match 的错误分支中处理错误：调用 continue; 继续循环。

总结

这一章里我们学习了使用 let 声明变量、变量隐藏、类型转化、match 处理多分支任务、loop 循环。

还学习了外部 crate 的使用、如何指定数据类型等

常见编程概念

变量和可变性

变量默认是不可变的（Immutable），这是 Rust 提供的众多特性之一：

下面的代码由于修改了 x 导致编译不通过：

fn main() {
    let x = 5;
    println!("x is {}", x);
    x = 6;
    println!("x is {}", x);
}

编译器抛出的错误信息：cannot assign twice to immutable variable x

要让 x 变得可变，可以在声明 let 后添加 mut：

let mut x = 5;

这样就可以修改 x 的值了。

除了 let，还可以通过 const 声明一个常量：

常量总是不可变，且不允许对常量使用 mut
必须在声明时注明值的类型
常量只能被设置为常量表达式，而不是任何只能在运行时计算出的值

const THREE_HOURS_IN_SECONDS: u32 = 60 * 60 * 3;

这里的 60 * 60 * 3 会在编译器编译时执行运算，这使我们可以选择更容易理解和验证的方式来写出这个值，而不是直接将常量设置为 10,800。

在前文中我们介绍了变量隐藏，后声明的同名变量将会屏蔽掉之前声明的变量，直到新的变量也被隐藏或作用域结束：

fn main() {
    let x = 5; // 5

    let x = x + 1; // 6

    {
        let x = x * 2;
        println!("x is {}", x); //  12
    }

    println!("x is {}", x); // 6
}

需要注意的是，隐藏与将变量标记为 mut 是有区别的，当对变量进行重新赋值时，如果没有使用 mut 那么会导致编译时错误。通过变量隐藏，我们可以用新的变量进行一些计算，但计算完之后变量依然是不可变的。

mut 与隐藏的另一个区别是：当再次使用 let 声明变量时，隐藏实际上创建了一个新的变量，我们可以改变值的类型，只不过复用这个名字：

如果没有变量隐藏，代码可能会像这样：

let spaces_str = "    ";
let spaces_num = spaces_str.len();

利用变量隐藏，我们可以简单地复用相同变量名：

let spaces = "    "; // 文本之间的空格数量
let spaces = spaces.len(); // 多少个空格

然而，如果使用 mut，他不允许修改变量的类型：

let spaces = "    ";
spaces = spaces.len(); // 错误：不能改变变量的类型

数据类型

在 Rust 中，每一个值都属于某一种数据类型（data type），这告诉 Rust 它被指定为何种数据。

Rust 是静态类型（statically typed）语言编译时必须知道所有变量的类型，当多种类型均有可能时，例如使用 parse 将 String 转换为数字时，必须增加类型注解，像这样：

let guess: u32 = "42".parse().expect("Not a number!")

在 Rust 中有两种数据类型子集：标量和复合

标量类型（scalar）

整型

整型是一个没有小数部分的数字，例如 u32 代表一个占据 32 bit 的无符号整数。其中有符号和无符号代表数字能否为负值。

长度	有符号	无符号
8-bit	i8	u8
16-bit	i16	u16
32-bit	i32	u32
64-bit	i64	u64
128-bit	i128	u128
arch	isize	usize

有符号的整型可以存储从 -(2^{n-1}) 到 2^{n-1}-1 在内的数字，这里的 n 代表位数。

例如 i8 可以存储 -(2^7) 到 2^7-1 在内的数字，也就是从 -128 到 127。

无符号的整型可以存储从 0 到 $2^n-1$的数字。

所以 u8 可以存储 0 到 2^8-1 的数字，也就是 0 到 255。

另外，isize 与 usize 类型依赖运行程序的计算机架构：在 64 位架构上，它们是 64 位的，在 32 位架构上，它们是 32 位的。分别等价于 i64 i32 与 u64 和 u32。

除了通过类型指定变量的整型类型，还可以以后缀形式使用类型，例如 let x = 57u8;。还可以通过数字字面值来指定类型：

1000 与 1_000 等价，但后者更易读。

数字字面值	例子
Decimal (十进制)	98_222
Hex (十六进制)	0xff
Octal (八进制)	0o77
Binary (二进制)	0b1111_0000
Byte (单字节字符)(仅限于u8)	b'A'

浮点型

在 Rust 中有两个原生浮点数类型：

f32 单精度浮点数，占 32 位
f64 双精度浮点数，占 64 位，现代 CPU 中，它与 f32 速度几乎一样，不过精度更高

浮点数都是有符号的。

fn main() {
    let x = 2.0; // f64
    let y: f32 = 3.0; // f32
}

Rust 中的所有数字类型都支持基本数学运算：加法、减法、乘法、除法和取余。整数除法会向零舍入到最接近的整数：

fn main() {
    // addition
    let sum = 5 + 10;

    // subtraction
    let difference = 95.5 - 4.3;

    // multiplication
    let product = 4 * 30;

    // division
    let quotient = 56.7 / 32.2;
    let truncated = -5 / 3; // 结果为 -1

    // remainder
    let remainder = 43 % 5;
}

布尔型

let t = true;
let f: bool = false;

字符类型

Rust 的 char 类型是语言最原生的字母类型，大小为四个字节：

fn main() {
    let c = 'z';
    let z: char = 'ℤ'; // 显式类型声明
    let heart_eye_cat = '😻';
}

复合类型（compound）

复合类型（Compound types）可以将多个值组合成一个类型。Rust 有两个原生的复合类型：元组（tuple）和数组（array）。

元组类型

元组是一个将多个其他类型的值组合进一个复合类型的主要方式。元组长度固定：一旦声明，其长度不会增大或缩小。

fn main() {
    let tup: (i32, f64, u8) = (500, 6.4, 1);
}

可以使用模式匹配（pattern matching）来解构（destructure）元组值：

fn main() {
    let tup = (500, 6.4, 1);

    let (x, y, z) = tup;

    println!("{}", y); // 6.4
}

也可以直接用 . 跟随值的索引来访问元组中的元素：

fn main() {
    let tup = (500, 6.4, 1);
    
    let x = tup.0;
    let y = tup.1;
    let z = tup.2;

    println!("{}", x); // 500
}

不带任何值的元组有个特殊的名称，叫做单元（unit）元组。这种值以及对应的类型都写作 ()，表示空值或空的返回类型。如果表达式不返回任何其他值，则会隐式返回单元值。

数组类型

与元组不同，数组中每个元素的类型必须相同。

Rust 中的数组长度是固定的。

fn main() {
    let a = [1, 2, 3, 4, 5];
}

当你想要在栈（stack）而不是在堆（heap）上为数据分配空间（第四章将讨论栈与堆的更多内容），或者是想要确保总是有固定数量的元素时，数组非常有用。

但是数组并不如 vector 类型灵活。

vector 类型是标准库提供的一个允许增长和缩小长度的类似数组的集合类型。当不确定是应该使用数组还是 vector 的时候，那么很可能应该使用 vector。

然而，当你确定元素个数不会改变时，数组会更有用。

例如，当你在一个程序中使用月份名字时，你更应趋向于使用数组而不是 vector，因为你确定只会有 12 个元素。

let months = ["January", "February", "March", "April", "May", "June", "July",
              "August", "September", "October", "November", "December"];

声明数组时，可以像这样编写数组的类型，既能约束数组中元素的类型，还能限制数组的长度：

let a: [i32; 5] = [1, 2, 3, 4, 5];

这里的 i32 代表每个元素的类型，分号之后的 5 代表数组的长度为 5，包含五个元素。

还可以在类型声明中指定初始值：

let b: [3, 5];

这样变量 b 就是一个长度为 5，初始值全为 3 的数组。

数组是可以在栈 (stack) 上分配的已知固定大小的单个内存块。可以使用索引来访问数组的元素，像这样：

let c = [1, 2, 3, 4, 5];

let x = c[0]; // 1
let y = c[1]; // 2

通过索引从数组中取值的操作如果是在运行时进行的，那么代码可以顺利通过编译，但在运行时会出错：

下面这段代码可以正常通过编译，当你输入 0 1 2 3 4 访问数组时工作正常，但一旦输入了超过数组长度的索引如 10，就会抛出错误。

use std::io;

fn main() {
    let a = [1, 2, 3, 4, 5];

    println!("Please enter an array index.");

    let mut index = String::new();

    io::stdin()
        .read_line(&mut index)
        .expect("Failed to read line");

    let index: usize = index
        .trim()
        .parse()
        .expect("Index entered was not a number");

    let element = a[index];

    println!("The value of the element at index {index} is: {element}");
}

thread 'main' panicked at 'index out of bounds: the len is 5 but the index is 10', src/main.rs:19:19
note: run with `RUST_BACKTRACE=1` environment variable to display a backtrace

函数

必须显式指定参数的类型
通过 -> 指定返回值的类型
函数结尾不包含分号时，隐式返回表达式

fn main() {
    print_labeled_measurement(188, 's');

    let f: i32 = five();
    println!("five: {}", f);
}

fn print_labeled_measurement(value: i32, unit_label: char) {
    println!("The measurement is: {value}{unit_label}");
}

fn five() -> i32 {
    // 结尾不包含分号 隐式返回表达式
    5
}

控制流

if-else & else-if

可以省略 if 与条件之间的空格
不允许隐式转换

fn main() {
    let number = 3;

    if number < 5 {
        println!("Yes.");
    } else {
        println!("No.");
    }
}

// 不允许隐式转换 条件表达式必须返回一个布尔值
if number {
    println!("Yes.");
}

if number != 0 {
    println!("Yes.");
}

if 可以返回一个值，因此可以在 let 语句中使用 if：

fn main() {
    let condition = true;
    // if 与 else 分支的结果都为 i32
    let number = if condition { 5 } else { 6 };

    println!("number: {}", number);
}

由于类型必须在编译时被确定，编译器会自动识别出不符合这一原则的 if-in-let 声明：

fn main() {
    // 编译报错 因为 if 与 else 分支的结果类型不同
    let number = if condition { 5 } else { "six" }
}

循环

break; 用于中止循环
continue; 用于跳过当次循环
break; 可以从循环返回表达式

fn main() {
    let mut count = 0;

    let result = loop {
        count += 1;

        if (count == 10) {
            break count * 2;
        }
    }

    println!("result: {}", result); // 20
}

循环标签：在多个循环之间消除歧义

如果你存在一个嵌套的循环，而 break; 与 continue; 只会应用于此时最内层的循环，可以通过循环标签来让这些关键字应用于已标记的循环：

fn main() {
    let mut count = 0;
    'counting_up: loop {
        println!("count = {count}");
        let mut remaining = 10;

        loop {
            println!("remaining = {remaining}");
            if remaining == 9 {
                break;
            }
            if count == 2 {
                break 'counting_up;
            }
            remaining -= 1;
        }

        count += 1;
    }
    println!("End count = {count}");
}

上面的代码中，第一个 break; 语句只会退出内层循环，而 break 'counting_up'; 语句将直接退出外层循环。

除了 loop，Rust 还支持通过 while 来控制循环：

fn main() {
    let mut number = 3;

    while number != 0 {
        println!("{number}!");

        number -= 1;
    }

    println!("LIFTOFF!!!");
}

当我们要实现遍历集合中的元素时，用 for 会更方便：

fn main() {
    let a = [10, 20, 30, 40, 50];

    for element in a {
        println!("value is {}", a);
    }
}

for 亦可用于计时：

这段代码中用到了 .rev() 方法来将 range 反转

fn main() {
    for number in (1..4).rev() {
        println!("{number}!");
    }
    println!("LIFTOFF!!!");
}

所有权

什么是所有权

Rust 的核心功能之一就是所有权（ownership）。

所有程序都必须管理其运行时使用计算机内存的方式：

一些语言具有垃圾回收机制，在程序运行时有规律地寻找不再使用的内存；
在另一些语言中，程序员必须亲自分配和释放内存；
Rust 则选择了第三种方式，通过所有权系统管理内存

编译器在编译时会根据一系列的规则进行检查，如果违反了任何这些规则，程序都不能编译。

Rust 中每一个值都有一个所有者（owner）；
值在任一时刻只有且只有一个所有者；
当所有者（变量）离开作用域，这个值会被丢弃。

{
    // s 尚未被声明 无法访问
    let s = "Hello"; // 在此处起 s 是有效的
    // 声明后 在作用域内 你可以使用 s
}
// 作用域外 s 被销毁，使用 s 是不被允许的

在上面的代码中有两个重要的时间点：

s 进入作用域时，它是有效的
这一直持续到它离开作用域为止

为了演示所有权的规则，我们需要引入一个存储在堆上的数据类型

之前由字符串字面量创建字符串时，在编译阶段就知道其内容，这部分内容被硬编码存储在最终的编译结果中。

但通过 String 创建的字符串，此类型管理被分配到堆上的数据，所以能够存储在编译时未知大小的文本：

let s = String::from("Hello");

双冒号 :: 是一种运算符，它允许将特定的 from 函数置于 String 类型的命名空间（namespace）下，而不需要使用如 string_from 这样的名字。

可以修改此类字符串：

let mut s = String::from("Hello");
s.push_str(", World!"); // 在 s 后追加字面值
println!("s: {}", s); // "Hello, World!"

不同于通过字符串字面量创建的字符串，此类字符串可以被修改。这是因为两种类型在内存上的处理不同：

通过字符串字面量创建的字符串：被硬编码进最终的可执行文件中，这使得字符串字面值快速且高效，但代价是它的不可变性。
String 类型为了支持可变、可增长的文本片段，需要在堆上分配一块在编译时未知大小的内存来存放内容

必须在运行时向内存分配器（memory allocator）请求内存
需要一个当我们处理完 String 时将内存返回给分配器的方法

对于 1. 我们已经通过 String::from 完成，然而对于 2. 在 Rust 中则是采用这样的策略：内存在拥有它的变量离开作用域时就被自动释放：

{
    let s = String::from("Hello");
} // 作用域结束
// 此时 s 不再有效

这是一个将 String 需要的内存返回给分配器的很自然的位置：当 s 离开作用域的时候。当变量离开作用域，Rust 为我们调用一个特殊的函数。这个函数叫做 drop，在这里 String 的作者可以放置释放内存的代码。Rust 在结尾的 } 处自动调用 drop。

以整型数据为例，同一数据可以被不同的变量绑定：

let x = 5;
let y = x;

将 5 绑定到变量 x，生成一个值 x 的拷贝并绑定到变量 y 上，因为整型是已知固定大小的简单值，所以两个 5 都被放入了栈中。

再举一个 String 版本的例子：

let s1 = String::from("Hello");
let s2 = s1;

虽然做的事情是一样的，但内存分配上完全不同：

如果 s1 未被销毁，两个变量指向了同一个内存空间，存在二次释放的风险；
如果重新开辟新的内存空间被开辟，会带来性能问题；

因此，当执行 s2 = s1 时，不会有新的内存空间被开辟，s1 被标记为无效，不再允许被使用，s2 是有效的，当其离开自己的作用域就释放自己的内存。

Rust 永远不会自动创建数据的“深拷贝”，因此任何自动的复制都会被认为是对运行时性能影响较小的。

如果我们确实需要深度复制 String 中堆上的数据，而不仅仅是栈上的数据，可以显式调用 clone 方法。

let s1 = String::from("Hello");
let s2 = s1.clone();

println!("s1: {}, s2: {}", s1, s2); // s1 与 s2 都可用

在 Rust 中有一种 Copy trait 的特殊注解：如果一个类型实现了 Copy trait，那么一个旧的变量在将其赋值给其他变量后仍然可用。

Drop trait 与 Copy trait 是互斥的，一个通用的鉴别类型是不是实现了 Copy trait 的方法是：

任何一组简单标量值的组合都可以实现 Copy，任何不需要分配内存或某种形式资源的类型都可以实现 Copy，如：

int、bool、float、char、tuple

引用与借用

Slice 类型

fn main() {

    {
        let s = String::from("Hello");
        takes_ownership(s);

        // s had been moved
        // println!("{}", s);

        let x = 5;
        makes_copy(x);
        println!("{}", x); // x is still avaliable(copied)

        fn takes_ownership(some_string: String) {
            println!("{}", some_string);
        }

        fn makes_copy(some_integer: i32) {
            println!("{}", some_integer);
        }
    }

    {
        let s1 = gives_ownership();
        let s2 = String::from("Hello");
        let s3 = takes_and_gives_back(s2);

        // s2 不可访问 因其所有权已经转移给了 s3
        println!("s1: {}, s3: {}", s1, s3);

        // 向外界授予所有权
        fn gives_ownership() -> String {
            let some_string = String::from("yours");
            some_string
        }

        // 获取所有权并向外授予
        fn takes_and_gives_back(a_string: String) -> String {
            a_string
        }
    }

    {
        let s1 = String::from("Hello");
        let (s2, len) = calculate_length(s1);

        println!("length of {} is {}.", s2, len);

        // 计算 String 的长度并归还所有权
        fn calculate_length(some_string: String) -> (String, usize) {
            let size = some_string.len();
            (some_string, size)
        }
    }

    {
        let s1 = String::from("Hello");
        let len = calculate_length(&s1);

        // 将 s1 的指针传递给函数
        // 所有权不会被转移 在调用函数后 s1 仍然可用
        println!("length of {} is {}.", s1, len);

        fn calculate_length(s: &String) -> usize {
            s.len()
        }
    }

    {
        let s = String::from("Hello");
        change(&s);

        fn change(some_string: &String) {
            // 此处无法通过编译 因为借用的变量无法被修改
            // some_string.push_str("SomeStuff");
            println!("some_string: {}", some_string);
        }
    }

    {
        let mut s = String::from("Hello");
        change(&mut s);
        // 如果已经创建了一个变量的可变引用
        // 就不能再创建对该变量的引用 这是为了防止 data race
        println!("s had been changed to: {}.", s);
        
        fn change(some_string: &mut String) {
            some_string.push_str("SomeStuff");
        }
    }

    {
        let mut s = String::from("Hello");

        // 当然 在不同的作用域中 可以创建不同的可变引用
        {
            let r1 = &mut s;
            r1.push_str("SomeStuff");
        }
        {
            let r2 = &mut s;
            r2.push_str("SomeStuff");
        }

        // 但是 不能同时拥有不可变引用与可变引用，或同时拥有多个可变引用
        {
            let _r1 = &s;
            // let r2 = &mut s;
            // println!("r1: {}, r2: {}", r1, r2);
        }
        {
            let _r1 = &mut s;
            // let r2 = &mut s;
            // println!("r1: {}, r2: {}", r1, r2);
        }

        // 只要保证「不同时」即可
        {
            let r1 = &s;
            println!("r1: {}", r1);

            // r1 借用完毕 r2 可以正常引用并使用 s 的引用
            let r2 = &mut s;
            println!("r2: {}", r2);
        }
    }

    {
        // 悬垂引用 (Dangling References)
        let reference_to_nothing = dangle();
        println!("reference_to_nothing: {}", reference_to_nothing);

        // fn dangle() -> &String {
        //     // 创建字符串 s
        //     let s = String::from("");

        //     // 返回字符串的引用 &s
        //     &s
        // } // 作用域结束 s 被丢弃 占据的内存被释放

        fn dangle() -> String {
            let s = String::from("");

            // 返回 String 后 所有权被移动出函数 因此值不会被释放
            s
        }
    }

    {
        let words = String::from("Hello World!");
        let result = first_word(&words);

        println!("result: {}", result);

        fn first_word(s: &String) -> usize {
            let bytes = s.as_bytes();

            for(i, &item) in bytes.iter().enumerate() {
                if item == b' ' {
                    return i;
                }
            }

            s.len()
        }
    }

    {
        let s = String::from("Hello, World!");
        let hello = &s[..5];
        let world = &s[6..];
        println!("{}, {}", hello, world);

        let words = String::from("Hello, World!");
        let result = first_word(&words);
        println!("result: {}", result);

        fn first_word(s: &String) -> &str {
            let bytes = s.as_bytes();

            for (i, &item) in bytes.iter().enumerate() {
                if item == b' ' {
                    return &s[..i];
                }
            }

            &s[..]
        }
    }
}

结构体

struct 是一个自定义数据类型，允许你包装和命名多个相关的值，从而形成一个有意义的组合。

结构体的定义与初始化

下面的代码定义了一个用于存储用户账号信息的结构体：

struct User {
    active: bool,
    username: String,
    email: String,
    sign_in_count: u64
}

要使用它，需要将其实例化：

fn main() {
    let user1 = User {
        active: true,
        username: String::from("Ziu"),
        email: String::from("ziu@email.com"),
        sign_in_count: 1,
    };
}

默认情况下结构体中的值是不可变的，如果要修改某个字段，需要将结构体实例标记为可变的（Rust 不允许将某一个字段标记为可变的），那么可以通过 . 语法对实例中的值做修改：

fn main() {
    let mut user1 = User {
        active: true,
        username: String::from("Ziu"),
        email: String::from("ziu@email.com"),
        sign_in_count: 1,
    };

    user1.sign_in_count += 1;
}

可以通过字段初始化简写语法来创建实例：

fn build_user(email: String, username: String) -> User {
    User {
        active: true,
        email,
        username,
        sign_in_count: 1
    }
}

用结构更新语法使用更少的代码来创建新 User 实例：

创建一个新的 User 实例 user2，其中 email 字段是新的值，其余字段来自 user1。

fn main() {
    let user2 = User {
        email: String::from("user2@email.com"),
        ..user1
    };
}

::: warning 结构更新语法就像 = 赋值一样遵循所有权转移规则，在这个例子中，user2 被创建后我们就不能再使用 user1 了，这是因为 user1 的 username 字段中的 String 值被转移到了 user2 中。

如果我们给 user2 的 username 与 email 都赋新值，只有 active 和 sign_in_count 被复用，那么 user1 仍可用。 :::

元组结构体（tuple structs）中可以通过 struct 关键字定义，但没有具体的字段名，只有字段的类型

当你想给元组取一个名字，并使元组成为与其他元组不同的类型时，元组结构体是很有用的：

struct Color(i32, i32, i32);
struct Point(i32, i32, i32);

fn main() {
    let black = Color(0, 0, 0);
    let origin = Point(0, 0, 0);
}

没有任何字段的类单元结构体，类似于 () 即元祖类型中的 unit 类型。

常用语你想要在某个类型上实现 trait 但不需要在类型中存储数据时发挥作用。

声明并实例化一个名为 AlwaysEqual 的 unit 结构的例子：

struct AlwaysEqual;

fn main() {
    let subject = AlwaysEqual;
}

::: info 结构体数据的所有权

前面 User 的例子中，username 与 email 字段都持有 String 类型的数据而不是其引用。

同时，结构体也可以存储被其他对象拥有的数据的引用，不过要这样做的话就必须引入生命周期这个概念。

生命周期确保结构体引用的数据有效性和结构体本身保持一致。如果你尝试在结构体中存储一个引用而不指定生命周期将是无效的：

struct User {
    active: bool,
    username: &str,
    email: &str,
    sign_in_count: u64,
}

fn main() {
    let user1 = User {
        active: true,
        username: "someusername123",
        email: "someone@example.com",
        sign_in_count: 1,
    };
}

执行编译时，编译器将会抛出错误：需要生命周期标识符 :::

示例

下面写一个计算长方形面积的程序来理解何时需要使用结构体：

fn main() {
    let width = 30;
    let height = 50;

    println!(
        "The area of the rectangle is {} square pixels.",
        area(width, height)
    );

    fn area(width: u32, height: u32) -> u32 {
        width * height
    }
}

通过元组给函数入参建立关联：

fn main() {
    let rect1 = (30, 50);

    println!(
        "The area of the rectangle is {} square pixels.",
        area(rect1)
    );
}

fn area(dimensions: (u32, u32)) -> u32 {
    dimensions.0 * dimensions.1
}

用结构体给参数赋予更多意义，给参数添加语义化的标签：

struct Rectangle {
    width: u32,
    height: u32,
}

fn main() {
    let rect1 = Rectangle {
        width: 30,
        height: 50,
    };

    println!(
        "The area of the rectangle is {} square pixels.",
        area(&rect1)
    );
}

fn area(rectangle: &Rectangle) -> u32 {
    rectangle.width * rectangle.height
}

借用结构体的所用权，将 rect1 的不可变引用传入 area 函数，通过 . 语法访问结构体字段不会移动字段的所有权。

在调试的过程中，如果你尝试将结构体通过 println! 宏打印，运行代码时会抛出错误：

struct Rectangle {
    width: u32,
    height: u32,
}

fn main() {
    let rect1 = Rectangle {
        width: 30,
        height: 50,
    };

    println!("rect1 is {}", rect1);
}

error[E0277]: `Rectangle` doesn't implement `std::fmt::Display`

println! 宏能处理很多类型的格式，但当你使用 {} 占位符时，默认告诉 println! 使用被称为 Display 的格式：直接给终端用户查看的输出。

基本类型都默认实现了 Display，因为值很简单，Rust 可以帮我们完成这部分实现。然而对于结构体的展示存在很多细节：

是否需要结尾的逗号？
需要打印出外层大括号吗？
所有字段都应该显示吗？

因此 Rust 并没有在结构体上提供 Display 实现来使用 println! 与 {} 占位符。

你可以通过 Debug trait 输出格式打印结构体，将 {} 占位符替换为 {:?}：

println!("rect1 is {:?}", rect1);

同时，我们必须显式地为结构体开启这个调试功能：

#[derive(Debug)]
struct Rectangle {
    width: u32,
    height: u32,
}

fn main() {
    let rect1 = Rectangle {
        width: 30,
        height: 50,
    };

    println!("rect1 is {:?}", rect1);
}

这会默认展示所有的结构体中的字段：

rect1 is Rectangle { width: 30, height: 50 }

当结构体变得更大，有一种更易读的占位符可以使用：{:#?}

    println!("rect1 is {:#?}", rect1);

这包含了更漂亮的换行与缩进，输出的调试信息更易读。

另一种使用 Debug 格式打印数值的方法是 dbg! 宏，它接收一个表达式的所有权（与 println! 宏相反，后者接收的是引用）

打印出代码中调用 dbg! 宏时所在的文件和行号以及该表达式的结果值，并返回该值得所有权。

::: warning 注意：调用 dbg! 宏会打印到标准错误控制台流（stderr），与 println! 不同，后者会打印到标准输出控制台流（stdout）。 :::

下面是使用 dbg! 宏的例子：

#[derive(Debug)]
struct Rectangle {
    width: u32,
    height: u32,
}

fn main() {
    let scale = 2;
    let rect1 = Rectangle {
        width: dbg!(30 * scale),
        height: 50,
    };

    dbg!(&rect1);
}

$ cargo run
   Compiling rectangles v0.1.0 (file:///projects/rectangles)
    Finished dev [unoptimized + debuginfo] target(s) in 0.61s
     Running `target/debug/rectangles`
[src/main.rs:10] 30 * scale = 60
[src/main.rs:14] &rect1 = Rectangle {
    width: 60,
    height: 50,
}

方法语法

在前面的代码中，area 函数是单独实现的，但实际上 area 函数与结构体 Rectangle 是强相关的。

这里涉及到函数（function）与方法（method）的不同：

与函数不同的是，方法是在结构体的上下文被定义的（或者是枚举或 trait 对象的上下文）

42 KiB Raw Blame History Unescape Escape