From 04e2a46bcd853ac36943834a32b037e1305f103b Mon Sep 17 00:00:00 2001 From: krahets Date: Thu, 5 Oct 2023 14:34:42 +0800 Subject: [PATCH] fine tune --- .../character_encoding.md | 4 +-- docs/overrides/partials/footer.html | 36 ------------------- docs/stylesheets/extra.css | 4 +++ 3 files changed, 6 insertions(+), 38 deletions(-) delete mode 100644 docs/overrides/partials/footer.html diff --git a/docs/chapter_data_structure/character_encoding.md b/docs/chapter_data_structure/character_encoding.md index 0885f2a83..9b7befcb5 100644 --- a/docs/chapter_data_structure/character_encoding.md +++ b/docs/chapter_data_structure/character_encoding.md @@ -80,8 +80,8 @@ UTF-8 的编码规则并不复杂,分为以下两种情况。 出于以上原因,部分编程语言提出了一些不同的编码方案。 -- Python 3 使用一种灵活的字符串表示,存储的字符长度取决于字符串中最大的 Unicode 码点。对于全部是 ASCII 字符的字符串,每个字符占用 1 个字节;如果字符串中包含的字符超出了 ASCII 范围,但全部在基本多语言平面(BMP)内,每个字符占用 2 个字节;如果字符串中有超出 BMP 的字符,那么每个字符占用 4 个字节。 +- Python 中的 `str` 使用 Unicode 编码,并采用一种灵活的字符串表示,存储的字符长度取决于字符串中最大的 Unicode 码点。若字符串中全部是 ASCII 字符,则每个字符占用 1 个字节;如果有字符超出了 ASCII 范围,但全部在基本多语言平面(BMP)内,则每个字符占用 2 个字节;如果有超出 BMP 的字符,则每个字符占用 4 个字节。 - Go 语言的 `string` 类型在内部使用 UTF-8 编码。Go 语言还提供了 `rune` 类型,它用于表示单个 Unicode 码点。 -- Rust 语言的 str 和 String 类型在内部使用 UTF-8 编码。Rust 也提供了 char 类型,用于表示单个 Unicode 码点。 +- Rust 语言的 str 和 String 类型在内部使用 UTF-8 编码。Rust 也提供了 `char` 类型,用于表示单个 Unicode 码点。 需要注意的是,以上讨论的都是字符串在编程语言中的存储方式,**这和字符串如何在文件中存储或在网络中传输是两个不同的问题**。在文件存储或网络传输中,我们通常会将字符串编码为 UTF-8 格式,以达到最优的兼容性和空间效率。 diff --git a/docs/overrides/partials/footer.html b/docs/overrides/partials/footer.html deleted file mode 100644 index 59cd4956b..000000000 --- a/docs/overrides/partials/footer.html +++ /dev/null @@ -1,36 +0,0 @@ - - - - \ No newline at end of file diff --git a/docs/stylesheets/extra.css b/docs/stylesheets/extra.css index 0b99df253..0db2dc4ff 100644 --- a/docs/stylesheets/extra.css +++ b/docs/stylesheets/extra.css @@ -78,6 +78,10 @@ font-weight: 500; } +.md-typeset h5 { + text-transform: none; +} + /* Image align center */ .center { display: block;