Go语言的100个错误使用场景(40-47)|字符串函数方法

news/发布时间2024/5/15 14:44:23

前言

大家好,这里是白泽。 《Go语言的100个错误以及如何避免》 是最近朋友推荐我阅读的书籍,我初步浏览之后,大为惊喜。就像这书中第一章的标题说到的:“Go: Simple to learn but hard to master”,整本书通过分析100个错误使用 Go 语言的场景,带你深入理解 Go 语言。

我的愿景是以这套文章,在保持权威性的基础上,脱离对原文的依赖,对这100个场景进行篇幅合适的中文讲解。所涉内容较多,总计约 8w 字,这是该系列的第五篇文章,对应书中第40-47个错误场景。

🌟 当然,如果您是一位 Go 学习的新手,您可以在我开源的学习仓库中,找到针对 《Go 程序设计语言》 英文书籍的配套笔记,其他所有文章也会整理收集在其中。

📺 B站:白泽talk,公众号【白泽talk】,聊天交流群:622383022,原书电子版可以加群获取。

前文链接:

  • 《Go语言的100个错误使用场景(1-10)|代码和项目组织》
  • 《Go语言的100个错误使用场景(11-20)|项目组织和数据类型》
  • 《Go语言的100个错误使用场景(21-29)|数据类型》
  • 《Go语言的100个错误使用场景(30-40)|数据类型与字符串使用》

5. 字符串

🌟 章节概述:

  • 了解 rune 的概念
  • 避免常见的字符串遍历和截取造成的错误
  • 避免由于字符串拼接和转换造成的低效代码
  • 避免获取子字符串造成的内存泄漏

5.5 无用的字符串转换(#40)

错误示例:

func getBytes(reader io.Reader) ([]byte, error) {b, err := io.ReadAll(reader)if err != nil {return nil, err}// 去除首尾空格return []byte(sanitize(string(b))), nil
}func sanitize(s string) string {return strings.TrimSpace(s)
}

正确示例:

func getBytes(reader io.Reader) ([]byte, error) {b, err := io.ReadAll(reader)if err != nil {return nil, err}// 去除首尾空格return sanitize(b), nil
}func sanitize(b []byte) []byte {return bytes.TrimSpace(b)
}

通常来说 bytes 库提供了与 strings 库相同功能的方法,而且大多数 IO 相关的函数的输入输出都是 []byte,而不是 string,错误示例中,将字符切片转换成字符串,再转换成字符切片,需要额外承担两次内存分配的开销。

5.6 获取子字符串操作和内存泄漏(#41)

假设有许多个 string 类型的 log 需要存储(假设一个log有1000字节),但是只需要存放 log 的前36字节,不恰当的子字符串截取函数,会导致内存泄漏。

示例代码:

// 方式一
func (s store) handleLog(log string) error {if len(log) < 36 {return errors.New("log is not correctly formatted")}uuid := log[:36]s.store(uuid)// Do something
}
// 方式二
func (s store) handleLog(log string) error {if len(log) < 36 {return errors.New("log is not correctly formatted")}uuid := string([]byte(log[:36]))s.store(uuid)// Do something
}
// 方式三
func (s store) handleLog(log string) error {if len(log) < 36 {return errors.New("log is not correctly formatted")}uuid := strings.Clone(log[:36])s.store(uuid)// Do something
}
  1. 和(#26)提到的子切片获取造成的内存泄漏一样,获取子字符串操作执行后,其底层依旧依赖原来的整个字符数组,因此1000个字节内存依旧占用,不会只有36个。
  2. 通过将字符串转换为字节数组,再转换为字符串,虽然消耗了2次长度为36字节的内存分配,但是释放了底层1000字节的原字节数组的依赖。有些 IDE 如 Goland 会提示语法错误,因为本质来说,将 string 转 []byte 再转 string 是一个累赘的操作。
  3. go1.18之后,提供了一步到位的 strings.Clone 方法,可以避免内存泄漏。

6. 函数和方法

🌟 章节概述:

  • 什么时候使用值或者指针类型的接受者
  • 什么时候命名的返回值,以及其副作用
  • 避免返回 nil 接受者时的常见错误
  • 函数接受一个文件名,并不是最佳实践
  • 处理 defer 的参数

6.1 不知道选择哪种类型的方法接受者(#42)

值接受者:

type customer struct {balance float64
}func (c customer) add(operation float64) {c.balance += operation
}func main() {c := customer{balance: 100.0}c.add(50.0)fmt.Printf("%.2f\n", c.balance) // 结果为 100.00
}

指针接受者:

type customer struct {balance float64
}func (c *customer) add(operation float64) {c.balance += operation
}func main() {c := customer{balance: 100.0}c.add(50.0)fmt.Printf("%.2f\n", c.balance) // 结果为 150.00
}

值接受者在方法内修改自身结构的值,不会对调用方造成实际影响。

🌟 一些实践的建议:

  • 必须使用指针接受者的场景:

    • 如果方法需要修改原始的接受者。
    • 如果方法的接受者包含不可以被拷贝的字段。
  • 建议使用指针接受者的场景:

    • 如果接受者是一个巨大的对象,使用指针接受者可以更加高效,避免了拷贝内存。
  • 必须使用值接受者的场景:

    • 如果我们必须确保接受者是不变的。
    • 如果接受者是一个 map, function, channel,否则会出现编译错误。
  • 建议使用值接受者的场景:

    • 如果接受者是一个切片,且不会被修改。
    • 如果接受者是一个小的数组或者结构体,不含有易变的字段。
    • 如果接受者是基本类型如:int, float64, string。

特殊情况:

type customer struct {data *data
}type data struct {balance float64
}func (c customer) add(operation float64) {c.data.balance += operation
}func main() {c := customer{data: &data {balance: 100.0}}c.add(50.0)fmt.Printf("%.2f\n", c.data.balance) // 150.00
}

在这种情况下,即使方法接受者 c 不是指针类型,但是修改依旧可以生效。

但是为了清楚起见,通常还是将 c 声明成指针类型,如果它是可操作的。

6.2 从来不使用命名的返回值(#43)

如果使用命名返回值:

func f(a int) (b int) {b = areturn
}

推荐使用命名返回值的场景举例:

// 场景一
type locator interface {getCoordinates(address string) (lat, lng float32, err error)
}
// 场景二
func ReadFull(r io.Reader, buf []byte) (n int, err error) {// 两个返回值被初始化为对应类型的零值:0和nilfor len(buf) > 0 && err == nil {var nr intnr, err = r.Read(buf)n += nrbuf = buf[nr:]}return
}

场景一:通过命名返回值提高接口的可读性

场景二:通过命名返回值节省编码量

🌟 最佳实践:需要权衡使用命名返回值是否能带来收益,如果可以就果断使用吧!

6.3 使用命名返回值造成的意外副作用(#44)

🌟 注意:使用命名返回值的方法,并不意味着必须返回单个 return,有时可以只为了函数签名清晰而使用命名返回值。

错误场景:

func (l loc) getCoordinates(ctx content.Content, address string) (lat, lng float32, err error) {isValid := l.validateAddress(address)if !isValid {return 0, 0, errors.New("invalid address")}if ctx.Err() != nil {return 0, 0, err}// Do something and return
}

此时,由于 ctx.Err() != nil 成立时,并没有为 err 赋值,因此返回的 err 永远都是 nil。

修正方案:

func (l loc) getCoordinates(ctx content.Content, address string) (lat, lng float32, err error) {isValid := l.validateAddress(address)if !isValid {return 0, 0, errors.New("invalid address")}if err = ctx.Err(); err != nil {// 这里原则上可以返回单个return,但是最好保持风格统一return 0, 0, err}// Do something and return
}

6.4 返回一个 nil 接受者(#45)

🔔 提示:在 Go 语言当中,方法就像是函数的语法糖一样,相当于函数的第一个参数是方法的接受者,nil 可以作为参数,因此 nil 接受者可以触发方法,因此不同于纯粹的 nil interface。

type Foo struct {}func (foo *Foo) Bar() string {return "bar"
}func main() {var foo *Foofmt.Println(foo.Bar()) // 虽然 foo 动态值是 nil,但动态类型不是nil,是可以打印出 bar
}

错误示例:

type MultiError struct {errs []string
}func (m *MultiError) Add(err error) {m.errs = append(m.errs, err.Error())
}func (m *MultiError) Error() string {return stirngs.Join(m.errs, ";")
}func (c Customer) Validate() error {var m *MultiErrorif c.Age < 0 {m = &MultiError{}m.Add(errors.New("age is negative"))}if c.Name == "" {if m == nil {m = &MultiError{}}m.Add(errors.New("age is nil"))}return m
}func main() {// 传入的两个参数都不会触发 Validate 的 err 校验customer := Customer{Age: 33, Name: "John"}if err := customer.Validate(); err != nil {// 但是无论如何都会打印这行语句,err != nil 永远成立!log.Fatalf("customer is invalid: %v", err)}
}

🔔 提示:Go 语言的接口,有动态类型和动态值两个概念,

image-20240214163507390

上述错误示例中,即使通过了两个验证,Validate 返回了 m,此时这个接口承载的动态类型是 *MultiError,它的动态值是 nil,但是通过 == 判断一个 err 为 nil,或者说一个接口为 nil,要求其底层类型和值都是 nil 才会成立。

正确方案:

func (c Customer) Validate() error {var m *MultiErrorif c.Age < 0 {m = &MultiError{}m.Add(errors.New("age is negative"))}if c.Name == "" {if m == nil {m = &MultiError{}}m.Add(errors.New("age is nil"))}if m != nil {return m}return nil
}

此时返回的是一个 nil interface,是存粹的。而不是一个非 nil 动态类型的 interfere 返回值。

6.5 使用文件名作为函数的输入(#46)

编写一个从文件中按行读取内容的函数。

错误示例:

func countEmptyLinesInFile(filename string) (int, error) {file, err := os.Open(filename)if err != nil {return 0, err}scanner := bufio.NewScanner(file)for scanner.Scan() {// ...}
}

弊端:

  1. 每当需要做不同功能的单元测试,需要单独创建一个文件。
  2. 这个函数将无法被复用,因为它依赖于一个具体的文件名,如果是从其他输入源读取将需要重新编写函数。

🌟 修正方案:

func countEmptyLines(reader io.Reader) (int, error) {scanner := bufio.NewScanner(reader)for scanner.Scan() {// ...}
}func TestCountEmptyLines(t *testing.T) {emptyLines, err := countEmptyLines(strings.NewReader(`foobarbaz`))// 测试逻辑
}

通过这种方式,可以将输入源进行抽象,从而满足来自任何输入的读取(文件,字符串,HTTP Request,gRPC Request等),编写单元测试也十分便利。

6.6 不理解 defer 参数和接收者是如何确定的(#47)

  • defer 声明的函数的参数值,在声明时确定:
const (StatusSuccess = "success"StatusErrorFoo = "error_foo"StatusErrorBar = "error_bar"
)func f() error {var status stringdefer notify(status)defer incrementCounter(status)if err := foo(); err != nil {status = StatusErrorFooreturn err}if err := bar(); err != nil {status = StatusErrorBarreturn err}status = StatusSuccessreturn nil
}

🌟 上述示例中,无论是否会在 foobar 函数的调用后返回 errstatus 的值传递给 notifyincrementCount 函数的都是空字符串,因为 defer 声明的函数的参数值,在声明时确定。

修正方案1:

func f() error {var status string// 修改为传递地址defer notify(&status)defer incrementCounter(&status)if err := foo(); err != nil {status = StatusErrorFooreturn err}if err := bar(); err != nil {status = StatusErrorBarreturn err}status = StatusSuccessreturn nil
}

因为地址一开始确定,所以无论后续如何为 status 赋值,都可以通过地址获取到最新的值。这种方式的缺点是需要修改 notify 和 incrementCounter 两个函数的传参形式。

🌟 defer 声明一个闭包,则闭包内使用的外部变量的值,将在闭包执行的时候确定。

func main() {i := 0j := 0defer func(i int) {fmt.Println(i, j)}(i)i++j++
}

因为 i 作为匿名函数的参数传入,因此值在一开始确定,而 j 是闭包内使用外部的变量,因此在 return 之前确定值。最后打印结果 i = 0, j = 1。

修正方案2:

func f() error {var status stringdefer func() {notify(status)incrementCounter(status)}()
}

通过使用闭包将 notify 和 incrementCounter 函数包裹,则 status 的值使用闭包外侧的变量 status,因此 status 的值会在闭包执行的时候确定,这种修改方式也无需修改两个函数的签名,更为推荐。

  • 指针和值接收者:

值接收者:

func main() {s := Struct{id: "foo"}defer s.print()s.id = "bar"
}type Struct struct {id string
}func (s Struct) print() {fmt.Println(s.id)
}

打印的结果是 foo,因为 defer 后声明的 s.print() 的接收者 s 将在一开始获得一个拷贝,foo 作为 id 已经固定。

指针接收者:

func main() {s := &Struct{id: "foo"}defer s.print()s.id = "bar"
}type Struct struct {id string
}func (s *Struct) print() {fmt.Println(s.id)
}

打印结果是 bar,defer 后声明的 s.print() 的接收者 s 将在一开始获得一份拷贝,因为是地址的拷贝,所以对 return 之前的改动有感知。

小结

已完成《Go语言的100个错误》全书学习进度47%,欢迎追更。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.bcls.cn/mCMm/365.shtml

如若内容造成侵权/违法违规/事实不符,请联系编程老四网进行投诉反馈email:xxxxxxxx@qq.com,一经查实,立即删除!

相关文章

【Redis快速入门】深入解读哨兵模式

个人名片&#xff1a; &#x1f43c;作者简介&#xff1a;一名大三在校生&#xff0c;喜欢AI编程&#x1f38b; &#x1f43b;‍❄️个人主页&#x1f947;&#xff1a;落798. &#x1f43c;个人WeChat&#xff1a;hmmwx53 &#x1f54a;️系列专栏&#xff1a;&#x1f5bc;️…

Qt的基本操作

文章目录 1. Qt Hello World 程序1.1 通过图形化界面的方式1.2 通过代码的方式实现 2. Qt 的编码问题3. 使用输入框实现hello world4. 使用按钮实现hello world5. Qt 编程注意事项6. 查询文档的方式7. 认识Qt坐标系 1. Qt Hello World 程序 1.1 通过图形化界面的方式 我们先讲…

Editing While Playing 使用 Easyx 开发的 RPG 地图编辑器 tilemap eaitor

AWSD移动画布 鼠标右键长按拖拽 鼠标左键长按绘制 可以边拖拽边移动画布边绘制。 F1 导出 DLC F2 导入DLC author: 民用级脑的研发记录 1309602336qq.com 开发环境&#xff1a; 内置 easyx 的 devc 5.11 或者 VS 2022 TDM GCC 4.9.2 64-bit c11及以上都可运行 windows 环境运行…

每日OJ题_二叉树dfs②_力扣129. 求根节点到叶节点数字之和

目录 力扣129. 求根节点到叶节点数字之和 解析代码 力扣129. 求根节点到叶节点数字之和 129. 求根节点到叶节点数字之和 难度 中等 给你一个二叉树的根节点 root &#xff0c;树中每个节点都存放有一个 0 到 9 之间的数字。 每条从根节点到叶节点的路径都代表一个数字&am…

LeetCode刷题计划

LeetCode刷题计划 推荐 代码随想录&#xff1a;https://github.com/youngyangyang04/leetcode-master 卡码网 练习ACM模式 https://kamacoder.com/ 01 #include <iostream> using namespace std;int main() {int a ,b;while(cin>>a>>b){cout<<ab<…

Android adb使用超级大全

Android adb使用超级大全 ADB&#xff0c;即Android Debug Bridge&#xff0c;是一款强大的工具&#xff0c;对于Android开发/测试人员来说是不可或缺的&#xff0c;同时也是Android设备玩家的好玩具。本文将详细介绍ADB的使用方法。 ADB的基本用法如下&#xff1a; 命令语法…

【C/C++】2024春晚刘谦春晚魔术步骤模拟+暴力破解

在这个特别的除夕夜&#xff0c;我们不仅享受了与家人的温馨团聚&#xff0c;还被电视机前的春节联欢晚会深深吸引。特别是&#xff0c;魔术师刘谦的精彩表演&#xff0c;为我们带来了一场视觉和心灵的盛宴。在我的博客“【C/C】2024春晚刘谦春晚魔术步骤模拟暴力破解”中&…

MySQL基础学习

MySQL基础 注意&#xff1a;本文的图片截图自尚硅谷MySQL笔记。 一&#xff1a;基本概述&#xff1a; 什么是数据库&#xff1a; 数据库是一种用来存储和管理数据的系统。它是一个组织化的数据集合&#xff0c;可以通过计算机系统进行访问、管理和更新。数据库可以存储各种…

13.Qt 文件的读和写,样式表文件的读用

目录 前言&#xff1a; 技能&#xff1a; 内容&#xff1a; 1. 界面 2.信号槽 ①浏览按键 ②保存按键 ③加载样式按键 参考&#xff1a; 前言&#xff1a; 上一篇文章说明了如何弹窗选取文件并在Qlabel中显示文件内容 12.QT文件对话框 文件的弹窗选择-QFileDialog 这篇…

transformer 最简单学习1 输入层embeddings layer

词向量的生成可以通过嵌入层&#xff08;Embedding Layer&#xff09;来完成。嵌入层是神经网络中的一种常用层&#xff0c;用于将离散的词索引转换为密集的词向量。以下是一个典型的步骤&#xff1a; 建立词表&#xff1a;首先&#xff0c;需要从训练数据中收集所有的词汇&…

IDEA中的神仙插件——Smart Input (自动切换输入法)

IDEA中的神仙插件——Smart Input &#xff08;自动切换输入法&#xff09; 设置 更多功能详见官方文档&#xff1a;Windows版SmartInput使用入门

数据结构-哈夫曼树

介绍 哈夫曼树&#xff0c;指带权路径长度最短的二叉树&#xff0c;通常用于数据压缩中 什么是带权路径长度&#xff1f; 假设有一个结点&#xff0c;我们为它赋值&#xff0c;这个值我们称为权值&#xff0c;那么从根结点到它所在位置&#xff0c;所经历的路径&#xff0c;…

HCIA-HarmonyOS设备开发认证V2.0-IOT硬件子系统-UART

目录 一、UART 概述二、UART 模块相关API三、UART 接口调用实例四、UART HDF驱动开发4.1、开发步骤(待续...) 坚持就有收获 一、UART 概述 UART 是通用异步收发传输器&#xff08;Universal Asynchronous Receiver/Transmitter&#xff09;的缩写&#xff0c;是通用串行数据总…

第9讲用户信息修改实现

用户信息修改实现 后端修改用户昵称&#xff1a; /*** 更新用户昵称* param wxUserInfo* param token* return*/ RequestMapping("/updateNickName") public R updateNickName(RequestBody WxUserInfo wxUserInfo,RequestHeader String token){if(StringUtil.isNot…

为什么有的代理IP速度比较慢?

“为什么有的IP代理速度比较慢&#xff1f;”随着数字化时代的不断发展&#xff0c;代理服务成为了许多网络操作的关键环节。然而&#xff0c;有时我们可能会遇到IP代理速度慢的问题&#xff0c;这可能会对我们的网络操作产生影响。让我们一起揭开这个谜团&#xff0c;探寻其中…

Stable Diffusion教程——常用插件安装与测试(一)

前言 随着Stable Diffusion不断演进&#xff0c;越来越多的开发者开始涉足插件开发。尽管网络上存在大量教程&#xff0c;但它们通常零散分布&#xff0c;逐个学习和查找非常耗时&#xff0c;使人感觉每天都在劳累思考。这里总结了Stable Diffusion常用的插件安装与测试方法。…

什么是 Docker 容器?以及操作 Docker 容器相关的命令汇总

镜像仓库常用指令&#xff1a;Docker 镜像仓库是什么&#xff1f;有哪些镜像仓库命令&#xff1f; 镜像常用指令&#xff1a;操作 Docker 镜像的常用命令 1. 什么是容器&#xff1f; 容器是镜像的运行实体。容器是基于镜像创建的可运行实例&#xff0c;并且单独存在&#xff0…

【大数据】Flink on Kubernetes 原理剖析

Flink on Kubernetes 原理剖析 1.基本概念2.架构图3.核心概念4.架构5.JobManager6.TaskManager7.交互8.实践8.1 Session Cluster8.2 Job Cluster 9.问题解答 Kubernetes 是 Google 开源的 容器集群管理系统&#xff0c;其提供应用部署、维护、扩展机制等功能&#xff0c;利用 K…

数据结构中图的概念以及遍历算法的实现

在数据结构中&#xff0c;图&#xff08;Graph&#xff09;是由节点&#xff08;Vertex&#xff09;和连接节点的边&#xff08;Edge&#xff09;组成的一种非线性数据结构。图可以用来表示各种实际问题中的关系和连接&#xff0c;如社交网络、道路网络、电路等。 图由两个主要…

【二十八】springboot整合logback实现日志管理

本章节是记录logback在springboot项目中的简单使用&#xff0c;本文将会演示如何通过logback将日志记录到日志文件或输出到控制台等管理操作。将会从以下几个方面进行讲解。最后实现将特定级别的特定日志保存到日志文件。 一、依赖 <dependency><groupId>ch.qos.l…
推荐文章