假设我有一大串字符串,我想对它们进行排序,除了通常的 sort.Sort 和 sort.Slice 等之外,我想使用多个核心来加快速度。因此,在阅读大列表时,我将字符串添加到 2 个不同的切片中,即以 am 和 nz 开头的字符串(为了论证)。同时,我启动了多个 go 例程来读取字符串切片通道,然后这些字符串切片将对其自己的子列表进行排序。到目前为止,一切都很好,“可能”并行处理列表,因此我的排序时间实际上减半了。伟大的。现在我的问题是如何将结果返回到主 goroutine?最初每个 goroutine 有 2 个通道,一个用于传入的未排序列表,另一个用于排序列表。是的,它有效......但使用了太多内存(嘿,给出我正在为这个测试修改的数据量,这可能不是不合理的)。但后来我意识到,在通道上传递切片实际上只是传递引用,所以我实际上不需要传递任何东西。不必将生成的排序列表放入回程的通道中,显然对记忆的负担要小得多,但它(对我来说)有味道。这意味着我可以让其中一个 Goroutine 进行排序,同时主 Goroutine(理论上)可以操作同一个列表。只要遵守纪律,这就不会成为问题,但显然仍然是一个问题。Go 中是否有一种普遍接受的最佳实践,即引用不应该作为输入从一个 goroutine 传递到另一个 goroutine...但是可以通过通道返回生成引用数据的 goroutine (因为 goroutine 然后会停止使用参考)。在有人说之前,是的,我知道我不必通过渠道等传递这些信息,但这正是我正在修改并让我思考的情况。我知道,手又长又波浪。这是显示上述内容的最小代码子集。package mainimport ( "bufio" "fmt" "os" "sort" "strings" "sync" "time")var wg sync.WaitGroupfunc sortWordsList(id int, ch chan []string ) { l := <- ch sort.Strings(l) wg.Done()}func main() { file, err := os.Open("big.txt") defer file.Close() if err != nil { fmt.Printf("BOOM %s\n", err.Error()) panic(err) } // Start reading from the file with a reader. reader := bufio.NewReader(file) inCh1 := make(chan []string, 1000) inCh2 := make(chan []string, 1000) go sortWordsList(1, inCh1) go sortWordsList(2, inCh2) wg.Add(2) words1 := []string{} words2 := []string{} for { line, err := reader.ReadString('\n') if err != nil { break } sp := strings.Split(line, " ") for _,w := range sp { word := strings.ToLower(w) word = strings.TrimSuffix(word, "\n") if len(word) > 0 { // figure out where to go. // arbitrary split. if word[0] < 'm' { words1 = append(words1, word) } else { words2 = append(words2, word) } } } }
目前暂无任何回答
- 0 回答
- 0 关注
- 82 浏览
添加回答
举报
0/150
提交
取消