我一直致力于优化分析社交图数据的代码(在https://blog.golang.org/profiling-go-programs 的大量帮助下),并且我已经成功地重新编写了很多缓慢的代码。所有数据先从db加载到内存,从那里分析数据出现CPU bound(最大内存消耗<10MB,CPU1@100%)但是现在我的程序的大部分时间似乎都在 runtime.osyield 和 runtime.usleep 中。有什么方法可以防止?我已经设置了 GOMAXPROCS=1 并且代码不会产生任何 goroutines(除了 golang 库可能调用的)。这是我从 pprof 的 top10 输出(pprof) top1062550ms of 72360ms total (86.44%)Dropped 208 nodes (cum <= 361.80ms)Showing top 10 nodes out of 77 (cum >= 1040ms) flat flat% sum% cum cum% 20760ms 28.69% 28.69% 20850ms 28.81% runtime.osyield 14070ms 19.44% 48.13% 14080ms 19.46% runtime.usleep 11740ms 16.22% 64.36% 23100ms 31.92% _/C_/code/sc_proto/cloudgraph.(*Graph).LeafProb 6170ms 8.53% 72.89% 6170ms 8.53% runtime.memmove 4740ms 6.55% 79.44% 10660ms 14.73% runtime.typedslicecopy 2040ms 2.82% 82.26% 2040ms 2.82% _/C_/code/sc_proto.mAvg 890ms 1.23% 83.49% 1590ms 2.20% runtime.scanobject 770ms 1.06% 84.55% 1420ms 1.96% runtime.mallocgc 760ms 1.05% 85.60% 760ms 1.05% runtime.heapBitsForObject 610ms 0.84% 86.44% 1040ms 1.44% _/C_/code/sc_proto/cloudgraph.(*Node).DeepestChildren(pprof)_ /C_/code/sc_proto/* 函数是我的代码。以及来自网络的输出:
1 回答
Smart猫小萌
TA贡献1911条经验 获得超7个赞
我自己找到了答案,因此我将其发布给其他遇到类似问题的人。特别感谢@JimB 让我走上了正确的道路。
从图中可以看出,通往osyield和usleep的路径是垃圾收集例程。这个程序使用了一个链表,它生成了很多指针,这为 gc 创造了很多工作,它在清理我的烂摊子时偶尔会阻止我的代码的执行。
最终,这个问题的解决方案来自https://software.intel.com/en-us/blogs/2014/05/10/debugging-performance-issues-in-go-programs(顺便说一句,这是一个很棒的资源)。我按照有关内存分析器的说明进行操作;用切片替换指针集合的建议解决了我的垃圾收集问题,我的代码现在要快得多!
- 1 回答
- 0 关注
- 438 浏览
添加回答
举报
0/150
提交
取消