首页
百科大全
文学
登录
标签
使用AVX2指令集加速推荐系统MMR层余弦相似度计算
使用AVX2指令集加速推荐系统MMR层余弦相似度计算
1. 背景前一段时间公司上线了一套Go实现的推荐系统,上线后发现MMR层虽然只有纯计算但耗时十分离谱,通过pprof定位问题所在之后进行了优化,虽然降低了非常多但是我们认为其中还有优化空间。可以看到日常平均耗时126ms,P95 360ms
使用AVX2指令集加速推荐系统MMR层余弦相似度计算
admin
1月前
24
0