AlphaTensor论文阅读分析( 二 )


在第四行,(5,5,5)情形下的矩阵乘法,AlphaTensor计算出来的方法可以在博客里面看到,非常复杂,为了减少两次乘法,却耗费了数几十次加法 。因此AlphaTensor只能做到渐进时间复杂度更优,在大矩阵情形下达到更快的速度 。
值得关注的是,他们在\(8192*8192\)的方阵乘法上进行了测试,采用\(4*4\)分块的方式(这样每个子矩阵的大小就是\(2048*2048\)规模的了),AlphaTensor方法比Strassen的方法减少了两次矩阵乘法,因此加速比从1.043提升至1.085 。这说明这一方法相比coppersmith-winograd方法(\(O(n^{2.37})\))那种银河算法更加实用,常数更低,在8192规模的矩阵就能生效了 。而且,计算矩阵乘法的Algorithm 1也方便在GPU和TPU上并行 。

AlphaTensor论文阅读分析

文章插图

经验总结扩展阅读