当前主流的AI芯片主要分为三类,GPU、FPGA、ASIC。其中GPU、FPGA均是前期较为成熟的芯片架构,属于通用型芯片。ASIC属于为AI特定场景定制的芯片。
GPU(图像处理单元):GPU最初承担图像计算任务,能够进行并行计算,因此GPU架构本身比较适合深度学习算法,通过对GPU的优化,进一步满足深度学习大量计算需求。其主要缺点在于功耗较高。
FPGA(FieldProgrammableGateArray,现场可编程门阵列):FPGA,具有足够的计算能力、较低的试错成本和足够的灵活性。FPGA的计算速度快是源于它本质上是无指令、无需共享内存的体系结构。对于保存状态的需求,FPGA中的寄存器和片上内存(BRAM)是属于各自的控制逻辑的,无需不必要的仲裁和缓存,因此FPGA在运算速度足够快,优于GPU。同时,相比量产成本高昂的ASIC芯片,因为它是一种半定制的硬件,通过编程可定义其中的单元配置和链接架构进行计算,因此在灵活性上优于ASIC,具备较低试错成本。
ASIC(ApplicationSpecificIntegratedCircuit特定用途集成电路):根据产品的需求进行特定设计和制造的集成电路,能够在特定功能上进行强化,具有更高的处理速度和更低的能耗。缺点是成本高,且由于是定制化,可复制性一般,因此只有用量足够大时才能够分摊前期投入,降低成本。