2017年问世的Transformer架构(编者注:一种深度学习模型)被认为是目前人工智能大模型的技术基石。其基于简单的神经元和复杂的网络架构,在尺度定律的驱动下,通过增加网络规模、算力资源和数据量提升模型智能水平(试读)...