2.2.3 自注意力机制的优势与局限性