论文:Are Emergent Abilities of Large Language Models a Mirage?
论文地址:https://arxiv.org/pdf/2304.15004.pdf
思考
- 以往关于LLM涌现能力的具备与否,往往倾向于寻找一个模型参数量的临界值,例如但模型参数量大于65B后,模型具备涌现能力的潜质。上述言论是否过于直觉?
- 论文给出一个量化后的结论,涌现能力可能是研究人员创造的,即不同的评测指标下涌现能力可以表现也可以消失,甚至设置评估指标可以诱导CNN表现出涌现能力趋势。
- 开源对于科学研究LLM有着至关重要的意义,全文最后一句重点批评OPENAI,你怎么可以不开源!导致我们没法继续研究啦!:)