LLM NLP Paper

LLM涌现能力《Are Emergent Abilities of Large Language Models a Mirage?》论文思考

"Code is cheap, show me the talk."

Posted by 王川 on May 6, 2023

论文：Are Emergent Abilities of Large Language Models a Mirage?

论文地址：https://arxiv.org/pdf/2304.15004.pdf

思考

以往关于LLM涌现能力的具备与否，往往倾向于寻找一个模型参数量的临界值，例如但模型参数量大于65B后，模型具备涌现能力的潜质。上述言论是否过于直觉？
论文给出一个量化后的结论，涌现能力可能是研究人员创造的，即不同的评测指标下涌现能力可以表现也可以消失，甚至设置评估指标可以诱导CNN表现出涌现能力趋势。
开源对于科学研究LLM有着至关重要的意义，全文最后一句重点批评OPENAI，你怎么可以不开源！导致我们没法继续研究啦！：）