LLM涌现能力《Are Emergent Abilities of Large Language Models a Mirage?》论文思考

"Code is cheap, show me the talk."

Posted by 王川 on May 6, 2023

论文:Are Emergent Abilities of Large Language Models a Mirage?

论文地址:https://arxiv.org/pdf/2304.15004.pdf

思考

  1. 以往关于LLM涌现能力的具备与否,往往倾向于寻找一个模型参数量的临界值,例如但模型参数量大于65B后,模型具备涌现能力的潜质。上述言论是否过于直觉?
  2. 论文给出一个量化后的结论,涌现能力可能是研究人员创造的,即不同的评测指标下涌现能力可以表现也可以消失,甚至设置评估指标可以诱导CNN表现出涌现能力趋势。
  3. 开源对于科学研究LLM有着至关重要的意义,全文最后一句重点批评OPENAI,你怎么可以不开源!导致我们没法继续研究啦!:)