Archive

「时间是金」
2024

多模态:Qwen-VL/Qwen-VL-Chat MultiNode Finetune Note

"时间是金"


Moe Note


2023

Flash-Attention Note

"时间是金"


GPT-probability of output Note

"时间是金"


GPT generate output fix Note

"时间是金"


MoE Mixture of Experts

"时间是金"


RMS Norm

"时间是金"


DeepSpeed ZeRo Stage的介绍

"时间是金"


Activation SWIGLU的介绍

"时间是金"


Multi-Query-Attention

"时间是金"


Loss

"时间是金"


【LLM】LLAMA-sft记录

"时间是金"


【LLM】LLAMA-lora记录

"时间是金"


【LLM】chatGLM-SFT-LAMP记录

"时间是金"


git lfs下载huggingface文件

"时间是金"


Chinese Llama 原理

"时间是金"


LLM多轮能力评测

"时间是金"


chatGLM P-Tuning V2 SFT记录

"时间是金"


基于BLOOM的SFT

"时间是金"


【LLM】chatGLM-SFT记录

"时间是金"


【LLM】x-transformer 训练Speed UP!

"时间是金"


【LLM】chatGLM6B的不同版本

"时间是金"


【LLM】GLM论文解读

"时间是金"


LLM 大模型工作

"时间是金"


LLM涌现能力《Are Emergent Abilities of Large Language Models a Mirage?》论文思考

"Code is cheap, show me the talk."


博客写法

"Let's go!"


2021

《JavaScript 二十年》推荐语


2020

My Programming Languages Spectrum

我的编程语言光谱


2015

Hello 2015

"Hello World, Hello Blog"


2014

如何评价 MIUI 6?