量子位发表了文章: ICML2024高分!魔改注意力,让小模型能打两倍大的模型 ← 量子位发表了文章: 英伟达新研究:上下文长度虚标严重,32K性能合格的都不多 量子位发表了文章: 昆仑万维开源2千亿稀疏大模型天工MoE,全球首创能用4090推理 →