量子位发表了文章: 新架构RNN反超Transformer:每个隐藏状态都是一个模型,一作:从根本上改变语言模型 ← 量子位发表了文章: 院士领衔推出大模型的第3种记忆:比参数存储和RAG都便宜,2.4B模型越级打13B 量子位发表了文章: 第一批正在被AIGC重置的行业有话说 →