量子位发表了文章: 院士领衔推出大模型的第3种记忆:比参数存储和RAG都便宜,2.4B模型越级打13B ← 张敬信发表了文章: 【Tidyverse优雅编程】按数值连续递增分组 量子位发表了文章: 新架构RNN反超Transformer:每个隐藏状态都是一个模型,一作:从根本上改变语言模型 →