量子位发表了文章: 微软打破Decoder-Only架构!大幅降低GPU内存需求,网友:把Llama3 70B弄20GB GPU上运行 ← 量子位发表了文章: 国产大模型:今天起,我们100万tokens只需1元! 量子位发表了文章: OpenAI抓内鬼出奇招,奥特曼耍了所有人:GPT搜索鸽了!改升级GPT-4 →