量子位发表了文章: Llama3比GPT-4o更爱说谎,首个大模型“诚实性”评估基准来了 ← 量子位发表了文章: 大模型权威测试被曝翻车!偏袒GPT-4等闭源模型,提示词区别对待 量子位发表了文章: 恶意大模型有了潜伏期!评估测试人畜无害,苟到发布瞬间变坏,研究人员:威胁比越狱大 →