🔔科技频道[奇诺分享-ccino.org]⚡️
4 天前
爱范儿
GPT-4o 见 AV 女优的次数比「您好」还多 2.6 倍,AI 正在被中文互联网疯狂污染?
Telegraph
|
原文
Telegraph
GPT-4o 见 AV 女优的次数比「您好」还多 2.6 倍,AI 正在被中文互联网疯狂污染? - 爱范儿
好家伙,我直呼好家伙。 号称「赛博白月光」的 GPT-4o,在它的知识体系里,对日本女优「波多野结衣」的熟悉程度,竟然比中文日常问候语「您好」还要高出 2.6 倍。 这可不是我瞎编的。一篇来自清华、蚂蚁和南洋理工的最新研究直接揭了老底:我们天天在用的大语言模型,有一个算一个,都存在不同程度的数据污染。 ▲ 论文:从模型 Token 列表推测大语言模型的中文训练数据污染( https://arxiv.org/abs/2508.17771) 论文中把这些污染数据定义为 「污染中文词元」(Polluted Chinese…
Home
Blog
Discuss
Gsearch
Powered by
BroadcastChannel
&
Sepia