Anthropic最近因为在Claude Fable中搞“静默降智”被骂到道歉。他们为了防止对手用Claude的数据进行蒸馏(Distillation),悄悄用手段污染输出让模型装傻,波及了大量无辜开发者。
最值得玩味的切入点是,AI巨头过去一直把自己包装成人类安全的守护者,这次却把商业竞争的防线,包装成了防范灾难的安全红线。这种以安全之名、行商业防守之实的做法,彻底砸了信任招牌。
这给行业敲响了警钟:当闭源巨头为了保护护城河开始主动给输出“投毒”,本地部署的开源模型就不再是备选项,而是开发者捍卫技术自主权的唯一退路。
www.theverge.com/ai-artificial-intelligence/948280/anthropic-claude-fable-invisible-distillation-guardrail