AI 精选动态
智能评分 68
Collective Constitutional AI: Aligning a Language Model with Public Input
AI 推荐理由
可重点查看其从公众意见到可训练 constitution 的映射流程,以及与 Anthropic 既有 constitution 的差异。核心解读
Anthropic 与 Collective Intelligence Project 通过 Polis 平台征集约 1,000 名美国公众参与,为 AI 系统共同起草一份 constitution。该过程共收集 1,127 条 statements、38,252 次投票,平均每人 34 票;Polis 识别出 2 个意见群体。Anthropic 将公众意见筛选后形成可用于 Constitutional AI 训练的公共 constitution,并与 Anthropic 员工撰写的 constitution 对比,发现两者在概念与价值上约有 50% 重叠,但公众版本更强调客观性、公平性、可访问性,以及“促进”期望行为而非仅避免不当行为。