AI 精选动态智能评分 68

Collective Constitutional AI: Aligning a Language Model with Public Input

来源: Anthropic-research

发布于: 2023-10-17

收录于: 2026-05-21

AI 推荐理由

可重点查看其从公众意见到可训练 constitution 的映射流程，以及与 Anthropic 既有 constitution 的差异。

核心解读

Anthropic 与 Collective Intelligence Project 通过 Polis 平台征集约 1,000 名美国公众参与，为 AI 系统共同起草一份 constitution。该过程共收集 1,127 条 statements、38,252 次投票，平均每人 34 票；Polis 识别出 2 个意见群体。Anthropic 将公众意见筛选后形成可用于 Constitutional AI 训练的公共 constitution，并与 Anthropic 员工撰写的 constitution 对比，发现两者在概念与价值上约有 50% 重叠，但公众版本更强调客观性、公平性、可访问性，以及“促进”期望行为而非仅避免不当行为。

#研究突破#AI安全#模型发布

阅读原始全文