齐首_草庐IT

过去一年，以「预测下一个Token」为本质的大模型已经横扫人类世界的多项任务，展现了人工智能的巨大潜力。在近日的一次访谈中，OpenAI首席科学家IlyaSutskever大胆预言，如果模型能够很好地预测下一个词，那么意味着它能够理解导致这个词产生的深刻现实。这意味着，如果AI按照现有路径发展下去，也许在不久的将来，一个超越人类的人工智能系统就会诞生。但更加令人担心的是，「超级人工智能」可能会带来一些意想不到的负面后果。这也是「对齐」的意义。此前的对齐方法依赖于人类的监督，如在ChatGPT训练中起到关键作用的人类反馈的强化学习（RLHF）。但未来的人工智能系统或许能够做出极其复杂和富有创造性