o1 - Справочник AI For Work

o1 (ранее Project Strawberry) — флагманская модель OpenAI, выпущенная в конце 2024 года, которая ознаменовала переход к парадигме System 2 в ИИ.

В отличие от GPT-4o, o1 не просто предсказывает следующий токен, а использует Reinforcement Learning для построения внутренней цепочки рассуждений (Chain of Thought). Это позволяет ей:

Находить и исправлять свои ошибки в процессе решения.
Разбивать сложные задачи на этапы.
Показывать сверхчеловеческие результаты в олимпиадах по программированию (IOI) и математике (IMO).

Запуск o1 стал катализатором массового перехода индустрии к агентному инференсу.