Product

o1

Первая коммерческая модель рассуждения (Reasoning Model) от OpenAI, способная решать сложные научные и математические задачи за счет скрытого процесса обдумывания.

o1 (ранее Project Strawberry) — флагманская модель OpenAI, выпущенная в конце 2024 года, которая ознаменовала переход к парадигме System 2 в ИИ.

В отличие от GPT-4o, o1 не просто предсказывает следующий токен, а использует Reinforcement Learning для построения внутренней цепочки рассуждений (Chain of Thought). Это позволяет ей:

  • Находить и исправлять свои ошибки в процессе решения.
  • Разбивать сложные задачи на этапы.
  • Показывать сверхчеловеческие результаты в олимпиадах по программированию (IOI) и математике (IMO).

Запуск o1 стал катализатором массового перехода индустрии к агентному инференсу.