Product
o1
Первая коммерческая модель рассуждения (Reasoning Model) от OpenAI, способная решать сложные научные и математические задачи за счет скрытого процесса обдумывания.
o1 (ранее Project Strawberry) — флагманская модель OpenAI, выпущенная в конце 2024 года, которая ознаменовала переход к парадигме System 2 в ИИ.
В отличие от GPT-4o, o1 не просто предсказывает следующий токен, а использует Reinforcement Learning для построения внутренней цепочки рассуждений (Chain of Thought). Это позволяет ей:
- Находить и исправлять свои ошибки в процессе решения.
- Разбивать сложные задачи на этапы.
- Показывать сверхчеловеческие результаты в олимпиадах по программированию (IOI) и математике (IMO).
Запуск o1 стал катализатором массового перехода индустрии к агентному инференсу.