Organization

DeepSeek

Китайская исследовательская лаборатория ИИ, известная своими высокоэффективными Open Source моделями, которые конкурируют с лучшими закрытыми аналогами при значительно меньшей стоимости обучения и инференса.

DeepSeek (DeepSeek AI) — китайская компания, ставшая одним из лидеров в области Open Source искусственного интеллекта.

Достижения:

  • DeepSeek V3: Модель Mixture-of-Experts (MoE), которая по многим бенчмаркам сравнялась с GPT-4 и Claude 3.5 Sonnet, будучи полностью открытой.
  • DeepSeek R1: Одна из первых открытых моделей с возможностями рассуждения (Reasoning), использующая Reinforcement Learning для улучшения цепочек мыслей.
  • Эффективность: Известна инновациями в архитектуре (Multi-Head Latent Attention), позволяющими радикально снизить затраты памяти и вычислений.

К 2025 году модели DeepSeek захватили значительную долю рынка, особенно в задачах кодинга и ролевых сценариях.