Organization
DeepSeek
Китайская исследовательская лаборатория ИИ, известная своими высокоэффективными Open Source моделями, которые конкурируют с лучшими закрытыми аналогами при значительно меньшей стоимости обучения и инференса.
DeepSeek (DeepSeek AI) — китайская компания, ставшая одним из лидеров в области Open Source искусственного интеллекта.
Достижения:
- DeepSeek V3: Модель Mixture-of-Experts (MoE), которая по многим бенчмаркам сравнялась с GPT-4 и Claude 3.5 Sonnet, будучи полностью открытой.
- DeepSeek R1: Одна из первых открытых моделей с возможностями рассуждения (Reasoning), использующая Reinforcement Learning для улучшения цепочек мыслей.
- Эффективность: Известна инновациями в архитектуре (Multi-Head Latent Attention), позволяющими радикально снизить затраты памяти и вычислений.
К 2025 году модели DeepSeek захватили значительную долю рынка, особенно в задачах кодинга и ролевых сценариях.