Недавно DeepSeek выпустил обновление последней версии V3 — DeepSeek-V3-0324 на Hugging Face, модель имеет 6850 миллиардов параметров и значительно улучшила свои возможности в области кода, дизайна пользовательского интерфейса и вывода.
На недавно завершившейся конференции GTC 2025 генеральный директор NVIDIA Дженсен Хуанг высоко оценил DeepSeek. Он подчеркнул, что мнение рынка о том, что эффективные модели DeepSeek снизят спрос на чипы, является ошибочным; в будущем вычислительные потребности только возрастут, а не уменьшатся.
DeepSeek как представительный продукт прорыва в области алгоритмов заслуживает глубокого обсуждения связи с поставками чипов. Давайте сначала проанализируем значение вычислительной мощности и алгоритма для развития AI-индустрии.
Сожительство и эволюция вычислительной мощности и алгоритмов
В области ИИ увеличение вычислительной мощности предоставляет основу для выполнения более сложных алгоритмов, позволяя моделям обрабатывать большие объемы данных и изучать более сложные модели; в то время как оптимизация алгоритмов может более эффективно использовать вычислительную мощность, повышая эффективность использования вычислительных ресурсов.
Симбиотические отношения между вычислительной мощностью и алгоритмами заново формируют ландшафт AI-индустрии:
Дифференциация технических маршрутов: некоторые компании стремятся создать сверхбольшие вычислительные кластеры, в то время как другие сосредотачиваются на оптимизации эффективности алгоритмов, формируя различные технические школы.
Реконструкция цепочки поставок: некоторые компании становятся лидерами в области ИИ-вычислительной мощности через экосистему, в то время как облачные сервисы снижают порог развертывания благодаря эластичным вычислительным услугам.
Корректировка распределения ресурсов: компании ищут баланс между инвестициями в аппаратную инфраструктуру и разработкой эффективных Алгоритм.
Восход открытого сообщества: такие открытые модели, как DeepSeek и LLaMA, позволяют делиться результатами инноваций алгоритмов и оптимизации вычислительной мощности, ускоряя итерацию и распространение технологий.
Технические инновации DeepSeek
Успех DeepSeek неразрывно связан с его технологическими инновациями. Вот простое объяснение его основных нововведений:
Оптимизация архитектуры модели
DeepSeek использует комбинированную архитектуру Transformer+MOE (Mixture of Experts) и вводит механизм многоголового латентного внимания (Multi-Head Latent Attention, MLA). Эта архитектура похожа на суперкоманду, где Transformer отвечает за выполнение обычных задач, а MOE выступает в роли группы экспертов, каждый из которых имеет свою область специализации. Когда возникает конкретная проблема, за ее решение берется тот эксперт, который лучше всего в этом разбирается, что значительно повышает эффективность и точность модели. Механизм MLA позволяет модели более гибко сосредотачиваться на различных важных деталях при обработке информации, что еще больше улучшает производительность модели.
Инновации в методах тренировки
DeepSeek предложила структуру обучения с смешанной точностью FP8. Эта структура похожа на интеллектуальный распределитель ресурсов, который может динамически выбирать подходящую вычислительную точность в зависимости от потребностей на различных этапах обучения. Когда требуется высокая точность вычислений, она использует более высокую точность, чтобы гарантировать точность модели; а когда можно принять более низкую точность, она снижает точность, тем самым экономя вычислительные ресурсы, увеличивая скорость обучения и уменьшая использование памяти.
Повышение эффективности алгоритма
На этапе вывода DeepSeek внедряет технологию многотокенового прогнозирования (Multi-token Prediction, MTP). Традиционный метод вывода осуществляется шаг за шагом, при этом на каждом шаге прогнозируется только один токен. Однако технология MTP позволяет прогнозировать несколько токенов за один раз, что значительно ускоряет процесс вывода и одновременно снижает его стоимость.
Прорыв в алгоритме强化学习
Новый алгоритм глубокого обучения DeepSeek GRPO (Обобщенная оптимизация с вознаграждением и наказанием) оптимизирует процесс обучения модели. Укрепляющее обучение похоже на то, как если бы модель имела тренера, который направляет ее, используя вознаграждения и наказания для обучения лучшему поведению. Традиционные алгоритмы укореняющего обучения могут потреблять огромное количество вычислительных ресурсов в этом процессе, в то время как новый алгоритм DeepSeek более эффективен, позволяя улучшить производительность модели и одновременно сократить ненужные вычисления, тем самым достигая баланса между производительностью и стоимостью.
Эти инновации сформировали целую технологическую систему, которая снижает потребность в вычислительной мощности на всем протяжении цепочки, от обучения до вывода. Обычные потребительские графические карты теперь могут запускать мощные AI модели, значительно снижая барьеры для применения AI, что позволяет большему числу разработчиков и компаний участвовать в AI-инновациях.
Влияние на поставщиков чипов
Многие считают, что DeepSeek обошел некоторые технологические уровни, тем самым избавившись от зависимости от конкретных поставщиков. На самом деле, DeepSeek напрямую выполняет оптимизацию алгоритма через уровень PTX (Parallel Thread Execution). PTX — это промежуточный язык представления, который находится между высокоуровневым кодом и реальными инструкциями GPU, и, манипулируя этим уровнем, DeepSeek может достичь более тонкой настройки производительности.
Влияние на поставщиков чипов имеет двусторонний характер: с одной стороны, DeepSeek на самом деле глубже связана с аппаратным обеспечением и соответствующей экосистемой, а снижение порога входа для AI-приложений может расширить общий объем рынка; с другой стороны, оптимизация алгоритма DeepSeek может изменить структуру спроса на высококачественные чипы, и некоторые AI-модели, которые изначально могли работать только на высококачественных GPU, теперь могут эффективно работать даже на средних или потребительских видеокартах.
Значение для AI индустрии
Оптимизация алгоритма DeepSeek предоставляет технологический прорыв для AI-индустрии. В условиях ограничений на высококачественные чипы, подход "программное обеспечение вместо аппаратного обеспечения" снизил зависимость от передовых импортных чипов.
На upstream эффективный Алгоритм снизил давление на потребность в вычислительной мощности, что позволяет провайдерам вычислительных услуг продлить срок службы оборудования за счет программной оптимизации и повысить возврат на инвестиции. На downstream оптимизированные открытые модели снизили барьер для разработки AI-приложений. Многочисленные малые и средние предприятия могут разрабатывать конкурентоспособные приложения на основе модели DeepSeek, не имея большого объема вычислительных ресурсов, что приведет к появлению большего числа AI-решений в вертикальных областях.
Глубокое влияние Web3+AI
Децентрализованная AI инфраструктура
Оптимизация алгоритма DeepSeek предоставляет новую动力 для инфраструктуры Web3 AI, инновационная архитектура, эффективные алгоритмы и низкие требования к вычислительной мощности делают децентрализованное AI-выведение возможным. Архитектура MoE естественно подходит для распределенного развертывания, разные узлы могут иметь разные сети экспертов, без необходимости хранения полной модели на одном узле, что значительно снижает требования к хранению и вычислениям на одном узле, тем самым повышая гибкость и эффективность модели.
FP8 тренировки фрейм уменьшает потребность в высококачественных вычислительных ресурсах, что позволяет большему количеству вычислительных ресурсов присоединяться к сети узлов. Это не только снижает барьер для участия в децентрализованных AI вычислениях, но и повышает вычислительную мощность и эффективность всей сети.
Многоагентная система
Оптимизация стратегий умной торговли: с помощью совместной работы агентов анализа данных о рынке в реальном времени, агентов прогнозирования краткосрочных колебаний цен, агентов выполнения сделок на блокчейне и агентов мониторинга результатов торгов, помогает пользователям получать более высокую прибыль.
Автоматическое выполнение смарт-контрактов: совместная работа агентов мониторинга смарт-контрактов, агентов выполнения смарт-контрактов и агентов контроля результатов выполнения для автоматизации более сложной бизнес-логики.
Персонализированное управление инвестиционным портфелем: ИИ помогает пользователям в реальном времени находить лучшие возможности для стейкинга или предоставления ликвидности в зависимости от их рискованного предпочтения, инвестиционных целей и финансового положения.
DeepSeek именно в условиях ограничения вычислительной мощности ищет прорывы через алгоритмические инновации, открывая дифференцированные пути развития для AI-индустрии. Снижение барьеров для применения, содействие интеграции Web3 и AI, уменьшение зависимости от высококлассных чипов, возможность финансовых инноваций — эти изменения уже перестраивают цифровую экономику. В будущем развитие AI больше не будет просто соревнованием вычислительной мощности, а станет соревнованием по совместной оптимизации вычислительной мощности и алгоритмов. На этой новой арене такие инноваторы, как DeepSeek, заново определяют правила игры с помощью интеллекта.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
DeepSeek V3 ведет к инновациям в AI Алгоритм, преображая будущее Web3
DeepSeek V3: Инновации в алгоритмах в области ИИ
Недавно DeepSeek выпустил обновление последней версии V3 — DeepSeek-V3-0324 на Hugging Face, модель имеет 6850 миллиардов параметров и значительно улучшила свои возможности в области кода, дизайна пользовательского интерфейса и вывода.
На недавно завершившейся конференции GTC 2025 генеральный директор NVIDIA Дженсен Хуанг высоко оценил DeepSeek. Он подчеркнул, что мнение рынка о том, что эффективные модели DeepSeek снизят спрос на чипы, является ошибочным; в будущем вычислительные потребности только возрастут, а не уменьшатся.
DeepSeek как представительный продукт прорыва в области алгоритмов заслуживает глубокого обсуждения связи с поставками чипов. Давайте сначала проанализируем значение вычислительной мощности и алгоритма для развития AI-индустрии.
Сожительство и эволюция вычислительной мощности и алгоритмов
В области ИИ увеличение вычислительной мощности предоставляет основу для выполнения более сложных алгоритмов, позволяя моделям обрабатывать большие объемы данных и изучать более сложные модели; в то время как оптимизация алгоритмов может более эффективно использовать вычислительную мощность, повышая эффективность использования вычислительных ресурсов.
Симбиотические отношения между вычислительной мощностью и алгоритмами заново формируют ландшафт AI-индустрии:
Дифференциация технических маршрутов: некоторые компании стремятся создать сверхбольшие вычислительные кластеры, в то время как другие сосредотачиваются на оптимизации эффективности алгоритмов, формируя различные технические школы.
Реконструкция цепочки поставок: некоторые компании становятся лидерами в области ИИ-вычислительной мощности через экосистему, в то время как облачные сервисы снижают порог развертывания благодаря эластичным вычислительным услугам.
Корректировка распределения ресурсов: компании ищут баланс между инвестициями в аппаратную инфраструктуру и разработкой эффективных Алгоритм.
Восход открытого сообщества: такие открытые модели, как DeepSeek и LLaMA, позволяют делиться результатами инноваций алгоритмов и оптимизации вычислительной мощности, ускоряя итерацию и распространение технологий.
Технические инновации DeepSeek
Успех DeepSeek неразрывно связан с его технологическими инновациями. Вот простое объяснение его основных нововведений:
Оптимизация архитектуры модели
DeepSeek использует комбинированную архитектуру Transformer+MOE (Mixture of Experts) и вводит механизм многоголового латентного внимания (Multi-Head Latent Attention, MLA). Эта архитектура похожа на суперкоманду, где Transformer отвечает за выполнение обычных задач, а MOE выступает в роли группы экспертов, каждый из которых имеет свою область специализации. Когда возникает конкретная проблема, за ее решение берется тот эксперт, который лучше всего в этом разбирается, что значительно повышает эффективность и точность модели. Механизм MLA позволяет модели более гибко сосредотачиваться на различных важных деталях при обработке информации, что еще больше улучшает производительность модели.
Инновации в методах тренировки
DeepSeek предложила структуру обучения с смешанной точностью FP8. Эта структура похожа на интеллектуальный распределитель ресурсов, который может динамически выбирать подходящую вычислительную точность в зависимости от потребностей на различных этапах обучения. Когда требуется высокая точность вычислений, она использует более высокую точность, чтобы гарантировать точность модели; а когда можно принять более низкую точность, она снижает точность, тем самым экономя вычислительные ресурсы, увеличивая скорость обучения и уменьшая использование памяти.
Повышение эффективности алгоритма
На этапе вывода DeepSeek внедряет технологию многотокенового прогнозирования (Multi-token Prediction, MTP). Традиционный метод вывода осуществляется шаг за шагом, при этом на каждом шаге прогнозируется только один токен. Однако технология MTP позволяет прогнозировать несколько токенов за один раз, что значительно ускоряет процесс вывода и одновременно снижает его стоимость.
Прорыв в алгоритме强化学习
Новый алгоритм глубокого обучения DeepSeek GRPO (Обобщенная оптимизация с вознаграждением и наказанием) оптимизирует процесс обучения модели. Укрепляющее обучение похоже на то, как если бы модель имела тренера, который направляет ее, используя вознаграждения и наказания для обучения лучшему поведению. Традиционные алгоритмы укореняющего обучения могут потреблять огромное количество вычислительных ресурсов в этом процессе, в то время как новый алгоритм DeepSeek более эффективен, позволяя улучшить производительность модели и одновременно сократить ненужные вычисления, тем самым достигая баланса между производительностью и стоимостью.
Эти инновации сформировали целую технологическую систему, которая снижает потребность в вычислительной мощности на всем протяжении цепочки, от обучения до вывода. Обычные потребительские графические карты теперь могут запускать мощные AI модели, значительно снижая барьеры для применения AI, что позволяет большему числу разработчиков и компаний участвовать в AI-инновациях.
Влияние на поставщиков чипов
Многие считают, что DeepSeek обошел некоторые технологические уровни, тем самым избавившись от зависимости от конкретных поставщиков. На самом деле, DeepSeek напрямую выполняет оптимизацию алгоритма через уровень PTX (Parallel Thread Execution). PTX — это промежуточный язык представления, который находится между высокоуровневым кодом и реальными инструкциями GPU, и, манипулируя этим уровнем, DeepSeek может достичь более тонкой настройки производительности.
Влияние на поставщиков чипов имеет двусторонний характер: с одной стороны, DeepSeek на самом деле глубже связана с аппаратным обеспечением и соответствующей экосистемой, а снижение порога входа для AI-приложений может расширить общий объем рынка; с другой стороны, оптимизация алгоритма DeepSeek может изменить структуру спроса на высококачественные чипы, и некоторые AI-модели, которые изначально могли работать только на высококачественных GPU, теперь могут эффективно работать даже на средних или потребительских видеокартах.
Значение для AI индустрии
Оптимизация алгоритма DeepSeek предоставляет технологический прорыв для AI-индустрии. В условиях ограничений на высококачественные чипы, подход "программное обеспечение вместо аппаратного обеспечения" снизил зависимость от передовых импортных чипов.
На upstream эффективный Алгоритм снизил давление на потребность в вычислительной мощности, что позволяет провайдерам вычислительных услуг продлить срок службы оборудования за счет программной оптимизации и повысить возврат на инвестиции. На downstream оптимизированные открытые модели снизили барьер для разработки AI-приложений. Многочисленные малые и средние предприятия могут разрабатывать конкурентоспособные приложения на основе модели DeepSeek, не имея большого объема вычислительных ресурсов, что приведет к появлению большего числа AI-решений в вертикальных областях.
Глубокое влияние Web3+AI
Децентрализованная AI инфраструктура
Оптимизация алгоритма DeepSeek предоставляет новую动力 для инфраструктуры Web3 AI, инновационная архитектура, эффективные алгоритмы и низкие требования к вычислительной мощности делают децентрализованное AI-выведение возможным. Архитектура MoE естественно подходит для распределенного развертывания, разные узлы могут иметь разные сети экспертов, без необходимости хранения полной модели на одном узле, что значительно снижает требования к хранению и вычислениям на одном узле, тем самым повышая гибкость и эффективность модели.
FP8 тренировки фрейм уменьшает потребность в высококачественных вычислительных ресурсах, что позволяет большему количеству вычислительных ресурсов присоединяться к сети узлов. Это не только снижает барьер для участия в децентрализованных AI вычислениях, но и повышает вычислительную мощность и эффективность всей сети.
Многоагентная система
Оптимизация стратегий умной торговли: с помощью совместной работы агентов анализа данных о рынке в реальном времени, агентов прогнозирования краткосрочных колебаний цен, агентов выполнения сделок на блокчейне и агентов мониторинга результатов торгов, помогает пользователям получать более высокую прибыль.
Автоматическое выполнение смарт-контрактов: совместная работа агентов мониторинга смарт-контрактов, агентов выполнения смарт-контрактов и агентов контроля результатов выполнения для автоматизации более сложной бизнес-логики.
Персонализированное управление инвестиционным портфелем: ИИ помогает пользователям в реальном времени находить лучшие возможности для стейкинга или предоставления ликвидности в зависимости от их рискованного предпочтения, инвестиционных целей и финансового положения.
DeepSeek именно в условиях ограничения вычислительной мощности ищет прорывы через алгоритмические инновации, открывая дифференцированные пути развития для AI-индустрии. Снижение барьеров для применения, содействие интеграции Web3 и AI, уменьшение зависимости от высококлассных чипов, возможность финансовых инноваций — эти изменения уже перестраивают цифровую экономику. В будущем развитие AI больше не будет просто соревнованием вычислительной мощности, а станет соревнованием по совместной оптимизации вычислительной мощности и алгоритмов. На этой новой арене такие инноваторы, как DeepSeek, заново определяют правила игры с помощью интеллекта.