Инженер NVIDIA признал превосходство DeepSeek R1 в открытом ИИ

Инженер NVIDIA признал превосходство DeepSeek R1 в открытом ИИ
17.02.2025

Инженер NVIDIA признал превосходство DeepSeek R1 в открытом ИИ

Старший инженер-исследователь NVIDIA Джим Фан удивил технологическое сообщество, публично отметив выдающиеся достижения новой открытой ИИ-модели DeepSeek R1. В своем заявлении он провел параллели между методами обучения этой модели и революционными изменениями, которые принес AlphaZero в мир настольных игр, таких как Go, сёги и шахматы.

DeepSeek R1 привлекла внимание благодаря применению метода "холодного старта", основанного исключительно на обучении с подкреплением. Этот инновационный подход позволяет модели самостоятельно развиваться без использования заранее подготовленных данных, что делает процесс ее обучения более адаптивным и эффективным.

Заявление Фана вызвало оживленные обсуждения в профессиональных кругах, особенно с учетом его опыта: он был первым стажером OpenAI и имеет степень Ph.D. Стэнфордского университета. В своем комментарии он отметил, что мы живем в эпоху, где именно неамериканская компания воплощает первоначальную миссию OpenAI – создание действительно открытых, передовых исследований, доступных каждому. Это кажется парадоксальным, но зачастую именно неожиданные сценарии оказываются наиболее вероятными.

Инженер NVIDIA признал превосходство DeepSeek R1.jpg

Среди ключевых технологических достижений DeepSeek R1 выделяется алгоритм GRPO, который в отличие от традиционного PRO исключает критическую сеть, применяя среднее вознаграждение от множества образцов. Это не только сокращает потребление памяти, но и позволяет модели увеличивать время "размышления" по мере обучения, повышая тем самым точность решений.

Еще одной значимой инновацией является механизм вознаграждения, который основан на жестко закодированных правилах вместо обучаемых моделей. Такой метод делает работу модели более предсказуемой и прозрачной, что особенно важно для научных исследований и практического применения.

Фан также отметил сдвиг в технологическом влиянии, который выходит за рамки традиционного понимания прогресса в ИИ. Он подчеркнул: "Развитие можно достигать не только через концепцию "достижения AGI" или загадочные проекты вроде "Project Strawberry", но и через открытое распространение алгоритмов и методов обучения". Таким образом, его заявление подчеркивает важность открытости и прозрачности в развитии ИИ, что становится решающим фактором для будущих исследований и внедрения технологий.

Публичное признание инженера NVIDIA в превосходстве DeepSeek R1 уже вызвало активное обсуждение в профессиональном сообществе, а также подогрело интерес к перспективам открытого ИИ. Такой поворот событий может повлиять на будущее развитие индустрии и изменить баланс сил между закрытыми и открытыми исследованиями в области искусственного интеллекта.


Возврат к списку

×