Лянь Вэньфэн — таинственный основатель DeepSeek, который перевернул мир искусственного интеллекта
До 20 января лицо создателя китайского инструмента искусственного интеллекта не было известно широкой публике. В тот день 40-летнего мужчину показало китайское телевидение. Что о нем известно?
Еще несколько недель назад мало кто за пределами мира китайских финансов знал имя Лян Вэньфэна (Liang Wenfeng). 20 января по китайскому телевидению был показан сюжет о встрече премьер-министра Госсовета Китая Ли Цяна с небольшой группой экспертов в области искусственного интеллекта во главе с этим 40-летним мужчиной.
«Одет в светлый костюм и светло-серый свитер, когда все остальные выбрали темные пиджаки. Непослушные пряди волос небрежно падали на массивную оправу очков, что еще больше придавало его внешнему облику вид гика. Таким он появился впервые в главном выпуске новостей государственного телевидения в 7 вечера», — пишет Le Mond.
Для Китая это было первое знакомство с новым героем технологической гонки с США, который 20 января представил свою новую модель искусственного интеллекта DeepSeek-R1, открытую и бесплатную, созданную с использованием в разы меньшего финансирования и вычислительных мощностей.
Так кто же этот человек, создатель стартапа, который вызвал ажиотаж в Силиконовой долине и нервозность на Уолл-стрит?
Лян Вэньфэн, родился в 1985 году в портовом городе Чжанчжоу на юге Китая. Еще во время учебы в университете в Ханчжоу он увлекся финансовым моделированием, вдохновленный успехами хедж-фонда Renaissance.
Парень писал первые алгоритмы для анализа рынка, а в 2013 году, через несколько лет после получения диплома, вместе с однокурсниками основал количественный инвестиционный фонд, который использовал моделирование больших данных для прогнозирования рыночной динамики и частичной автоматизации инвестиционных решений.
В 2015 году, когда китайский фондовый рынок пережил бурный рост, а затем кризис, это открыло возможности для опытных трейдеров. Основанный в тот же год второй фонд Лян Вэньфэна, High-Flyer, принес значительную прибыль. К 2019 году его активы выросли с 1 до 10 миллиардов юаней (с 130 миллионов до 1,3 миллиарда евро).
Полноценно сосредоточившись на трейдинге с использованием ИИ, Вэньфэн инвестировал в вычислительные мощности: High-Flyer закупил суперкомпьютеры на 156 миллионов евро и успел приобрести 10 000 карток Nvidia A100 до введения санкций США против Китая в 2022 году. Но уже тогда его внимание было направлено дальше — на создание «общего искусственного интеллекта», который должен превзойти человеческий.
Создание DeepSeek
Инвестиции для DeepSeek Вэньфэн берет из High-Flyer и привлекает на работу молодых выпускников без опыта, считая, что «те, кто не знает готовых решений, ищут новые». Сам он продолжает писать код, читать научные статьи и участвовать в обсуждениях DeepSeek. Как отмечают эксперты, Китай имеет два ключевых преимущества: многочисленные таланты в математике и большие массивы данных для обучения ИИ.
DeepSeek нашел новый подход к обучению ИИ. В то время как другие модели просто накапливают знания, DeepSeek был обучен лучше искать ответы с помощью метода «обучения с подкреплением». При нем система сама задает себе вопросы и получает награды (например, дополнительные баллы или улучшение ее возможностей), если ее решения верны. Это делает ее менее быстрой, но значительно более эффективной в потреблении энергии.
В результате DeepSeek-R1 оказался до 27 раз дешевле OpenAI o1 в расчете на запрос. Кроме того, DeepSeek был обучен всего на 2 048 видеокартах, которые Nvidia теперь поставляет в Китай в ограниченном виде, что ставит под вопрос эффективность американских санкций.
Такой подход вызвал интерес даже в США. По мнению экспертов, эффективность китайской модели ИИ по отношению к стоимости делает их более доступными.
Однако DeepSeek имеет и свои ограничения. Модель склонна к генерации недостоверных фактов. Кроме того, при вопросах о политике или истории КНР она часто предлагает «поговорить о чем-то другом», что свидетельствует о встроенной цензуре.
Как отмечает издание, после запуска ChatGPT в 2022 году Китай столкнулся с американской превосходством в ИИ и технологическими ограничениями, введенными Вашингтоном. Первоначальные попытки китайских разработчиков не дотягивали до уровня OpenAI. Однако теперь DeepSeek убедил даже национальных лидеров в возможности технологической победы.
Сам Лян Вэньфэн заявляет, что больше не ищет богатства, а стремится к прорывам, чтобы Китай мог находиться в авангарде технологий. И теперь именно американские инженеры изучают код DeepSeek, чтобы увидеть его секреты.
Комментарии
совершенно точно DeepSeek является подделкой. причем довольно неумелой и небрежной.
иногда он себя раскрывает и считает, что то он ChatGPT, и даже иногда ЯндексGPT. большинство скользких вопросов игнорирует. спросите его про то, что произошло на площади Тяньаньмэнь. или какова ситуация с айгурами.
и это все, что надо знать про "китайский" GPT.
и ДА, открою секрет.. абсолютно ЛЮБОЙ может установить у себя на компьютере совершенно бесплатный GPT с открытым исходным кодом, и он никуда не будет отсылать ваши данные, ваши запросы, а обучить вы его сможете "под себя", под ваши интересы и брать данные там, где вы ему это разрешите.
для ленивых и у кого забанен гугл - llama . com
Але зачапіла у 2015 у 30 гадовага кітайца 130 млн$ на рахунку ???
Адразу узгадал пачатак 90 х калі па целіку " вундэркінды" 25-30 разпрагалі аб сваіх фондах фінкампаніях аб сваіх хеніяльных здольнасцях..Шмат было ..
Пасля знікалі як з'явілісь грошэй ні знайсці
Я бачу " віртуал хенія" а у реале як у анекдоце