В мире 5 5

Антон Жупран

31.01.2025 / 09:00

Лянь Вэньфэн — таинственный основатель DeepSeek, который перевернул мир искусственного интеллекта

До 20 января лицо создателя китайского инструмента искусственного интеллекта не было известно широкой публике. В тот день 40-летнего мужчину показало китайское телевидение. Что о нем известно?

Лян Вэньфэн Liang Wenfeng Лян Вэньфен — Лян Вэньфэн (справа) во время встречи с премьером Госсовета Китая Ли Цян. Скрин фото: ShanghaiEyeMagic / YouTube

Еще несколько недель назад мало кто за пределами мира китайских финансов знал имя Лян Вэньфэна (Liang Wenfeng). 20 января по китайскому телевидению был показан сюжет о встрече премьер-министра Госсовета Китая Ли Цяна с небольшой группой экспертов в области искусственного интеллекта во главе с этим 40-летним мужчиной.

«Одет в светлый костюм и светло-серый свитер, когда все остальные выбрали темные пиджаки. Непослушные пряди волос небрежно падали на массивную оправу очков, что еще больше придавало его внешнему облику вид гика. Таким он появился впервые в главном выпуске новостей государственного телевидения в 7 вечера», — пишет Le Mond.

Для Китая это было первое знакомство с новым героем технологической гонки с США, который 20 января представил свою новую модель искусственного интеллекта DeepSeek-R1, открытую и бесплатную, созданную с использованием в разы меньшего финансирования и вычислительных мощностей.

Так кто же этот человек, создатель стартапа, который вызвал ажиотаж в Силиконовой долине и нервозность на Уолл-стрит?

Лян Вэньфэн, родился в 1985 году в портовом городе Чжанчжоу на юге Китая. Еще во время учебы в университете в Ханчжоу он увлекся финансовым моделированием, вдохновленный успехами хедж-фонда Renaissance.
Хедж-фонд — это инвестиционный фонд, который использует сложные стратегии, включая кредитное плечо, короткие продажи и производные финансовые инструменты, чтобы добиться высокой доходности независимо от состояния рынка. Он отличается от традиционных фондов большей гибкостью и высоким уровнем риска. Чаще всего доступен только для крупных инвесторов.

Парень писал первые алгоритмы для анализа рынка, а в 2013 году, через несколько лет после получения диплома, вместе с однокурсниками основал количественный инвестиционный фонд, который использовал моделирование больших данных для прогнозирования рыночной динамики и частичной автоматизации инвестиционных решений.

В 2015 году, когда китайский фондовый рынок пережил бурный рост, а затем кризис, это открыло возможности для опытных трейдеров. Основанный в тот же год второй фонд Лян Вэньфэна, High-Flyer, принес значительную прибыль. К 2019 году его активы выросли с 1 до 10 миллиардов юаней (с 130 миллионов до 1,3 миллиарда евро).

Полноценно сосредоточившись на трейдинге с использованием ИИ, Вэньфэн инвестировал в вычислительные мощности: High-Flyer закупил суперкомпьютеры на 156 миллионов евро и успел приобрести 10 000 карток Nvidia A100 до введения санкций США против Китая в 2022 году. Но уже тогда его внимание было направлено дальше — на создание «общего искусственного интеллекта», который должен превзойти человеческий.

Создание DeepSeek

Инвестиции для DeepSeek Вэньфэн берет из High-Flyer и привлекает на работу молодых выпускников без опыта, считая, что «те, кто не знает готовых решений, ищут новые». Сам он продолжает писать код, читать научные статьи и участвовать в обсуждениях DeepSeek. Как отмечают эксперты, Китай имеет два ключевых преимущества: многочисленные таланты в математике и большие массивы данных для обучения ИИ.

DeepSeek нашел новый подход к обучению ИИ. В то время как другие модели просто накапливают знания, DeepSeek был обучен лучше искать ответы с помощью метода «обучения с подкреплением». При нем система сама задает себе вопросы и получает награды (например, дополнительные баллы или улучшение ее возможностей), если ее решения верны. Это делает ее менее быстрой, но значительно более эффективной в потреблении энергии.

В результате DeepSeek-R1 оказался до 27 раз дешевле OpenAI o1 в расчете на запрос. Кроме того, DeepSeek был обучен всего на 2 048 видеокартах, которые Nvidia теперь поставляет в Китай в ограниченном виде, что ставит под вопрос эффективность американских санкций.

Такой подход вызвал интерес даже в США. По мнению экспертов, эффективность китайской модели ИИ по отношению к стоимости делает их более доступными.

Однако DeepSeek имеет и свои ограничения. Модель склонна к генерации недостоверных фактов. Кроме того, при вопросах о политике или истории КНР она часто предлагает «поговорить о чем-то другом», что свидетельствует о встроенной цензуре.

Как отмечает издание, после запуска ChatGPT в 2022 году Китай столкнулся с американской превосходством в ИИ и технологическими ограничениями, введенными Вашингтоном. Первоначальные попытки китайских разработчиков не дотягивали до уровня OpenAI. Однако теперь DeepSeek убедил даже национальных лидеров в возможности технологической победы.

Сам Лян Вэньфэн заявляет, что больше не ищет богатства, а стремится к прорывам, чтобы Китай мог находиться в авангарде технологий. И теперь именно американские инженеры изучают код DeepSeek, чтобы увидеть его секреты.

Читайте еще

Комментарии5

политзек

31.01.2025

а, простите, где и в каком месте он его перевернул?
совершенно точно DeepSeek является подделкой. причем довольно неумелой и небрежной.
иногда он себя раскрывает и считает, что то он ChatGPT, и даже иногда ЯндексGPT. большинство скользких вопросов игнорирует. спросите его про то, что произошло на площади Тяньаньмэнь. или какова ситуация с айгурами.
и это все, что надо знать про "китайский" GPT.
и ДА, открою секрет.. абсолютно ЛЮБОЙ может установить у себя на компьютере совершенно бесплатный GPT с открытым исходным кодом, и он никуда не будет отсылать ваши данные, ваши запросы, а обучить вы его сможете "под себя", под ваши интересы и брать данные там, где вы ему это разрешите.
для ленивых и у кого забанен гугл - llama . com
бабруйчанін

31.01.2025

Ні разумею у гэтых " віртуал бізьнісе" схемах
Але зачапіла у 2015 у 30 гадовага кітайца 130 млн$ на рахунку ???
Адразу узгадал пачатак 90 х калі па целіку " вундэркінды" 25-30 разпрагалі аб сваіх фондах фінкампаніях аб сваіх хеніяльных здольнасцях..Шмат было ..
Пасля знікалі як з'явілісь грошэй ні знайсці
Я бачу " віртуал хенія" а у реале як у анекдоце
От коммунистов ничего хорошего не стоит ожидать

31.01.2025

Некоторые в интернете уже обратили внимание на пользовательское соглашение этого китайского «чуда», где написано, что все ваши данные, все ваши запросы, IP адреса и другая информация будет храниться и использоваться в интересах DeepSeek. И все это будет храниться на серверах Китайской народной республики и может быть использована в интересах Китая. Поэтому если вы будете пользоваться этим китайским дистиллятом, ни в коем случае не печатайте в боте ваши персональные данные или чувствительную информацию. Ибо вся эта информация может быть использована против вас коммунистическим режимом. Хотя чего еще можно было ожидать от коммунистов.

«Твой и за могилой». Найденные письма Калиновского к любимой раскрывают его феноменальную психологию11

История11

«Твой и за могилой». Найденные письма Калиновского к любимой раскрывают его феноменальную психологию

«В силу личных причин не может продолжать»: при неясных обстоятельствах сменился руководитель в бывшем отделении белорусского Ernst&Young1 1

Белорусы выкупили Радзивилловскую карту ВКЛ4 4

Какой город в Беларуси самый солнечный?17 17

В Барановичском районе женщину, предположительно, загрызли животные

Жителя Могилева, который отбивался от губопиковцев в гражданском, будут судить по расстрельной статье12 12

Жителя Могилева, который отбивался от губопиковцев в гражданском, будут судить по расстрельной статье12