В мире55

Лянь Вэньфэн — таинственный основатель DeepSeek, который перевернул мир искусственного интеллекта

До 20 января лицо создателя китайского инструмента искусственного интеллекта не было известно широкой публике. В тот день 40-летнего мужчину показало китайское телевидение. Что о нем известно?

Лян Вэньфэн Liang Wenfeng Лян Вэньфен
Лян Вэньфэн (справа) во время встречи с премьером Госсовета Китая Ли Цян. Скрин фото: ShanghaiEyeMagic / YouTube

Еще несколько недель назад мало кто за пределами мира китайских финансов знал имя Лян Вэньфэна (Liang Wenfeng). 20 января по китайскому телевидению был показан сюжет о встрече премьер-министра Госсовета Китая Ли Цяна с небольшой группой экспертов в области искусственного интеллекта во главе с этим 40-летним мужчиной.

«Одет в светлый костюм и светло-серый свитер, когда все остальные выбрали темные пиджаки. Непослушные пряди волос небрежно падали на массивную оправу очков, что еще больше придавало его внешнему облику вид гика. Таким он появился впервые в главном выпуске новостей государственного телевидения в 7 вечера», — пишет Le Mond.

Для Китая это было первое знакомство с новым героем технологической гонки с США, который 20 января представил свою новую модель искусственного интеллекта DeepSeek-R1, открытую и бесплатную, созданную с использованием в разы меньшего финансирования и вычислительных мощностей.

Так кто же этот человек, создатель стартапа, который вызвал ажиотаж в Силиконовой долине и нервозность на Уолл-стрит?

Лян Вэньфэн, родился в 1985 году в портовом городе Чжанчжоу на юге Китая. Еще во время учебы в университете в Ханчжоу он увлекся финансовым моделированием, вдохновленный успехами хедж-фонда Renaissance.

Парень писал первые алгоритмы для анализа рынка, а в 2013 году, через несколько лет после получения диплома, вместе с однокурсниками основал количественный инвестиционный фонд, который использовал моделирование больших данных для прогнозирования рыночной динамики и частичной автоматизации инвестиционных решений.

В 2015 году, когда китайский фондовый рынок пережил бурный рост, а затем кризис, это открыло возможности для опытных трейдеров. Основанный в тот же год второй фонд Лян Вэньфэна, High-Flyer, принес значительную прибыль. К 2019 году его активы выросли с 1 до 10 миллиардов юаней (с 130 миллионов до 1,3 миллиарда евро).

Полноценно сосредоточившись на трейдинге с использованием ИИ, Вэньфэн инвестировал в вычислительные мощности: High-Flyer закупил суперкомпьютеры на 156 миллионов евро и успел приобрести 10 000 карток Nvidia A100 до введения санкций США против Китая в 2022 году. Но уже тогда его внимание было направлено дальше — на создание «общего искусственного интеллекта», который должен превзойти человеческий.

Лян Вэньфэн Liang Wenfeng Лян Вэньфен
Лян Вэньфэн в 2019 году. Фото: VCG/VCG via Getty Images

Создание DeepSeek

Инвестиции для DeepSeek Вэньфэн берет из High-Flyer и привлекает на работу молодых выпускников без опыта, считая, что «те, кто не знает готовых решений, ищут новые». Сам он продолжает писать код, читать научные статьи и участвовать в обсуждениях DeepSeek. Как отмечают эксперты, Китай имеет два ключевых преимущества: многочисленные таланты в математике и большие массивы данных для обучения ИИ.

DeepSeek нашел новый подход к обучению ИИ. В то время как другие модели просто накапливают знания, DeepSeek был обучен лучше искать ответы с помощью метода «обучения с подкреплением». При нем система сама задает себе вопросы и получает награды (например, дополнительные баллы или улучшение ее возможностей), если ее решения верны. Это делает ее менее быстрой, но значительно более эффективной в потреблении энергии.

В результате DeepSeek-R1 оказался до 27 раз дешевле OpenAI o1 в расчете на запрос. Кроме того, DeepSeek был обучен всего на 2 048 видеокартах, которые Nvidia теперь поставляет в Китай в ограниченном виде, что ставит под вопрос эффективность американских санкций.

Такой подход вызвал интерес даже в США. По мнению экспертов, эффективность китайской модели ИИ по отношению к стоимости делает их более доступными.

Однако DeepSeek имеет и свои ограничения. Модель склонна к генерации недостоверных фактов. Кроме того, при вопросах о политике или истории КНР она часто предлагает «поговорить о чем-то другом», что свидетельствует о встроенной цензуре.

Как отмечает издание, после запуска ChatGPT в 2022 году Китай столкнулся с американской превосходством в ИИ и технологическими ограничениями, введенными Вашингтоном. Первоначальные попытки китайских разработчиков не дотягивали до уровня OpenAI. Однако теперь DeepSeek убедил даже национальных лидеров в возможности технологической победы.

Сам Лян Вэньфэн заявляет, что больше не ищет богатства, а стремится к прорывам, чтобы Китай мог находиться в авангарде технологий. И теперь именно американские инженеры изучают код DeepSeek, чтобы увидеть его секреты.

Комментарии5

  • политзек
    31.01.2025
    а, простите, где и в каком месте он его перевернул?
    совершенно точно DeepSeek является подделкой. причем довольно неумелой и небрежной.
    иногда он себя раскрывает и считает, что то он ChatGPT, и даже иногда ЯндексGPT. большинство скользких вопросов игнорирует. спросите его про то, что произошло на площади Тяньаньмэнь. или какова ситуация с айгурами.
    и это все, что надо знать про "китайский" GPT.
    и ДА, открою секрет.. абсолютно ЛЮБОЙ может установить у себя на компьютере совершенно бесплатный GPT с открытым исходным кодом, и он никуда не будет отсылать ваши данные, ваши запросы, а обучить вы его сможете "под себя", под ваши интересы и брать данные там, где вы ему это разрешите.
    для ленивых и у кого забанен гугл - llama . com
  • бабруйчанін
    31.01.2025
    Ні разумею у гэтых " віртуал бізьнісе" схемах
    Але зачапіла у 2015 у 30 гадовага кітайца 130 млн$ на рахунку ???
    Адразу узгадал пачатак 90 х калі па целіку " вундэркінды" 25-30 разпрагалі аб сваіх фондах фінкампаніях аб сваіх хеніяльных здольнасцях..Шмат было ..
    Пасля знікалі як з'явілісь грошэй ні знайсці
    Я бачу " віртуал хенія" а у реале як у анекдоце
  • От коммунистов ничего хорошего не стоит ожидать
    31.01.2025
    Некоторые в интернете уже обратили внимание на пользовательское соглашение этого китайского «чуда», где написано, что все ваши данные, все ваши запросы, IP адреса и другая информация будет храниться и использоваться в интересах DeepSeek. И все это будет храниться на серверах Китайской народной республики и может быть использована в интересах Китая. Поэтому если вы будете пользоваться этим китайским дистиллятом, ни в коем случае не печатайте в боте ваши персональные данные или чувствительную информацию. Ибо вся эта информация может быть использована против вас коммунистическим режимом. Хотя чего еще можно было ожидать от коммунистов.

«Твой и за могилой». Найденные письма Калиновского к любимой раскрывают его феноменальную психологию11

«Твой и за могилой». Найденные письма Калиновского к любимой раскрывают его феноменальную психологию

Все новости →
Все новости

В Беларуси немного смягчат Уголовный кодекс и защитят «бывшего президента»1

Стали известны точные цифры нового утилизационного сбора. Вот какие авто подорожают9

В Национальном художественном музее выставили работы Z-художников, прикрывшись темой «Великой Отечественной войны»22

Бывшую королевскую усадьбу в Гродно купила церковь «Слово Божие»3

Политзаключенная блогерка Виктория Гусарова после суда вышла на свободу

Астрономы открыли новый астероид. А позже оказалось, что это автомобиль, который летает в космосе4

Пробил талон, но все равно «заяц» — как такое возможно4

«Белавиа» дает скидку на все рейсы из Беларуси

Статкевича номинировали на Нобелевскую премию мира8

больш чытаных навін
больш лайканых навін

«Твой и за могилой». Найденные письма Калиновского к любимой раскрывают его феноменальную психологию11

«Твой и за могилой». Найденные письма Калиновского к любимой раскрывают его феноменальную психологию

Главное
Все новости →

Заўвага:

 

 

 

 

Закрыць Паведаміць