Свет44

Лян Вэньфэн — таемны заснавальнік DeepSeek, які перавярнуў свет штучнага інтэлекту

Да 20 студзеня твар стваральніка кітайскага інструмента штучнага інтэлекту не быў вядомы шырокай публіцы. У той дзень 40-гадовага мужчыну паказала кітайскае тэлебачанне. Што пра яго вядома?

Лян Вэньфэн Liang Wenfeng Лян Вэньфен
Лян Вэньфэн (справа) падчас сустрэчы з прэм'ерам Дзяржрады Кітая Лі Цяна. Скрын відэа: ShanghaiEyeMagic / YouTube

Яшчэ некалькі тыдняў таму мала хто па-за межамі свету кітайскіх фінансаў ведаў імя Лян Вэньфэна (Liang Wenfeng). 20 студзеня па кітайскім тэлебачанні быў паказаны сюжэт аб сустрэчы прэм'ера Дзяржрады Кітая Лі Цяна з невялікай групай экспертаў у галіне штучнага інтэлекту на чале з гэтым 40-гадовым мужчынам.

«Апрануты ў светлы гарнітур і светла-шэры світар, калі ўсе астатнія выбралі цёмныя пінжакі. Непаслухмяныя пасмы валасоў нядбайна ападалі на масіўную аправу акуляраў, што яшчэ больш рабіла яго знешні воблік падобным да гіка. Такім ён з’явіўся ўпершыню ў галоўным выпуску навін дзяржаўнага тэлебачання а 7-й вечара», — піша Le Mond.

Для Кітая гэта было першае знаёмства з новым героем тэхналагічнай гонкі з ЗША, які 20 студзеня прадставіў сваю новую мадэль штучнага інтэлекту DeepSeek-R1, адкрытую і бясплатную, створаную з выкарыстаннем у разы меншага фінансавання і вылічальных магутнасцей.

Так хто ж гэты мужчына, стваральнік стартапу, які выклікаў хваляванне ў Сіліконавай даліне і нервовасць на Уол-стрыт?

Лян Вэньфэн, нарадзіўся ў 1985 годзе ў партовым горадзе Чжанцзян на поўдні Кітая. Яшчэ падчас вучобы ва ўніверсітэце ў Ханчжоў ён захапіўся фінансавым мадэляваннем, натхнёны поспехамі хедж-фонду Renaissance.

Хлопец пісаў першыя алгарытмы для аналізу рынку, а ў 2013 годзе, праз некалькі гадоў пасля атрымання дыплома, разам з аднакурснікамі заснаваў квантавы інвестыцыйны фонд, які выкарыстоўваў мадэляванне вялікіх даных для прагназавання рынкавай дынамікі і частковай аўтаматызацыі інвестыцыйных рашэнняў.

У 2015 годзе, калі кітайскі фондавы рынак перажыў бурны рост, а затым крызіс, гэта адкрыла магчымасці для вопытных трэйдараў. Заснаваны ў той жа год другі фонд Ляна Вэньфэна, High-Flyer, прынёс значныя прыбыткі. Да 2019 года яго актывы выраслі з 1 да 10 мільярдаў юаняў (з 130 мільёнаў да 1,3 мільярда еўра).

Паўнавартасна засяродзіўшыся на трэйдынгу з выкарыстаннем ШІ, Вэньфэн інвеставаў у вылічальныя магутнасці: High-Flyer закупіў суперкамп’ютары на 156 мільёнаў еўра і паспеў набыць 10 000 картак Nvidia A100 да ўвядзення санкцый ЗША супраць Кітая ў 2022 годзе. Але ўжо тады яго ўвага была скіраваная далей — на стварэнне «агульнага штучнага інтэлекту», які павінен пераўзысці чалавечы.

Лян Вэньфэн Liang Wenfeng Лян Вэньфен
Лян Вэньфэн у 2019 годзе. Фота: VCG/VCG via Getty Images

Стварэнне DeepSeek

Інвестыцыі для DeepSeek Вэньфэн бярэ з High-Flyer і прыцягвае на працу маладых выпускнікоў без досведу, лічачы, што «тыя, хто не ведае гатовых рашэнняў, шукаюць новыя». Сам ён працягвае пісаць код, чытаць навуковыя артыкулы і ўдзельнічаць у абмеркаваннях DeepSeek. Як адзначаюць эксперты, Кітай мае дзве ключавыя перавагі: шматлікія таленты ў матэматыцы і вялікія масівы дадзеных для навучання ШІ.

DeepSeek знайшоў новы падыход да навучання ШІ. У той час як іншыя мадэлі проста назапашваюць веды, DeepSeek быў навучаны лепш шукаць адказы з дапамогай метаду «навучання з падмацаваннем». Пры ім сістэма сама задае сабе пытанні і атрымлівае ўзнагароды (напрыклад, дадатковыя балы або паляпшэнне яе магчымасцяў), калі яе рашэнні правільныя. Гэта робіць яе менш хуткай, але значна больш эфектыўнай у спажыванні энергіі.

У выніку DeepSeek-R1 апынуўся да 27 разоў таннейшым за OpenAI o1 у разліку на запыт. Акрамя таго, DeepSeek быў навучаны ўсяго на 2 048 відэакартах, якія Nvidia цяпер пастаўляе ў Кітай у абмежаваным выглядзе, што ставіць пад пытанне эфектыўнасць амерыканскіх санкцый.

Такі падыход выклікаў цікавасць нават у ЗША. На думку экспертаў, эфектыўнасць кітайскай мадэлі ШІ ў адносінах да кошту робіць іх больш даступнымі.

Аднак DeepSeek мае і свае абмежаванні. Мадэль схільная да генерацыі несапраўдных фактаў. Да таго ж пры пытаннях пра палітыку або гісторыю КНР яна часта прапануе «пагаварыць пра нешта іншае», што сведчыць пра ўбудаваную цэнзуру.

Як адзначае выданне, пасля запуску ChatGPT у 2022 годзе Кітай сутыкнуўся з амерыканскай перавагай у ШІ і тэхналагічнымі абмежаваннямі, уведзенымі Вашынгтонам. Першапачатковыя спробы кітайскіх распрацоўшчыкаў не дацягвалі да ўзроўню OpenAI. Аднак цяпер DeepSeek пераканаў нават нацыянальных лідараў у магчымасці тэхналагічнай перамогі.

Сам Лян Вэньфэн заяўляе, што больш не шукае багацця, а імкнецца да прарываў, каб Кітай мог стаяць у авангардзе тэхналогій. І цяпер менавіта амерыканскія інжынеры вывучаюць код DeepSeek, каб зразумець яго сакрэты.

Каментары4

  • политзек
    31.01.2025
    а, простите, где и в каком месте он его перевернул?
    совершенно точно DeepSeek является подделкой. причем довольно неумелой и небрежной.
    иногда он себя раскрывает и считает, что то он ChatGPT, и даже иногда ЯндексGPT. большинство скользких вопросов игнорирует. спросите его про то, что произошло на площади Тяньаньмэнь. или какова ситуация с айгурами.
    и это все, что надо знать про "китайский" GPT.
    и ДА, открою секрет.. абсолютно ЛЮБОЙ может установить у себя на компьютере совершенно бесплатный GPT с открытым исходным кодом, и он никуда не будет отсылать ваши данные, ваши запросы, а обучить вы его сможете "под себя", под ваши интересы и брать данные там, где вы ему это разрешите.
    для ленивых и у кого забанен гугл - llama . com
  • бабруйчанін
    31.01.2025
    Ні разумею у гэтых " віртуал бізьнісе" схемах
    Але зачапіла у 2015 у 30 гадовага кітайца 130 млн$ на рахунку ???
    Адразу узгадал пачатак 90 х калі па целіку " вундэркінды" 25-30 разпрагалі аб сваіх фондах фінкампаніях аб сваіх хеніяльных здольнасцях..Шмат было ..
    Пасля знікалі як з'явілісь грошэй ні знайсці
    Я бачу " віртуал хенія" а у реале як у анекдоце
  • От коммунистов ничего хорошего не стоит ожидать
    31.01.2025
    Некоторые в интернете уже обратили внимание на пользовательское соглашение этого китайского «чуда», где написано, что все ваши данные, все ваши запросы, IP адреса и другая информация будет храниться и использоваться в интересах DeepSeek. И все это будет храниться на серверах Китайской народной республики и может быть использована в интересах Китая. Поэтому если вы будете пользоваться этим китайским дистиллятом, ни в коем случае не печатайте в боте ваши персональные данные или чувствительную информацию. Ибо вся эта информация может быть использована против вас коммунистическим режимом. Хотя чего еще можно было ожидать от коммунистов.

«Твой і за магілаю». Знойдзеныя лісты Каліноўскага да каханай раскрываюць яго фенаменальную псіхалогію7

«Твой і за магілаю». Знойдзеныя лісты Каліноўскага да каханай раскрываюць яго фенаменальную псіхалогію

Усе навіны →
Усе навіны

Жыхар Смілавіч паскардзіўся ў тыктоку на разбітыя вуліцы і «знакамітую лужыну». Што яму адказалі ўлады10

«Адкрыла пакет — у замове не хапала стравы». Беларуска паспрачалася з фастфуд-рэстаранам

Вучыўся на ксяндза, працаваў на фуры, адкрыў хостэл для ўцекачоў. Гісторыя Андрэя Васоры, які памёр у Беластоку пасля комы3

Каму павінен быць помнік перад Домам ураду замест Леніна? Ідэя Гурневіча40

Качанава: Кніга «Наш прэзідэнт» стане для многіх у краіне настольнай13

На мяжы з Беларуссю літоўскія памежнікі знайшлі 25-метровы тунэль кантрабандыстаў7

У Швецыі забілі чалавека, які рэгулярна спальваў Каран4

«Сяргей быў някепскім хлопцам, але наркаман». Падрабязнасці жахлівай гісторыі з кватэрай, у якой пасля куплі знайшлі два трупы6

На борце самалёта, што разбіўся ў ЗША, было больш за 15 фігурыстаў, у тым ліку чэмпіёны свету Шышкова і Навумаў з Расіі6

больш чытаных навін
больш лайканых навін

«Твой і за магілаю». Знойдзеныя лісты Каліноўскага да каханай раскрываюць яго фенаменальную псіхалогію7

«Твой і за магілаю». Знойдзеныя лісты Каліноўскага да каханай раскрываюць яго фенаменальную псіхалогію

Галоўнае
Усе навіны →

Заўвага:

 

 

 

 

Закрыць Паведаміць