Свет 4 4

Антось Жупран

31.01.2025 / 09:00

Лян Вэньфэн — таемны заснавальнік DeepSeek, які перавярнуў свет штучнага інтэлекту

Да 20 студзеня твар стваральніка кітайскага інструмента штучнага інтэлекту не быў вядомы шырокай публіцы. У той дзень 40-гадовага мужчыну паказала кітайскае тэлебачанне. Што пра яго вядома?

Лян Вэньфэн Liang Wenfeng Лян Вэньфен — Лян Вэньфэн (справа) падчас сустрэчы з прэм'ерам Дзяржрады Кітая Лі Цяна. Скрын відэа: ShanghaiEyeMagic / YouTube

Яшчэ некалькі тыдняў таму мала хто па-за межамі свету кітайскіх фінансаў ведаў імя Лян Вэньфэна (Liang Wenfeng). 20 студзеня па кітайскім тэлебачанні быў паказаны сюжэт аб сустрэчы прэм'ера Дзяржрады Кітая Лі Цяна з невялікай групай экспертаў у галіне штучнага інтэлекту на чале з гэтым 40-гадовым мужчынам.

«Апрануты ў светлы гарнітур і светла-шэры світар, калі ўсе астатнія выбралі цёмныя пінжакі. Непаслухмяныя пасмы валасоў нядбайна ападалі на масіўную аправу акуляраў, што яшчэ больш рабіла яго знешні воблік падобным да гіка. Такім ён з’явіўся ўпершыню ў галоўным выпуску навін дзяржаўнага тэлебачання а 7-й вечара», — піша Le Mond.

Для Кітая гэта было першае знаёмства з новым героем тэхналагічнай гонкі з ЗША, які 20 студзеня прадставіў сваю новую мадэль штучнага інтэлекту DeepSeek-R1, адкрытую і бясплатную, створаную з выкарыстаннем у разы меншага фінансавання і вылічальных магутнасцей.

Так хто ж гэты мужчына, стваральнік стартапу, які выклікаў хваляванне ў Сіліконавай даліне і нервовасць на Уол-стрыт?

Лян Вэньфэн, нарадзіўся ў 1985 годзе ў партовым горадзе Чжанцзян на поўдні Кітая. Яшчэ падчас вучобы ва ўніверсітэце ў Ханчжоў ён захапіўся фінансавым мадэляваннем, натхнёны поспехамі хедж-фонду Renaissance.
Хедж-фонд — гэта інвестыцыйны фонд, які выкарыстоўвае складаныя стратэгіі, уключаючы крэдытнае плячо, кароткія продажы і вытворныя фінансавыя інструменты, каб атрымаць высокую прыбытковасць незалежна ад стану рынку. Ён адрозніваецца ад традыцыйных фондаў большай гнуткасцю і высокім узроўнем рызыкі. Часцей за ўсё даступны толькі для буйных інвестараў.

Хлопец пісаў першыя алгарытмы для аналізу рынку, а ў 2013 годзе, праз некалькі гадоў пасля атрымання дыплома, разам з аднакурснікамі заснаваў квантавы інвестыцыйны фонд, які выкарыстоўваў мадэляванне вялікіх даных для прагназавання рынкавай дынамікі і частковай аўтаматызацыі інвестыцыйных рашэнняў.

У 2015 годзе, калі кітайскі фондавы рынак перажыў бурны рост, а затым крызіс, гэта адкрыла магчымасці для вопытных трэйдараў. Заснаваны ў той жа год другі фонд Ляна Вэньфэна, High-Flyer, прынёс значныя прыбыткі. Да 2019 года яго актывы выраслі з 1 да 10 мільярдаў юаняў (з 130 мільёнаў да 1,3 мільярда еўра).

Паўнавартасна засяродзіўшыся на трэйдынгу з выкарыстаннем ШІ, Вэньфэн інвеставаў у вылічальныя магутнасці: High-Flyer закупіў суперкамп’ютары на 156 мільёнаў еўра і паспеў набыць 10 000 картак Nvidia A100 да ўвядзення санкцый ЗША супраць Кітая ў 2022 годзе. Але ўжо тады яго ўвага была скіраваная далей — на стварэнне «агульнага штучнага інтэлекту», які павінен пераўзысці чалавечы.

Стварэнне DeepSeek

Інвестыцыі для DeepSeek Вэньфэн бярэ з High-Flyer і прыцягвае на працу маладых выпускнікоў без досведу, лічачы, што «тыя, хто не ведае гатовых рашэнняў, шукаюць новыя». Сам ён працягвае пісаць код, чытаць навуковыя артыкулы і ўдзельнічаць у абмеркаваннях DeepSeek. Як адзначаюць эксперты, Кітай мае дзве ключавыя перавагі: шматлікія таленты ў матэматыцы і вялікія масівы дадзеных для навучання ШІ.

DeepSeek знайшоў новы падыход да навучання ШІ. У той час як іншыя мадэлі проста назапашваюць веды, DeepSeek быў навучаны лепш шукаць адказы з дапамогай метаду «навучання з падмацаваннем». Пры ім сістэма сама задае сабе пытанні і атрымлівае ўзнагароды (напрыклад, дадатковыя балы або паляпшэнне яе магчымасцяў), калі яе рашэнні правільныя. Гэта робіць яе менш хуткай, але значна больш эфектыўнай у спажыванні энергіі.

У выніку DeepSeek-R1 апынуўся да 27 разоў таннейшым за OpenAI o1 у разліку на запыт. Акрамя таго, DeepSeek быў навучаны ўсяго на 2 048 відэакартах, якія Nvidia цяпер пастаўляе ў Кітай у абмежаваным выглядзе, што ставіць пад пытанне эфектыўнасць амерыканскіх санкцый.

Такі падыход выклікаў цікавасць нават у ЗША. На думку экспертаў, эфектыўнасць кітайскай мадэлі ШІ ў адносінах да кошту робіць іх больш даступнымі.

Аднак DeepSeek мае і свае абмежаванні. Мадэль схільная да генерацыі несапраўдных фактаў. Да таго ж пры пытаннях пра палітыку або гісторыю КНР яна часта прапануе «пагаварыць пра нешта іншае», што сведчыць пра ўбудаваную цэнзуру.

Як адзначае выданне, пасля запуску ChatGPT у 2022 годзе Кітай сутыкнуўся з амерыканскай перавагай у ШІ і тэхналагічнымі абмежаваннямі, уведзенымі Вашынгтонам. Першапачатковыя спробы кітайскіх распрацоўшчыкаў не дацягвалі да ўзроўню OpenAI. Аднак цяпер DeepSeek пераканаў нават нацыянальных лідараў у магчымасці тэхналагічнай перамогі.

Сам Лян Вэньфэн заяўляе, што больш не шукае багацця, а імкнецца да прарываў, каб Кітай мог стаяць у авангардзе тэхналогій. І цяпер менавіта амерыканскія інжынеры вывучаюць код DeepSeek, каб зразумець яго сакрэты.

Чытайце яшчэ

Каментары4

политзек

31.01.2025

а, простите, где и в каком месте он его перевернул?
совершенно точно DeepSeek является подделкой. причем довольно неумелой и небрежной.
иногда он себя раскрывает и считает, что то он ChatGPT, и даже иногда ЯндексGPT. большинство скользких вопросов игнорирует. спросите его про то, что произошло на площади Тяньаньмэнь. или какова ситуация с айгурами.
и это все, что надо знать про "китайский" GPT.
и ДА, открою секрет.. абсолютно ЛЮБОЙ может установить у себя на компьютере совершенно бесплатный GPT с открытым исходным кодом, и он никуда не будет отсылать ваши данные, ваши запросы, а обучить вы его сможете "под себя", под ваши интересы и брать данные там, где вы ему это разрешите.
для ленивых и у кого забанен гугл - llama . com
бабруйчанін

31.01.2025

Ні разумею у гэтых " віртуал бізьнісе" схемах
Але зачапіла у 2015 у 30 гадовага кітайца 130 млн$ на рахунку ???
Адразу узгадал пачатак 90 х калі па целіку " вундэркінды" 25-30 разпрагалі аб сваіх фондах фінкампаніях аб сваіх хеніяльных здольнасцях..Шмат было ..
Пасля знікалі як з'явілісь грошэй ні знайсці
Я бачу " віртуал хенія" а у реале як у анекдоце
От коммунистов ничего хорошего не стоит ожидать

31.01.2025

Некоторые в интернете уже обратили внимание на пользовательское соглашение этого китайского «чуда», где написано, что все ваши данные, все ваши запросы, IP адреса и другая информация будет храниться и использоваться в интересах DeepSeek. И все это будет храниться на серверах Китайской народной республики и может быть использована в интересах Китая. Поэтому если вы будете пользоваться этим китайским дистиллятом, ни в коем случае не печатайте в боте ваши персональные данные или чувствительную информацию. Ибо вся эта информация может быть использована против вас коммунистическим режимом. Хотя чего еще можно было ожидать от коммунистов.

«Твой і за магілаю». Знойдзеныя лісты Каліноўскага да каханай раскрываюць яго фенаменальную псіхалогію7

Гісторыя7

«Твой і за магілаю». Знойдзеныя лісты Каліноўскага да каханай раскрываюць яго фенаменальную псіхалогію

Беларусы выкупілі Радзівілаўскую карту ВКЛ1 1