/Поглед.инфо/ Отрицателната реакция в САЩ на успеха на китайската технология DeepSeek AI значително ускори разделението на света на AI. Китайците играха не по правилата на тяхната индустрия, създадена в САЩ.
В самото начало на годината беше направена решителна стъпка към спускането на технологична „желязна завеса“ над света: противостоянието между две технологични екосистеми. Както при Студената война, надпреварата в AI може да доведе /и май процесът започна/ до появата на конкуриращи се пространства, където доминират различни стандарти за изкуствен интелект (AI). Например страните от БРИКС+ могат да поддържат китайските технологии, а колективният Запад може да поддържа американските.
Разделението на света на AI беше значително ускорено от реакцията в САЩ на модела DeepSeek R1, пуснат от малка китайска компания (около 200 души) с бюджет, по-малък от този на един от екипите на Meta. Най-важното, което направиха, беше да играят срещу правилата на тяхната индустрия, създадени в САЩ.
Затова на Запад новината предизвика хаос, всеобщо раздразнение и възхищение. Китайският модел, който може да разсъждава, се оказа сравним по производителност с глобалния лидер, американския модел o1 от OpenAI. Това стана възможно благодарение на няколко ключови разлики от конкурентите, които доведоха до срива на пазара.
Първо, DeepSeek R1 е много по-ефективен – беше обучен, използвайки по-малко изчислителни ресурси и на по-ниска цена от своите връстници. Това е много важно. Преди се смяташе, че изучаването на големи езикови модели няма как да не е лукс. OpenAI, Anthropic и други IT гиганти похарчиха стотици милиони долари за това.
Защото за това бяха необходими цели грамадни центрове за данни с много скъп хардуер (т.е. GPU – графични процесори, върху които американската Nvidia има монопол). Може да се направи аналогия: за да работи една централа, е необходима отделна електроцентрала. И тогава DeepSeek идва и казва: „Ще направим същото за няколко милиона долара – и между другото, вместо 100 хиляди GPU, две хиляди са ни напълно достатъчни.“ Беше шокиращо.
Второ, моделът DeepSeek R1 е с отворен код. Тоест резултатът, който той постигна, е достъпен за всички. Всеки може да изтегли модела на компютъра си чрез Ollama или LM Studio и след това да го използва без интернет връзка. Кодът е отворен, всичко може да се види. Това е честно инженерство, без трикове. Те не крият нищо.
Моделът е лицензиран от Масачузетския технологичен институт, което позволява на изследователите и разработчиците да използват свободно неговите птеглови коефициенти и резултати. Те са разбираеми за всички. Това го отличава от най-близкия му конкурент, OpenAI, който отдавна е затворил своя код и достъп до теглата на своите модели, предоставяйки само API (програмен интерфейс). И да, DeepSeek е безплатен и няма лимити в момента.
Трето, DeepSeek е просто удобно приложение. Лесен е за инсталиране на вашия смартфон, не иска нищо допълнително, лесен е за разбиране как да се използва. Между другото, той е достъпен в Русия, за разлика от ChatGPT. И ако погледнете света като цяло, той заема първо място по отношение на броя на изтеглянията, изпреварвайки ChatGPT. Това, разбира се, попречи на работата й за известно време, но в крайна сметка те се справиха.
И накрая, DeepSeek промениха начина, по който тренират големи модели, отдалечавайки се от концепцията за чудовище, което се опитва да бъде специалист - майстор по всичко. Решиха, че е глупаво. Защо да активирате всичките 600 милиарда параметъра наведнъж, ако всяка задача изисква тесно специализиран експерт? Те създадоха експертна система, в която е активно само това, което е необходимо в момента. Около 30 милиарда параметъра наведнъж. Това беше огромна икономия.
Балонът на AI индустрията се пука. Сега всички ще започнат да се адаптират към новите условия, правилата на играта ще се променят. DeepSeek постави под въпрос огромните инвестиции, които американските компании правят в AI. Този път не китайските изследователи ще догонват западните, а обратното.
Марк Зукърбърг вече е създал „екипи за спешно реагиране“ от инженери, за да разберат как малката китайска компания е успяла да пусне революционна AI технология. Те ще се поучат от опита на DeepSeek за намаляване на разходите за обучение и експлоатация.
Има доста интересни мнения. Главният учен на Meta, Ян ЛеКун, вярва, че качеството на един модел е безсмислено, освен ако една компания няма устойчива икономика. С други думи, дори ако DeepSeek е технологично конкурентен, способността му да промени пазара зависи само от това дали може да се монетизира ефективно. Е, това е спорно, защото засега всички работят на загуба. OpenAI е нерентабилен от поне 10 години.
Сега американците казват, че Китай е откраднал технологии от тях. Но дали това е вярно, все още не можем да дадем ясен отговор. OpenAI публикува изявление, в което обвинява китайски стартиращи фирми, че се опитват да използват работата на американски компании, за да подобрят своите AI модели.
Има метод, наречен "дестилация". Състои се от един модел, който се учи от друг. Ето как серия от малки модели се обучават върху по-големите. Белият дом смята, че китайската компания може да е използвала американски разработки и обявява това за заплаха за националната сигурност.
Между другото, изненадващо е, че досега Тръмп се изказва доста резервирано. Той каза, че ако китайците могат да обучават модели по-ефективно, тогава техните „най-добри учени в света“ също могат. Най-забавното е, че ако попитате DeepSeek R1 как се обучава, той ще отговори в мотивите си: „Първо, нека ви напомня, че съм базиран на GPT-4 на OpenAI.“
Ако това е вярно, това ни казва две неща: 1) да, методите на преподаване ще се променят; 2) ще се появят „червени линии“ на използването на чужди AI технологии. САЩ започнаха да се движат в тази посока при Байдън. По това време ИТ гигантите реагираха много негативно на ограниченията; самата Nvidia каза, че това ще има отрицателно въздействие върху пазара, но сега вероятно ще преразгледат позицията си.
Вече няма съмнение, че сме свидетели на надпревара за глобално господство в областта на ИИ. Изглежда, че това е предизвикано от съобщението на Доналд Тръмп за стартирането на проекта Stargate, който включва инвестиции в AI в размер на 500 милиарда долара. Това е сравнимо с цената на лунната програма и три пъти повече от годишния обем на цялата индустрия за рисков капитал в САЩ.
Контраатаката на китайския DeepSeek не закъсня. Горе-долу по същото време американският OpenAI показа Operator, първия си агент, който може да използва пълноценно браузър и да поръчва билети, храна, да резервира маси и т.н., китайският ByteDance също представи своя агент UI-TARS. Китайската Alibaba пусна модела Qwen2.5-1M, който поддържа контекст от 1 милион токена.
Това е осем пъти повече от ChatGPT. American Meta се включи в надпреварата с мащабен проект – изграждането на център за данни с размерите на Манхатън. По отношение на мощността това е сравнимо с цяла атомна електроцентрала.
И накрая, Китай обяви стартирането на свой собствен Stargate – правителството отделя един трилион юана (137 милиарда долара) за разработването на AI. Това е три пъти по-малко от американския проект. Но в САЩ само една компания – OpenAI – получава частни пари, докато в Китай, напротив, и петимата доставчици, включително DeepSeek, ще получат държавни субсидии.
И последното в текущия момент, OpenAI пусна o3-mini безплатно. Има чувството, че OpenAI засили играта си, чак когато се появи конкуренция. И всичко това се случи за няколко дни. Това е огромно темпо и това е само началото.
Превод: ЕС