Анатомия на когнитивния срив при дълги масиви от данни
Въпросният експеримент, пренесен от полето на човешката когнитивна психология към изчислителната лингвистика, използва модифицирана версия на теста на Струп. Концепцията е елементарна, но разкриваща: на изследвания субект се подават текстови означения за цветове, при които самият цвят на шрифта умишлено се разминава със семантичното значение на думата. Задачата изисква изолиране на автоматичната реакция за прочитане на текста и извличане единствено на физическия параметър на символите. При хората този процес се управлява от така наречения изпълнителен контрол, локализиран във фронталния кортекс, който позволява съзнателно разпределяне на ресурсите на вниманието и филтриране на разсейващата информация чрез волево усилие.
При софтуерните архитектури обаче липсата на биологичен аналог на този филтър води до механично плъзгане по повърхността на най-вероятните статистически връзки. Анализът на независимата изследователска група показва, че модели като GPT-4o и Claude 3.5 Sonnet оперират с висока прецизност само докато обемът на контекстния прозорец позволява удържане на първоначалната софтуерна инструкция без натрупване на изчислителен шум. При кратки поредици от пет елемента системите демонстрират стабилно поведение, осигуряващо коректност над 90%. Проблемът възниква в момента, в който масивът се разрасне до 20 или 40 последователни стимула. Тогава Claude 3.5 Sonnet свива производителността си до 24 на сто, а флагманът на OpenAI пада до нива от 15%, което на практика означава пълна деградация на целевата функция и преминаване към най-енергийно спестяващия режим – буквалното четене на думите.
Този резултат показва нещо много по-дълбоко от обикновен софтуерен бъг. Той осветява фундаменталното разминаване между човешкото селективно внимание и математическото изчисляване на тегла в рамките на трансформърната архитектура. Невронните мрежи нямат механизъм, който да дублира човешката воля или способността за съзнателно удържане на фокуса срещу нарастващото съпротивление на средата. Когато алгоритъмът се сблъска с необходимостта едновременно да следва зададена prompt-инструкция и да потиска най-силната си вътрешна обучена тенденция (която е да свързва буквените низове с тяхното директно значение), той неизменно капитулира пред по-силно изразената статистическа вероятност с увеличаването на дължината на текста.
Ресурси, архитектура и логистичните ограничения на изчислителната мощ
Зад фасадата на маркетинговите презентации за неограничените възможности на технологиите стоят суровите закони на изчислителната логистика и разхода на енергия. Съвременните големи езикови модели (LLMs) разчитат на механизми за внимание (attention mechanisms), които изчисляват релациите между всеки две думи в даден текст. Това изисква огромен ресурс, който нараства квадратично спрямо дължината на въведения контекст. Когато моделът е принуден да обработва конфликтни сигнали в дълги последователности, разходът на изчислителни цикли на един сървърен възел се увеличава, без това да води до качествено подобрение на крайния резултат. Числата от доклада в PNAS Nexus просто не потвърждават версията на технологичните корпорации, че по-големите масиви от данни автоматично раждат по-висока интелигентност.
Сегашната инфраструктура от центрове за данни, захранвани от хиляди графични ускорители, е оптимизирана за разпознаване на модели и продължаване на текстови последователности въз основа на исторически натрупани масиви. Тя обаче се оказва в състояние на командно дишане, когато се изисква динамична адаптация в реално време към променящи се логически правила в рамките на една и съща сесия. Този дефект не може да бъде отстранен просто с добавянето на повече памет или по-бързи чипове. Това е концептуална пробойна в самия начин, по който машините обработват информация. Човешкият мозък, работещ с мощност от едва двадесет вата, успява да изолира разсейващите фактори благодарение на милиони години еволюционен подбор, създал йерархични системи за контрол на поведението. Машината от своя страна остава заложник на математическото очакване – тя избира пътя на най-малкото съпротивление, който в случая с теста на Струп е грешният път.
В по-широк геоикономически контекст, тези разкрития поставят под въпрос икономическата целесъобразност на огромните инвестиции в сектора. Корпорациите влагат милиарди долари в изграждането на енергийна инфраструктура и софтуерни платформи, очаквайки те да заменят човешкия фактор в критични сфери на управлението, логистиката и анализа. Данните от психологическите тестове върху машини обаче показват, че автоматизираните системи са силно уязвими при дълги работни цикли, изискващи специфична концентрация. Това означава, че в реални условия, където шумовите фактори и противоречивите инструкции са ежедневие, изкуственият интелект бързо губи своята надеждност и изисква постоянен човешки надзор, за да не се превърне в генератор на грешки.
Илюзията за суверенно мислене и реалността на пазара
Това изглежда логично в контекста на досегашните изследвания на когнитивните граници на софтуера, но има един сериозен проблем за индустрията. Ако моделите губят контрол над базови параметри при обем от едва 40 променливи, тогава всички твърдения за автономно вземане на решения в правото, медицината или военното дело остават в сферата на PR съобщенията. Симулацията на интелект работи отлично, докато се намираме в рамките на стандартния дискурс или кратките форми, където шаблоните са лесно приложими. Когато обаче системата трябва да работи в режим на филтриране на дезинформация или управление на сложни логистични вериги, липсата на гъвкавост на вниманието води до фатални отклонения от заданието.
Процесите на обучение на невронните мрежи по същество представляват създаване на затворена статистическа матрица. Моделът не разбира какво е „червено“ или „синьо“, той просто борави с вектори на вероятностите. Когато инструкцията изисква от него да действа напук на тези вектори, той е подложен на софтуерен стрес, който нараства пропорционално на дължината на задачата. В този смисъл опитите на изследователите от PNAS Nexus да приложат психологически инструменти върху алгоритми са изключително полезни за демитологизирането на технологичния сектор. Те доказват, че зад претенциите за дигитална еволюция стои същата механична машина, която се пречупва под тежестта на собствената си архитектурна тромавост.
В крайна сметка се оказва, че уязвимостта на изкуствения интелект не произтича от липсата на данни, а от невъзможността за контекстуално самосъзнание. Докато човешкият оператор е в състояние да осъзнае грешката си по време на изпълнение на задачата и да коригира поведението си чрез волеви акцент, езиковият модел продължава да генерира грешни отговори с абсолютно същата математическа увереност, с която е генерирал и верните. Този липса на обратна връзка вътре в самата мисловна структура прави системите нестабилни при дългосрочно натоварване, превръщайки ги в ненадеждни инструменти без външна регулация и постоянен човешки одит.