(Пост-)структурализъм и изкуствен интелект
Обновена на: May 9, 2024Напоследък се старая да разуча структурните и пост-структурните гледища по отношение както на литературния смисъл, така и на социо-културния смисъл. Докато структурализмът е становище по отношение на стабилното смислово наследяване на отношенията между определени думи (или фрази), пост-структурализмът отрича стабилността на смисъла и го обявява за вечно флуиден. Не съм убеден, че мога да напиша по-кратко въведение в разликата между двете школи.
Ако Сосюр и Леви-Строс са ярките олицетворения на структурализма, Дерида и Ницше биха били отсрещните лица (като с Ницше ще засегна някои читатели, но само прочетете част от Зазоряване или Веселата наука).
Първите са обвинени в “грозен” детерминизъм по отношение на предварително установените (от структурата) развития в социологията от вторите, които – струва ми се с някакъв ефирен сантмент към “свободната воля” – са склонни да препишат нови интерпретации на класически текстове с оглед… изберете си: колониализъм, расизъм или глобалното затопляне. Или с други думи, деконструкцията на Дерида търси да “разопакова” причините за двоичните различия в смислите, докато семиотиката на Сосюр ги приема като даденост и извежда смисъл от тях.
С други думи динамиката между смисловия чифт “черно-бяло” според Сосюр е стабилна, а според Дерида е арбитрарна и зависи от външни фактори.
Защо би ни интересувало това? Като изключим, че това са фундаментите както на дисциплини като МИО и социо-икономика, така и на теория на литературата, Големите езикови модели, които са двигателите на съвремения изкуствен интелект, са пряко зависими от тези (пост-)структурни теории. От една страна могат да ни потвърдят дали деконструкцията е правилния метод или семиотиката, а от друга – да предвидим поведението на модела на база едно от двете гледища. Да не говорим, че въпросът за “съзнанието” на изкуствения интелект стои в периферията на тези гледища.
Впечатление ми направи, че техничарите изглежда клонят към структурния метод, докато хуманистите реват против първите с причини, които приличат на нещо между “ама обиждате чувствата на модела” и “становището ви е просто фа-лого-центристко и това е много сексистко поведение”. Изглежда да преувеличавам малко, но не.
Структурното гледище ни казва, че моделът, холистично, произвежда илюзията за кохерентност и “менталитет”, следвайки именно веригата (структурата) на езика, която наследява в обучителния процес; резонът е налице: щом се обучава върху стрктуриран датасет от език, е резонно да наследи същата стрктура, когато изчислява статистическата вероятност за всяка следваща дума.
Пост-структурното гледище все още ме обърква. Изглежда като поредното доказателство, че пост-структурната школа няма за цел практически изследвания, а само критика върху такива. Не успях да намеря рационални обосновки (забравих, че този тип мислители отирчат рационалността по подразбиране (защото всеки смисъл е арбитрарен, нали)) в студиите и есетата, които разгледах, за обвинението на горния абзац в почти всеки модерен харам, стигнах дори дотам, че трудът да дерайлира от въпроса дали езиковият модел “разбира” смисъла, който предава, до това, че езикови актьори (хора) сами не разбират смисъл, че дори и до изключването на смисъл отвъд самата текстова рамка. Това е infamous цитатът на Дерида, който всеки пропуска, че е грешно преразказан. Имам предвид “няма нищо отвъд текста”.
Или, каква е антиномията между двете гледища във връзка с езиковите модели, която искаме да разрешим? Едно, че ГЕМ-овете наследяват структурата от езика, върху който са обучавани. Две, че не “разбират” смисъла, който компилират. Три, че онзи “разбран смисъл” не зависи от външен фактор като например политическто убеждение на екипът, извършващ превъзпитателния процес.
Точки първа и втора ще нарека, с властта в мен, ясни от само себе си. Даже ще дам изречение към втората: математиката на статистическият анализ не е епистемология; опитността не е изчислируема.
Третата точка е малко по-tricky. Интуитивно ще кажем “ама разбира се, че прогресивна феминистка ще превъзпита модела така, щото да е прогресивно феминистки. Но интуицията ни ще ни подведе: актът на феминистката не е да “убеди” модела да “разумира” смисъла в определен социален конструкт от наративи; моделът не разбира наративи, виж точка втора. Актът на феминистката е да ситуира модела в определена позиция в структурата на езика. Ако компилацията на модела ни прилича на феминистки отговор, това е илюзия, породена (emergent) от местонахождението му в структурата; от релацията, отношението, което той изчислява между думите. А релацията за математически алгоритъм не зависи от епистемология, зависи от позиция в структура.
В заключение: ИИ не “мисли”; когато феминистка ви каже, че това съждение е харам, трябва да му/й се изсмеете; пост-структурализмът и следователно деконструкцията не са методи за натрупване на знание, а за мрънкане.