Естественные маркеры смыслов при тренировке ИИ русскому языку
Наука складности, как учение о процессах, имеет что сказать про нейросети.
Этим постом мы открываем рубрику, посвящённую различным аспектам искусственного интеллекта.
Начнём, как мы это любим, с лёгкого эпатажа. В заметке https://nauka.skladnost.ru/ideja-i-smysl/ мы уже касались того обстоятельства, что современный язык — это язык действий, а
Смысл — это атрибут деятельности. Смысл выражает то что эту деятельность создаёт и потеря чего может являться причиной завершения деятельности.
Деятельность можно моделировать суммой действий в её итеративном повторении, но нельзя через эту сумму описать, поскольку деятельность является процессом — более сложной категорией описания мира. Описанием деятельности является именно её смысл.
Современные нейросети построены на основе логики, т.е., на основе парадигмы действий. Чтобы моделировать деятельность, компьютерному нейрону не хватает некоторых инструментов и к этому мы вернёмся в следующих заметках. Аналогично, современные языки также слабо предназначены для передачи смысла и связано это с тем обстоятельствам, что в современной парадигме логического мышления смыслу нет места. Математика, являющаяся основой современного мышления, не оперирует категорией смысла, т.е., не может его исчислять.
Чтобы передать смысл в языке, нам необходимо написать, как минимум, четверостишие. Есть и другие способы. Например, сегодня, когда парадигма мышления активно меняется, для этого пытаются приспособить мемы.
Но эта заметка посвящена тому, что в русском языке есть встроенный секретный слой, который позволяет выражать смыслы точно и односложно. Как-то так получилось, что русский культурный код не отделим от смысловой оценки происходящего. Но, поскольку, как уже сказано, современная парадигма мышления для оперирования смыслами не предназначена, этот слой через казуальный язык не выражается и вынужден проявляться через наше бессознательное.
Речь идёт о русском мате. Если абстрагироваться от этической оценки его употребления (которая довольно сиюминутна, ибо не очень понятно, что неправильного заключено в символике плодородия), то мы можем сделать следующе наблюдение: один из используемых символов означает причину, начало любого процесса и все словоформы с его употреблением, как одобрительные, так и осуждающие, в их семантически корректном употреблении, связаны именно с причиной. Другой символ означает завершение, оформление и все словоформы с ним также несут эту коннотацию. Таким образом, мы имеем довольно широкий круг терминов, касающихся того, что может хорошо, или плохо начаться и того, как это может хорошо, или плохо закончиться, а также указания на ту, или иную динамику развития. Словом — всё то, что необходимо для описания итоговой сути и жизненного цикла любых процессов, в частности, человеческой деятельности.
В этом ракурсе несложно понять, почему мы иногда говорим матерно. Дело в том, что будучи русскоговорящими, мы думаем не результатами действий, как это происходит в голове наших западных соседей, а смыслами происходящих процессов, иными словами, мы не задаём себе вопрос «зачем мы что-либо делаем?», мы задаём себе вопрос «чем это для нас закончится?».
И этого же мы ожидаем от других.
Поэтому, когда наш собеседник, а, в особенности, подельник, внутри своей головы не понимает смысла той деятельности, в которую вовлечён вместе с нами, наше бессознательное прорывается наружу в виде прямых указаний, на что нашему партнёру жизненно необходимо обратить внимание. Как это ни удивительно, часто это достигает необходимого результата.
Для целей тренировки сильного ИИ это означает, что, хотя он не может анализировать смысл, семантически корректная матерная речь может служить для него образцом естественной смысловой разметки. В качестве обучающей выборки, конечно, не подойдёт скоромная речь незрелого школьника, или же речь взрослого, доведённого до пред-истерического состояния, когда мат выражает смысловую нагрузку не того, о чём говорится, а того, что на самом деле бушует в его перегруженной голове. Более подойдут зрелая военная и производственно-хозяйственная проза жизненных ситуаций.
Научившись матерно рефлексировать свои собственные высказывания до выдачи их пользователю, ИИ сможет достаточно точно определять уровень своей вежливости и соответствия этикету.