Вторые ряды ассоциаций, или как заставить робота читать «между строк» +4


image

Изучая прикладную психологию в составе группы энтузиастов, была выявлена интересная закономерность. Нам показалось, что обнаруженные связи между словами очевидны. Но теперь, спустя много лет, я начинаю понимать, что в эту сторону люди, почему-то, не смотрят.

Подтверждением тому могут стать недавно появившиеся «стихи» от нейронных сетей Google в стиле спичрайтеров мэра одного большого города.

Примеры такой «поэзии»:

«То был единственный путь.
Это был единственный путь.
Был ее черед моргнуть.
Было трудно сказать».

«Он надолго замолчал.
Он смолк на мгновение.
На секунду стало тихо.
Было темно и холодно.
Возникла пауза.
Теперь мой черед».

И, если перефразировать слова того самого мэра, то «Сегодня нейронные сети не каждый может программировать. Вернее, программировать могут не только лишь все – мало кто может это делать.»

Для того, чтобы робот сочинял более адекватные стихи или понимал глубокий смысл уже написанных, следует вложить в него систему ассоциирования. Для каждого исходного слова существует «первый порядок» или «явный ряд» ассоциаций. Его для удобства можно разбить на несколько групп:

Визуальные: Солнце -> Апельсин
Аудиальные: Конь -> Цокот, сюда же относятся омонимы, рифмы, аллитерации, устоявшиеся выражения (Пуп -> Земли)
Кинестетические: Дождь -> Мокро
Логические: Санкт-Петербург -> Окно в Европу

Этот ряд очевиден и легко читается человеком. Подтверждением тому служит игра в ассоциации.

Но такой простой подход не может позволить роботу проникнуть глубоко в суть текста. Зато робо-поэтам от Google же, стоит им воспользоваться, чтобы уменьшить зашкаливающую абстрактность их «произведений».

Однако, каждая ассоциация первого порядка может быть представлена как исходное слово, к которому так же можно построить свой ряд ассоциаций. Если сложить несколько рядов «ассоциаций к ассоциациям» для одного и того же слова и вычесть из него «явный ряд», то получится «второй ряд ассоциаций» к исходному слову. Этот второй и все последующие ряды ассоциаций трудно разгадываемы сознанием человека, тогда как подсознание легко обнаруживает закономерности и «читает между строк». Образовывается ситуация, которую можно описать анекдотом:

— Сколько будет 0,5+1/2?
— Нутром чую что литр, а доказать не могу.

В итоге текст, построенный на рядах скрытых ассоциаций, может казаться совершенно нелогичным и бессвязным, однако очень точно передавать мысли и эмоции человека. Если учитывать эту нехитрую закономерность при машинном анализе текстов, то станет возможным определять что именно хотел сказать автор, но не сказал явно (но его сдало подсознание). Похожую методику (не объясняя механики) используют психологи и психиатры, например, в тесте Роршаха или тесте на ассоциации.

Дабы не быть голословным, приведу пример построения второго ряда ассоциаций для слова «Любовь»:

image

Очевидно, что из 256 ассоциаций второго порядка (16х16) серьёзная доля уже использована в текстах поп-песен, большинство из которых про ту самую «любовь», что и является лучшим доказательством вышеописанной теории.

Считаю, что за этой простой с виду парадигмой семантического анализа кроется сложный путь к созданию полноценного программного сознания (которое часто называют громким термином ИИ).

-->


К сожалению, не доступен сервер mySQL