Повесть о стрелке и запятой +25




В этой статье мы:

  • Познакомимся с сопряженными функторами
  • Узнаем, как отвечать на вопрос «что такое каррирование»
  • Притворимся, что у нас есть состояние (если есть только функции)
  • И вдогонку поиграемся с примитивной оптикой (линзами)

И все это с помощью нескольких определений теории категорий и двух простейших конструкций: стрелки и запятой.



В этой статье я намеренно буду избегать полных определений, набора аксиом и доказательств — мне не хотелось бы просто копировать текст из Википедии или учебников. Но если хотите по-настоящему понять эти концепции теории категорий, настоятельно рекомендую этот блог. Я хочу показать, как взаимосвязаны, казалось бы, далекие друг от друга конструкции в программировании через призму математики. Еще будут примеры кода на Haskell.

Функции и кортежи


Начнем с двух простых конструкций, которые наверняка присутствуют в каждом языке общего назначения.

Что такое функция? Это отображение одного множества на другое. Это кусок кода, принимающий аргумент s и возвращающий результат a: s -> a.



Что такое кортеж? Это самое элементарное произведение двух любых типов s и a: (s, a).



Мы привыкли смотреть на эти две конструкции в инфиксной форме. Что если мы немного изменим угол обзора и посмотрим префиксно, то есть выставим операнды после оператора?




Теперь мы видим, что они очень даже похожи! Они принимают два аргумента в одном и том же порядке. Но есть нюанс: у стрелки первый аргумент s находится в негативной позиции, а у кортежа — в позитивной (что делает стрелку профунктором, а запятую бифунктором). Поэтому давайте проигнорируем первые аргументы, а точнее, просто их зафиксируем:





И теперь они не только являются ковариантными функторами, но еще и формируют такое интересное отношение как сопряжение!



Но обо всем по порядку.

Категории, функторы, сопряжения


Категория — это набор объектов и стрелок между ними:


«What is a Category? Definition and Examples» © Math3ma

Функторы — это отображения между категориями:


«What is a Functor? Definition and Examples, Part 1» © Math3ma

А сопряжение — это особое отношение между функторами. То есть, если мы можем построить две такие коммутативные диаграммы, и равенства выполняются, мы говорим что F и G — сопряженные функторы (F ? G):


«What is an Adjunction? Part 2 (Definition)» © Math3ma

Возможно, прямо сейчас это кажется чем-то сложным и абстрактным от реального программирования, но мы убедимся в обратном как только приведем примеры.

Сопряжение запятой и стрелки


Примерно так выглядит определение функтора в языках с параметрическим полиморфизмом:



Начнем с того, что функция и кортеж — это функторы:



В случае с кортежом, первый аргумент зафиксирован, поэтому поменять мы можем только второй.



А в случае со стрелкой, определение отображения совпадает с композицией функций!

Пожалуй, определения сопряженного функтора в коде выглядит достаточно запутанно:



Поэтому вместо операции сопряжения слева и сопряжения справа, мы определим кое-что попроще — единицу и коединицу. Помните те две коммутативные диаграммы? Операция ? соответствует коединице, а ? — единице:


«What is an Adjunction? Part 2 (Definition)» © Math3ma

Начнем с коединицы:

? :: f (g a) -> a
-- Вместо f и g подставляем запятую и стрелку:
? :: (((,) s) ((->) s a)) -> a
-- Раскрываем скобки для запятой - из префиксной нотации в инфиксную:
? :: (s, ((->) s a)) -> a
-- Раскрываем скобки для стрелки - из префиксной нотации в инфиксную:
? :: (s, s -> a) -> a

Что у нас тут получилось? Коединица для запятой и стрелки, которая принимает какой-то аргумент s, функцию из s в a. Хм, выглядит как применение функции:

? :: (s, s -> a) -> a
? (x, f) = f x

Отлично, 90% работы проделано — осталось еще 90%. Теперь возьмемся за единицу:

? :: a -> g (f a)
-- Вместо f и g подставляем запятую и стрелку:
? :: a -> ((->) s ((,) s a))
-- Раскрываем скобки для стрелки - из префиксной нотации в инфиксную:
? :: a -> s -> ((,) s a)
-- Раскрываем скобки для запятой - из префиксной нотации в инфиксную:
? :: a -> s -> (s, a)

Итак, единица принимает s, a и собирает их в кортеж в обратном порядке, проще некуда:

? :: a -> s -> (s, a)
? x s = (s, x)

А теперь вернемся к тем самым операциям, которые выглядели так страшно еще несколько абзацев назад:



Попробуем реализовать сопряжение слева и сопряжение справа:



Уффф, что-то легче не стало. Порой, в попытке что-то понять, у нас нет другого выбора кроме как посмотреть на это очень внимательно. Давайте прямо сейчас это и сделаем.

Сопряжение слева: принимает функцию, которая принимает кортеж (s, a) -> b и результатом становится функция, которая поочередно принимает по одному аргументу — сначала a, потом s:



Сопряжение слева наоборот: принимает функцию, которая возвращает функцию (a -> (s -> b)) и результатом становится выражение, которое принимает кортеж.



Вам это ничего не напоминает? Да это же каррирование!

curry :: ((a, s) -> b) -> a -> s -> b
uncurry :: (a -> s -> b) -> (a, s) -> b

(Единственное отличие в том, что аргументы a и s идут в обратном порядке)

Если вдруг вам на собеседовании зададут вопрос «что такое каррирование», можете смело отвечать: «Это всего лишь сопряжение слева функтора кортежа по функтору функции, в чем проблема?»

Комбинаторика функторов


Идея: давайте попробуем составить простую композицию функторов стрелки и запятой, а потом посмотрим, что получится. Простая композиция — это просто оборачивание одного функтора в другой, ведь они полиморфны по своему аргументу. Сделать мы это можем двумя способами:



На место f и g подставляем запятую и стрелку (с фиксированными аргументами) соответственно:



Выглядит как-то знакомо, правда? Еще как! В одной комбинации мы получаем комонаду Store, а в другой — монаду State.





И они также образуют сопряжение!



Состояние и хранилище


Что мы себе представляем в первую очередь, когда создаем программы, которые зависят не только от своего аргумента, но и от какого-нибудь состояния? Наверное, то, что мы кладем/извлекаем некоторое значение в коробочке. Или, в случае конечного автомата, мы концентрируемся на переходах:



Что же, для переходов у нас есть стрелка, а для коробочки — кортеж:

type State s a = s -> (s, a)

-- Изменить хранимое состояние с помощью функции
modify :: (s -> s) -> State s ()
modify f s = (f s, ())

-- Получить хранимое состояние
get :: State s s
get s = (s, s)

-- Заменить хранимое состояние другим
put :: s -> State s ()
put new _ = (new, ())

Хранилище — это что-то совершенно другое. Мы храним некоторый источник s и инструкцию о том, как из этого s получить а:

type Store s a = (s, s -> a)

pos :: Store s a -> s
pos (s, _) = s

peek :: s -> Store s a -> a
peek s (_, f) = f s

retrofit :: (s -> s) -> Store s a -> Store s a
retrofit g (s, f) = (g s, f)

Где же это может использоваться?

Фокусируемся с линзами


Порой нам нужно работать с вложенными структурами неизменяемых данных, фокусируясь на каких-то определенных частях. Представьте, что вы смотрите сквозь увеличительное стекло на ваши данные — все остальные вещи просто пропадают из поля зрения.



И мы можем построить это увеличительное стекло с помощью комонады хранилища:



Как только нам удалось сфокусироваться на нужной нам части данных, мы можем просмотреть, что там лежит, заменить эту часть новой или изменить ее с помощью функции:

view :: Lens s t -> s -> t
view lens = pos . lens

set :: Lens s t -> t -> s -> s
set lens new = peek new . lens

over :: Lens s t -> (t -> t) -> s -> s
over lens f = extract . retrofit f . lens

Изменяем состояние с линзами


Давайте рассмотрим эту магию в действии. Жил был человек:

data Person = Person Name Address (Maybe Job)

У нас есть линзы, которые могут фокусироваться на его работе и адресе проживания:

job :: Lens Person (Maybe Job)
address :: Lens Person Address

Он в поиске работы. Некоторые вакансии предполагают переезд — в зависимости от того, на какое предложение он откликнется, ему надо будет переехать в определенный город.

hired :: State (Maybe Job) City
relocate :: City -> State Address ()

Итак, у нас есть выражение hired, которое оперирует состоянием текущей работы (Maybe Job). Также есть выражение, которое принимает в качестве аргумента город и в зависимости от этого меняет свое состояние Address. Оба выражения имеют эффект состояния, но мы не можем их использовать вместе, потому что тип состояний разный.

Но у нас есть волшебная функция zoom, которая позволяет с помощью линзы из большего состояния в меньшее подниматься до уровня нужного нам состояния (очень похоже на метод поднятия эффектов lift в монадных трансформерах).

zoom :: Lens bg ls -> State ls a -> State bg a

Берем подходящие линзы и применяем к соответствующим выражениям с подходящим состояниям:

zoom job hired :: State Person City
zoom address (relocate _) :: State Person ()

И связываем эти выражения в монадный конвейер! Теперь мы имеем доступ к состоянию Person во всем связанном выражении:

zoom job hired >>= zoom address . relocate

Исходники с определениями можно найти здесь.




Комментарии (17):

  1. sshikov
    /#22195912 / +2

    Но есть нюанс: у стрелки первый аргумент s находится в негативной позиции, а у стрелки — в позитивной (что делает стрелку профунктором, а запятую бифунктором).


    Вообще говоря, тут далеко не очевидно, ху из ху. А ведь это практически самое начало.

    • mayorovp
      /#22196896

      Кстати, для тех кто хочет узнать что же всё-таки имел в виду автор.


      Стрелка по первому аргументу является "обратным функтором": если мы попытаемся составить для неё map-подобную операцию, то окажется что она будет работать не в ту сторону:


      -- для нормальных функторов
      map :: (x -> y) -> [x] -> [y]
      
      -- а вот что выходит для стрелки
      type Arrow x = x -> Int
      map :: (x -> y) -> Arrow y -> Arrow x

    • domix32
      /#22197316 / +1

      Вот, да. Непонятно что есть негативная/позитивная позиция.

      • koldyr
        /#22197984 / +1

        Функторы бывают ковариантные и контровариантные. Бифункторы могут быть ковариантнтнымт по одному аргументу и контравариантными по другому. (,) ковариантен по обоим аргументам. А (->) контравариантен по первому и контравариантен по второму. И, до кучи, композиция контравариантный функторов будет ковариантна.

        • iokasimov
          /#22198008

          Композиция контрвариантных функторов тоже ковариантна. Удобно запомнить: позитивная позиция — (+), негативная — (-). Минус и минус дают плюс.

  2. koldyr
    /#22195974 / +1

    Кмк статья для тех кто уже знает, но, все равно, спасибо.

    • lgorSL
      /#22196100 / +1

      Я вроде попал в число тех, кто знает не всё, но читать было сложно. И ещё принятые в Haskell обозначения после других языков не очень воспринимаются.
      Но, в любом случае, спасибо автору. Лучше такая статья, чем её отсутствие.

  3. Daddy_Cool
    /#22196544 / +2

    Чтобы понять Haskell надо просто понять Haskell.

  4. ibrin
    /#22196638

    То есть получается, что функция (s->a) — это отображение множества (s) на множество (a) через операцию, описываемую самой фунцией (->). Другими словами, результат операции над множеством (s) выгружается в (a). А кортеж, будучи произведением (s,a) по сути является результатом совершенно конкретной (произведение) функции двух переменных без выгрузки результата. Так?

  5. mayorovp
    /#22196934

    Автор, если уж вы зафиксировали первый аргумент, то почему бы вместо ((,) s) и ((->) s) не написать нормальные (s,) и (s ->)? На одну пару скобок будет меньше, что значительно упростит восприятие. А то в данный момент рисунок для инстанса Adjoint выглядит как упражнение на поиск парных скобок...

    • iokasimov
      /#22197836

      Это не валидный синтаксис.

      • mayorovp
        /#22197862

        Но ведь с остальными бинарными операторами такое работает :-(

        • iokasimov
          /#22201558

          Это работает со значениями, не с типами.

      • 0xd34df00d
        /#22201380

        Первое — валидный с -XTupleSections. Если для второго расширения не завезли, то стоит это исправить и запилить аналог для стрелок.

        • iokasimov
          /#22201554

          Нет, это не валидный синтаксис. Путаете со значениями, с типами это не работает.

          • 0xd34df00d
            /#22201750

            Да, вы правы, я потерял контекст.

  6. Tzimie
    /#22199448 / +1

    Видимо Haskell это способ создать область, куда не проникают программисты из Индии