Музыкальная [гитарная] статистика +10


В данной статье речь пойдёт о статистическом исследовании большой базы гитарных композиций. Если вам интересно, на какой струне чаще всего играют гитаристы, какая нота самая популярная и прочие подобные вопросы – добро пожаловать.  

Возможно, данная работа является самым масштабным исследованием гитарных композиций. Суммарная продолжительность проанализированных табулатур составила более 304 дня непрерывного звучания музыки.

Что такое табулатура

Табулатура это метод записи гитарных композиций, который не требует знакомство с нотной грамотой. Вместо нотного стана на табулатуре отображаются линии струн гитары, на которых расположены цифры, соответствующие номерам играемых ладов.

Для визуализации статистики я сформировал несколько csv-файлов. Не в каждую визуализацию включены топовые результаты по простой причине: разница между ними и последующими настолько велика, что визуализация теряла ценность. Для удобства изучения материалов все графики интерактивны. Вы можете скачать csv файл кликнув по ссылке "Get the data".

Частота использования

Наиболее часто используемой струной оказалась 4, следом за ней идут 5, 3, 6, и только в самом конце уже 2, 1 и 7.

Значения представлены в числовом варианте, так как иначе график был бы упорядочен непоследовательно. Последовательность нот: до, до#, ре, ре#, ми, фа, фа#, соль, соль#, ля, ля#, си.   

Наиболее частой нотой является си, следует за ней до и после этого ля. Наименьшей популярностью обладают ноты с диезами, исключение составляет только фа, которая менее популярна, чем фа-диез.  

Здесь мы рассматриваем частоту, но не по всему произведению, а по каждому отдельному инструменту произведения. Разница с прошлым графиком незначительна – можно заметить, что нота до выбивается вперёд, в остальном топ-3 отстаёт (остаётся?) схожим. За ними также следует нота ми. Наименее популярные ноты также сохранили свои позиции. 

Данный график демонстрирует частоту использования MIDI нот. Чтобы преобразовать их в значения, что использовались в прошлых графиках, требуется получить остаток от деления на 12 (число нот в октаве). Например, наиболее часто используемая MIDI нота #45 соответствует ноте ля первой октавы. Данная нота соответствует открытой пятой струне в стандартном строе. 

Мелодическими называют последовательные музыкальные интервалы, грубо говоря, это соло. Самым популярным был интервал в унисон, т. е. повторение той же самой ноты, поэтому он был исключён.

Интервалы в +- 2 полутона более популярны, чем +-1, в остальном спад идёт почти равномерно. Интересно отметить, что соло приблизительно равномерно двигаются как вверх по частоте, так и вниз, явно выраженных отличий не наблюдается. 

Гармоническими называют музыкальны интервалы, которые играются одновременно. Мы можем называть их аккордами. Я рассматривал только интервалы из двух нот, т. к. интервалы из нескольких нот образуют более сложные комбинации.

Из-за особенностей подсчёта мы имеем большинство значений, смещенных в отрицательные числа, так как значение формировалось простой разницей между двумя последовательными нотами в аккорде из двух нот. Наиболее популярный интервал соответствует квинте, это самый распространённый аккорд в рок-музыке.

Данный график рассматривает частоту использования различных музыкальных инструментов. Значения представлены цифрами, соответствующими формату General MIDI, чтобы видеть последовательность, в противном случае они были бы упорядочены по убыванию.  

Безусловный лидер – это перегруженная гитара, следует за ней обычное пианино, и следующая – это бас-гитара, почти на уровне с palm-mute гитарой (приглушенные струны), чуть отстаёт от них акустическая гитара.  

Важно отметить, что в данном графике номера октав не совпадают с их музыкальными названиями, и необходимо сделать смещение на -1, тогда значения будут совпадать.  

Ноты в стандартном строе начинаются с большой, пик приходится на 5-ю струну выше 3-ого лада, а также на 4-ю струну целиком, и меньше чем на половину третьей струны.  

Значения представлены цифрами, для того чтобы сохранить последовательность на графике. Музыкальные длительности 2/1, 1/1, 1/2, 1/4, 1/8, 1/16, 1/32 соответствуют значениям 0, 1, 2, 3, 4, 5, 6. 

Самая популярная длительность – это одна четвертая. Следом за ней одна шестнадцатая и за ней одна вторая.   

Среди пауз наиболее популярна одна вторая, следом одна четвертая и одна шестнадцатая.  

Громкости представлены числовыми значениями, которые соответствуют динамическим оттенкам ppp, pp, p, mp, mf, f, ff, fff. Т. е. начиная от самого тихого и заканчивая самым громким. Самыми популярными оказались наиболее громкие ноты.

Гитарные лады и приёмы

Гитарный лад – это позиция на струне, где можно её зажать. Как ни прискорбно, самым популярным являлся нулевой лад, с огромным отрывом, потому он был исключен из графика. Наибольшей популярностью пользуются 2, 3, 5, 7 лады. За исключением второго. Это лады, которые отмечены точками на грифе. 

Ниже приведена статистика по каждой струне отдельно: 

Наибольшей популярностью обладают эффект глушения струн и, по сути, противоположный ему, когда струны остаются звучать после извлечения (чаще всего используется при «переборе» струн). Следом идёт приём легато, когда новый звук извлекается из гитары с использованием только левой руки, без удара правой или медиатором. По сравнению с этими приёмами число остальных незначительно.  

Статистика по каждой струне отдельно: 

Количественные характеристики

Cамая популярная продолжительность составляет порядка 3,5 (или трёх с половиной) минут. Распределение очень близко к нормальному, однако в области коротких продолжительностей наблюдается скачок. Объяснение этому очень простое: некоторые записи достаточно короткие, содержат не полное произведение, а только популярную его часть, а также некоторые песни имеют короткую продолжительность. 

Встречаются табулатуры длиной больше 10 минут, однако иногда это компиляции альбомов, т. е. сразу несколько композиций в одной табулатуре. 

Самое популярное число дорожек/инструментов равно 4. Вероятнее всего, самым распространённым набором являются 2 гитары, бас и ударные. При этом табулатуры, в которых используется лишь один инструмент, более популярны, чем те, в которых более 7 инструментов. 

Наиболее частое значение составляет приблизительно 100 тактов и неравномерно спадает. При этом пиковые значения находятся на числах, кратных 8: 24, 16, 8. Полагаю, это табулатуры, где записана одна единственная партия длиной в один или несколько рифов. 

Максимально часто встречаются такты с одой единственной нотой. Вероятно, это включает в себя такты, которые являются паузами. Следующие пики находятся в области 8 и 16 нот, что, видимо, соответствует полностью заполненному такту размера 4/4, где каждая нота имеет длительность 1/8 или 1/16 соответственно.

Наиболее частое количество равно 1, под эту характеристику попадает любое соло, большинство басовых партий и некоторые рифы ритм гитары. Значение, равное 0, соответствует паузам. Количества, равные 2, 3, 4 и далее, аналогичны аккордам, в которые вовлечено соответствующее число струн.

Размеры тактов

Безусловным лидером является 4, поэтому данное число было исключено из графика. На это много причин, во-первых, этот размер является размером по умолчанию, во-вторых, наиболее простая и предсказуемая музыка находится в размере 4/4.  

Схожая ситуация с числителем, потому значение, равное 4, исключено. После этого с большим отрывом следует 8, и остальные варианты сильно уступают ему.  

Лидером является пропорция 1/1, по тем же причинам, что указаны выше. За ней шло значение 3/4, без удаления этих значений рассматривать график было тяжело. Следующими лидирующими размерами являются 6/4 и 2/4. 

Мой самый любимый график: здесь мы видим интересное распределение, наиболее популярным темпом является 120 ударов в минуту, что неудивительно. Это темп, установленный по умолчанию в табулатурных редакторах и большинстве DAW. Но интересно, как располагаются значения вокруг – наиболее крупные пики идут с шагом в 20 ударов в минуту, между которыми расположены пики с шагом в 10 ударов в минуту, между ними расположены пики с шагом в 5 ударов в минуту. И эти последние пики имеют распределение, похожее на нормальное.  

Заключение

Код, использовавшийся для получения статистики, является частью кодовой базы моего opensource музыкального редактора, который находится в ранней стадии разработки: ссылка на Gihub.

Ссылка на архив csv файлов.

Спасибо большое всем за уделённое внимание! 

Мне важно ваше мнение

Наша команда разрабатывает приложение для анализа психоэмоционального состояния человека по голосу, нам очень важно ваше мнение. Мы будем благодарны, если вы пройдёте анкету из 10 вопросов!

Для тех кто запишется на пред-регистрацию мы обещаем скромный, но пожизненный бонус! :)




Комментарии (29):

  1. Fafhrd
    /#24467310 / +2

    1. Стандартный строй у обычной электрухи начинается не со 2й, а с большой октавы. Цифра 2 в Е2 это порядковый номер в этом варианте записи, но не название. е4 -- первая октава.

    2. Считать пропорции в размерах не стоит. 2/2 и 4/4 это разные размеры, как и 3/4 и 6/8. Так же как две триоли отличаются от одной секстоли, несмотря на одинаковую длительность нот.

    • constcut
      /#24467338

      Спасибо большое за комментарий!

      Я случайно оставил новый комментарий, вместо ответа на Ваш.

  2. constcut
    /#24467334

    Спасибо, исправил!

    Понимаю Вас в вопросе о пропорциях. Однако это был метод, в котором мне удалось достичь приемлемой визуализации.

    Выбранный мной метод не даёт полной информации, но всё же позволяет получить какое-то представление, хоть и не полноценное, с точки зрения музыкальной теории.

    • Fafhrd
      /#24469034

      Интервалы в +- 2 полутона более популярны, чем +-1,

      Вот это можно и без статистики понять, достаточно знать как у устроены мажорные и минорные гаммы =)

      Мажор: тон-тон-полутон-тон-тон-тон-полутон
      Минор: тон-полутон-тон-тон-полутон-тон-тон

      Т.е. не может быть такого, чтобы полутонов было больше, если это не упоротый композитор-любитель атональщины.

      • constcut
        /#24469624

        Однако, интервалы в полутон популярней почти всех других, не считая интервала в 2 полутона)

        Я если честно ожидал что они будут чуть более редкие)

  3. panzerfaust
    /#24467522

    Я могу еще представить мелодический интервал на 40+ полутонов. Послушать бы песню, где это "звучит". Но гармонический интервал на 40+ полутонов? Зажать 2 пальцами одной руки интервал больше 3 октав на шестиструнке с квартовым строем?

    • Ogra
      /#24467690 / +2

      Да легко! Открытая шестая и первая на 16+ ладу. Не знаю нафига, но можно :)

  4. Refridgerator
    /#24467536 / +2

    Не понял, у вас гитары 7-струнные что ли? Анализ гармонических последовательностей был бы чуть более ценным, чем очевидные пики там, где они и должны быть. И могу поспорить, в вашей выборке не было ни джазовых, ни классических произведений — потому как в табы их никто не перекладывает.

    • constcut
      /#24468256

      Данная статистика пришла из анализа 120 тысяч файлов guitar pro, у меня был реализован код для 3\4\5 версий, и там было возможно задать максимум 7 струн. Некоторые композиции их использовали, но подавляющее большинство были 6 струнными.

      Если бы я реализовал последний формат gpx - то можно было бы даже встретить 8 струнные композиции, но поскольку для моих целей этой потребности не было нужно, пришлось довольствоваться тем что есть)

  5. Ogra
    /#24467682 / +9

    Куча бесполезной информации.

    И одновременно не хватает совершенно базовых музыкальных метрик. Мажор или минор? В какой тональности? Что насчет пентатоники? Частота использования ступеней гаммы? Не хватает гитаристских метрик - разделения по 6/7 струнным гитарам в статистике частоты использования струн; гитарного строя; позиции на грифе.

    • constcut
      /#24468278

      Я пытался оценивать гаммы, но в большинстве случаев на протяжении одной дорожки происходит множество модуляций.

      Я рассчитывал гаммы следующим образом - считал словарь из 12 нот, игнорируя октавы, и по наиболее частой ноте определял тонику, а по структуре словаря гамму. И в результате у меня почти всегда получались гаммы с модуляцией, чистых было очень мало, по сравнению с общим количеством.

      Можно было бы считать каждый такт, но такая информация тоже была бы не самой однозначной.

      Если у вас есть предложение как исправить мой алгоритм, если вы видите в нём ошибку - я буду очень благодарен, перепишу его и включу такую статистику в статью!

      Но после короткого общения с профессиональными музыкантами - мы не нашли ошибок в моём подходе.

      Позже я напишу вторую часть статьи, где постараюсь исследовать музыкальные структуры внутри каждого такта. Какие существуют ритмические паттерны, их популярность. Какие существуют мелодические последовательности и их популярность.

      Это, конечно, не совсем то что Вы хотели бы увидеть, но возможно такая информация окажется для Вас более интересной.

      • Ogra
        /#24468326

        Множество модуляций на одной дорожке в большинстве случаев? Не верю :) что-то надо делать с алгоритмом.

        • constcut
          /#24468642

          Отлично понимаю скептицизм!)

          Возможно это было вызвано тем, что часто не все ноты гаммы используются. Я использовал натуральные лады и пентатоники как трафарет, для определения тональности.

          И часто бывали случаи когда это либо модуляция пентатоник (что возможно соответствовало бы какой-то гамме с пропущенной 1 нотой), либо модуляция диатоник.

          Наиболее вероятно я буду писать вторую часть статьи, где приведу статистику ритмических и мелодических структур, понимание как это сделать есть ясное.

          Ещё раз погружусь в этот вопрос и постараюсь достичь результата тем, или иным способом)

          P.S. Если у Вас есть идеи о том, какую ещё информацию можно собрать, пожалуйста поделитесь ими. Если я достаточно быстро смогу написать алгоритм, я включу эти данные в следующую статью!

  6. rator
    /#24468280 / +1

    Такая статистика мало о чем говорит. Куда как интереснее посмотреть, как данные изменялись со временем.

    • constcut
      /#24468284

      Во многом согласен с Вами.

      Мне самому очень хотелось бы увидеть разделение по жанрам, по годам и так далее. Проблема в том что когда я парсил базу этих табулатур - я делал это для одной единственной цели, отладить движок чтения\записи табулатур.

      Но потом подумал, что можно извлечь из этого дополнительную информацию - и из этого родилась эта статья.

  7. NIMARS
    /#24468282 / +2

    Интересное исследование, неплохо бы такое по другим популярным инструментам, благо табы много для чего есть.

    Да и в целом интересно почитать о разных сферах нашей жизни такие статистические исследования, а если с заключениями от известных людей в этих сферах, то вообще красота.

    • constcut
      /#24468320

      Спасибо большое за тёплый отзыв!

      Я думал ещё о такой возможности: провести много мини исследований по отдельным музыкантам\группам. На трекерах есть базы меньшего объёма чем моя, но систематизированные.

      Но пока что откладываю это, т.к. там будет много кропотливой работы, которую следует автоматизировать.

  8. OlegIva
    /#24468816 / +2

    Значения представлены в числовом варианте, так как иначе график был бы упорядочен непоследовательно. Последовательность нот: до, до#, ре, ре#, ми, фа, фа#, соль, соль#, ля, ля#, си.  

    Вот это, простите, ужас на уровне голосовых сообщений в общем чате. Ведь можно же взять итоговые данные, сделать в том же Excel диаграмму с нормальными подписями за 30 секунд своего времени, но неееееет, пусть каждый читатель вкуривает в дополнительный абзац, потом соотносит его с диаграммой, переделывает за автора эту диаграмму в уме... За что?! Потому что автор не умеет или поленился в нормальную подпись?

    Извините, пригорело. Не хочу я такого продолжения, лучше просто табы покажите.

    • constcut
      /#24468862

      Спасибо за обратную связь!

      Я преследовал цель сделать интерактивные графики.

      Вторая причина почему я использовал именно числовые значения, это иметь последовательность значений, т.к. если бы значения были прописаны названиями нот, они бы были не упорядочены в интерактивных графиках. Схожая проблема была с размерами тактов.

      Если Вам не сложно потратить 30 секунд своего времени, и сделать визуализацию - помогите мне пожалуйста. Я включу её в статью. Все csv файлы находятся в публичном доступе.

      И да, Вы правы, я никогда в жизни не занимался визуализацией в Excel. Только matplotlib и отрисовка кодом вручную. Но я отказался от этих вариантов в пользу интерактивности.

      По поводу следующей статьи, она должна раскрывать совсем другие закономерности. В частности описать ритмические структуры\паттерны, которые наиболее часто используют музыканты. И таким же образом мелодические последовательности.

      Но я, конечно же, ни в коем случае не призываю Вас читать следующую статью. Я поступлю так, как проголосует большинство читателей.

      • san-smith
        /#24469814 / +1

        Внесу свои пять копеек.
        Вы везде используете линейный график, хотя в некоторых местах он выглядит откровенно плохо. Например, в графике «Частота использования струн» логичнее бы смотрелась гистограмма — так и нагляднее, и нет сбивающих с толку подписей вроде «2.5», «3.5».

        Ещё один момент: много однотипных графиков. У инструмента, который вы используете, есть интересные решения для этих случаев. Например, для раздела «Частота эффектов на N-й струне» неплохо бы смотрелся Stacked column cart, при этом статья бы сократилась до более комфортного размера.

        А в остальном — пишите ещё, получается любопытно:)

        • constcut
          /#24469974

          Спасибо большое за комментарий, он очень полезен!

          К сожалению сейчас немного в стороне от возможности исправить графики, но постараюсь завтра до этого добраться! :)

        • constcut
          /#24470820

          Что-то пошло не так c Stacked column cart)

          Я в итоге использовал Stacked bars и оставил только топ, т.к. иначе выходило ещё объёмней чем прежде:

      • OlegIva
        /#24469960 / +1

        Вы просто не приготовили график, а засунули CSV в визуализатор как есть.

        Вот тот же интерактивный график, но подписанный обозначениями нот (там же можете скачать код для встраивания в статью): https://app.datawrapper.de/chart/IALZH/publish

        Что я сделал:

        1. Отсортировал значения по порядку.

        2. Вставил вместо порядковых номеров обозначения нот (можно и их названия, как вам удобнее).

        3. Уже подготовленный файлик залил в Datawrapper.de

        У меня получился такой CSV для графика выше (я для наглядности и первый столбец переименовал):

        note,count
        C,40229947
        C#,26635175
        D,37318164
        D#,24736194
        E,37913528
        F,24470399
        F#,29895084
        G,32854172
        G#,24382415
        A,39763831
        A#,25645568
        H,41764477

        То есть это не сложно, надо просто разобраться с инструментом. Спасибо, что навели на его, кстати.

        P.S. Даже Excel не потребовался. Я был неправ, каюсь.

        • constcut
          /#24469970

          Спасибо огромное за проделанную работу!

          Ссылка к сожалению не открывается, потому что говорит что это не мой график, может быть там есть какие-то настройки приватности.

          Как хорошо что есть такое замечательное место как Хабр, где можно делиться опытом и мнением :) Мне кажется это лучший ресурс всея интернета!

          • OlegIva
            /#24470244

            А это теперь я наступил на грабли с инструментом :)
            Он, оказывается, не так-то прост в деле, зарегистрировал меня только с пятой попытки и выдал таки рабочую ссылку.

        • constcut
          /#24470136 / +2

          Исправил оба графика с нотами!

          Ещё раз хочу поблагодарить за содействие :)

          • OlegIva
            /#24470248 / +1

            Спасибо за открытость и готовность сделать статью лучше =)

  9. RigelNM
    /#24470218

    В каком жанре была выборка? Очень удивлен что самая популярная не шестая открытая струна.

    Вообще наверное было бы интереснее посмотреть различие в статистике для разных жанров, либо для разных поколений (изменение трендов во времени) музыки.

    • constcut
      /#24470846

      Здесь смешены все возможные жанры, т.е. я не делал никакого разделения.

      Я абсолютно с Вами согласен, я был бы очень рад получить отдельную статистику по разным жанрам, разным годам. К сожалению моя база не содержит названий исполнителей, если только они не указаны в самой табулатуре. 

      Я думаю о том, что возможно я соберу менее масштабную статистику, но по жанрам\исполнителям. Т.к. на трекерах можно найти базы данных табулатур по исполнителям, но они в несколько раз меньше чем данная база.