Что в имени? Анализ данных названий 5820 игр в Steam +17


«Что в имени»? Больше, чем можно подумать. Если вы уже давно работаете над своей игрой или находитесь на этапах планирования, то в какой-то момент вам всё равно придётся выбирать ей название. Названия видеоигр могут стимулировать воображение и вызывать ностальгические воспоминания.

В Steam ежегодно выпускается больше шести тысяч игр, но какая их часть вызывает интерес игроков? Давайте рассмотрим исследование, в котором мы изучили названия игр, выпущенных в прошлом году.

Почему названия важны?


Прежде чем переходить к цифрам, давайте вкратце обсудим то, почему название видеоигры — это очень важно. Хотя оно может казаться незначительной частью общих ощущений от игры, на самом деле название является ключом, особенно когда дело доходит до маркетинга. В бешеном мире цифрового маркетинга название, рекламный слоган и одно-два изображения могут оказаться единственным, что увидит потенциальный покупатель.

В магазине Steam название и небольшая картинка — это всё, чем может привлечь к себе игра. На ранних этапах цифрового маркетинга существовало гораздо меньшее количество выпущенных игр. Увеличившийся вал выпускаемых игр с уменьшившимся маркетинговым пространством делают название важным, как никогда.

Кроме того, следует рассмотреть множество других аспектов. Маркетинг «сарафанного радио», места в поисковых движках, возможность перепутать игру с другими и многое другое — вот причины, по которым стоит вложить дополнительные усилия, чтобы обеспечить названию игры «защиту от дурака».

Ну а теперь перейдём к данным.

Весь объём статистики


Для сбора статистики мы проанализировали 5 820 игр, выпущенных в прошлом году (без учёта free-to-play). Мы рассматривали только уникальные игры, выпущенные как отдельные продукты, поэтому из набора данных были исключены DLC и прочие расширения. После графиков следует краткое описание данных и методов.

Длина названия


Для 5 820 проанализированных игр средняя длина названия равна 17,15 со стандартным отклонением 10,26. То есть в целом, длина названий игр, выпущенных в прошлом году, находилась в пределах от 7 до 27 символов, не считая выбросов.

Среднее название состояло из 2,8 слов с отклонением 1,7, что даёт общий интервал от 1 до 5 слов.

Это демонстрирует общую тенденцию к более лаконичным названиям, что позволяет нам выбрать один из вариантов: следовать тенденции или намеренно избегать её. У обоих подходов при текущем состоянии рынка есть свои преимущества, и их нужно тщательно проанализировать при выборе собственного названия.

Кроме интервалов длины в символах и словах, многие из проанализированных игр демонстрируют похожие структуры наименования. С самых первых этапов анализа было меньше двух дюжин структур названий, в которые попадал больше 90% игр. Примечательно, что самыми распространёнными структурами названий были "{существительное} of {существительное}" и "{существительное}: {прилагательное} {существительное}" (например, «West of Loathing» и «Divinity: Original Sin 2»).


Названия из нескольких частей


15,14% игр из всего набора данных имели название из нескольких частей. При анализе название считалось состоящим из нескольких частей, когда в нём присутствовал один из следующих символов: ":", "-" и "|", который при этом создавал два отдельных фрагмента информации. Например, «Yooka-Laylee» не считается состоящим из нескольких частей, а «Steel Division: Normandy 44» считается.

Использование уникальных слов


Один из самых важных аспектов собранных данных заключался в использовании «уникальных слов» в названии игры. В целях анализа слово считается уникальным, если оно не существует как словарное определение в десяти наиболее популярных языках, используемых игроками Steam. В целом, уникальное слово в названии содержали 27,93% игр.


Отсылки к другой интеллектуальной собственности


Обыскав наш набор данных на предмет отсылок к другой интеллектуальной собственности (Intellectual Properties, IP), мы получили новое подмножество, требующее дальнейшего анализа. 11,96% игр в наборе данных в той или иной степени ссылались на уже существующую IP (предыдущую игру, фильм, книгу или другие медиа).

Если использовать это подмножество для дальнейших исследований, чтобы найти взаимосвязи между сиквелами игр, играми на основе фильмов и книг, то можно создать собственный интересный проект, если кому-то это будет интересно.

Оцениваем лучших


Давайте посмотрим, как эти игры соотносятся с бестселлерами. Взяв верхние 10% игр и сравнив их с общим набором данных, мы сможем создать чёткую картинку того, что важно в названиях видеоигр.

Сравнение длин названий


Лучшие по продажам 10% игр, выпущенные в прошлом году, имеют среднюю длину названия 17,63 символов. По сравнению с 17,15 общего набора данных, можно сказать, что у бестселлеров в среднем немного более длинные названия.

Вычисление среднего длин названий в словах показывает похожие результаты. Названия лучших игр состоят в среднем из 2,92 слов, (2,8 слова в полном наборе данных). Этого достаточно, чтобы показать, что лучшие игры склонны к большей многословности.

Названия из нескольких частей


19,17% игр из лучших по продажам 10% имеют названия из нескольких частей (15,14% в полном наборе данных). Разница в этих двух значениях. показывает, что может быть выгоднее использовать более длинные названия. Возможно, так происходит из-за более оптимального использования ограниченного пространства, в котором разработчики могут привлечь потенциальных игроков.

Использование уникальных слов


Что касается использования уникальных слов, то бестселлеры отличаются разительно! В 48,19% названий используется хотя бы одно уникальное слово (в общем массиве данных таких игр всего 27,93%). Это огромная разница в данных; она предполагает, что использование уникальных слов делает игру более запоминающейся, или с большей вероятностью привлекает возможного покупателя.

Отсылки к другой интеллектуальной собственности


Лучшие по продажам игры содержали отсылки к другим видеоиграм, фильмам и книгам в 20,73% случаев — почти в два раза больше, чем показатель всего набора данных (11,96%). Это демонстрирует чёткую тенденцию к тому, что расширения существующих игр обычно показывают себя лучше, или, по крайней мере, имеют больший шанс на успех.


Наборы данных, источники и техники анализа


Использованный в этой статье массив данных полностью получен через SteamSpy и официальный Steam Web API. Если вы хотите провести собственные исследования или попробовать другие алгоритмы, то лучше всего начинать с этих источников.

При считывании данных учитывайте, что ограничения наборов данных и методов анализа могут оставлять пробелы, которые способны влиять на результаты. Например, существуют неустранимые проблемы, такие, как влияние бесплатной раздачи игр на данные продаж и игры с продажами, близкими к статистической погрешности.

Хотя эти данные всё равно полезны, такие проблемы тяжело контролировать.

Интерпретация данных: что всё это значит?


Мы обработали множество данных, но что они значат конкретно для вас? Вот самые чёткие из обнаруженных нами тенденций:

Составляйте названия из 1-5 слов


Большинство игр находятся в этом интервале, а показавшие наилучшие результаты попадают в интервал 3-4 слов. Постарайтесь внимательно подбирать слова и делайте как можно более подробное описание в этом ограниченном пространстве. Если вы уже нашли идеальное название, и оно немного короче (1 слово) или немного длиннее (6-8 слов), то не волнуйтесь — небольшие вариации — это неплохо.

Названия из нескольких частей привлекают больший интерес


Игроки обычно предпочитают названия из нескольких частей. Скорее всего, причина заключается в том, что они позволяют передать больше информации в ограниченном пространстве. Хорошим планом будет использование названия из нескольких частей, вызывающее дополнительные эмоции или содержащее описание.

Название должно быть уникальным и интересным


Названия с несловарными словами с большей вероятностью имеют хорошие результаты, поэтому нечто уникальное в названии позволяет ему выделиться из списка стандартных названий.

Сиквелы и франшизы продаются лучше


Если основать игру на уже существующей работе, то вы получите больший шанс на успех. Причина этого, скорее всего, заключается в том, что игроки знакомы с предыдущей IP. Но это и хорошая новость для инди-разработчиков, которые хотят превратить один проект в серию игр.

Дальнейшие исследования для любителей данных


Хотите поднять исследования на новый уровень? Вот два способа, которыми можно расширить выполненный анализ и получить более глубокие результаты.

Разбейте подмножества IP


Мы немного обсудили процент игр, ссылающихся на уже существующую интеллектуальную собственность, но это подмножество само по себе может содержать интересные данных. Сколько игр ссылается на предыдущие игры? Фильмы? Книги? Ещё одной интересной линией исследований может быть сравнение результатов разных игр в серии. Например, были ли четвёртые игры так же успешны, как и третьи?

А как насчёт самых плохих игр?


Мы сравнили лучше 10% игр с общим массивом данных, но как насчёт худших 10%? Сегментирование этой части данных может привести к интересным новым открытиям, особенно в том, каких названий стоит избегать.

Вы можете помочь и перевести немного средств на развитие сайта



Комментарии (11):

  1. SamsonovAnton
    /#10638408

    Показавшие наилучшие результаты попадают в интервал 3-4 слов. Названия из нескольких частей привлекают больший интерес, игроки обычно предпочитают названия из нескольких частей.
    Ну да, конечно: ArmA, Blood, Civilization, Crysis, Diablo, Doom, Dune, Elite, Halo, Hexen, Quake, StarCraft, Unreal, Warcraft, Witcher, Wolfenstein — всё это проекты-неудачники. (Впрочем, справедливости ради надо заметить, что большинство из названных мною игр сравнительно старые, а в статье анализируются интересы «поколения Steam».)

    Правда, есть вопрос, считать ли названия типа Battlefield, BioShock, DayZ, Half-Life, Minecraft, SimCity и Vietcong за одно слово или два, но так ведь и из статьи тоже не понятно, в какую категорию отнесли их авторы исследования.

    • anador
      /#10638476

      А как же полные названия релизов указанных вами игр? Многие приведённые в качестве примера игры являются серийным, и конкретно ваши названия нельзя распространить на всю серию, игры в ней( в том числе и гораздо популярнее первых частей) будут иметь более продолжительные названия

      • SamsonovAnton
        /#10638546

        Судя по описанным в разделе «Названия из нескольких частей» правилам парсинга (мутным чуть менее чем полностью), составными названиями не считаются не только многокоренные слова типа Battlefield, SimCity и даже Half-Life, но и, видимо, содержащие порядковый номер, потому что число сложно считать «отдельным фрагментом информации», если только это не год события (Battlefield 1942 против Battlefield 2142 — это совсем не то же самое, что Battlefield 2 против Battlefield 3) или что-то в том же духе, то есть несущее в себе хоть какую-то характеристику игрового сюжета, а не просто счётчик версий.

        Другое дело, если после номера части ещё идёт какой-нибудь подзаголовок — например, StarCraft II: Wings of Liberty. Но и тут есть не всё так однозначно, потому что такой подзаголовок может не оседать в сознании людей: я без подглядывания в Википедию даже не помнил, что у StarCraft II он был, и тем более какой он был; то же самое могу сказать про Warcraft III: Reign of Chaos — для меня это просто Warcraft III. И наоборот, любой геймер знает, что StarCraft и StarCraft: Broodwar — это разные вещи, хоть и построены на одном поколении движка (ладно, хоть с этим в статье ясно: авторы не считали дополнения как отдельные продукты).

        Вот ещё несколько спорных названий: Far Cry некоторыми воспринимается как одно слово, а SimCity и Vietcong — как два, несмотря на официальное написание, Unreal Tournament — просто новая версия Unreal (как бы Unreal 1.5), хоть и была издана как отдельный продукт, а не дополнение.

        В общем, повторюсь, методика классификации описана из рук вон плохо, а ведь на таких тонкостях и строится всё последующее исследование и далеко идущие выводы.

    • Stinkynnov
      /#10638544

      в статье анализируются интересы «поколения Steam»

      В статье анализируются игры, которые есть в Steam и выпущены в течении прошлого года. Ни одна из указанных сюда просто не попадает.

      Еще хочется таки заметить что:
      1. Многие из этих игр, выпускались при куда меньшей конкуренции, а часть так просто родоначальники своих жанров.
      2. Официально часть из них называются не так («ArmA: Armed Assault», «Sid Meier's Civilization», «Warcraft: Orcs & Humans»), а для части настоящую славу серии принесли сиквелы («The Witcher 3: Wild Hunt», «Quake III Arena»)

      • SamsonovAnton
        /#10638556

        Sid Meier's Civilization, Warcraft: Orcs & Humans, Quake III Arena
        Вот именно про это я и говорю: формально, каждое название состоит из 2–3 частей (а что там напарсилось машиной, вообще не понятно), однако фактически у покупателя в могзу они откладываются как одно слово — Civilization, Warcraft, Quake III.

        Про первую часть Армы тоже всё интересно: многие игроки уверены, что Armed Assault — это просто приписка-расшифровка слова ArmA, несмотря на непрекращающиеся попытки объяснить, что это не так.

        • juray
          /#10638816

          эээ, а что тогда за слово такое — ArmA, если не акроним? В «обычных словах» заглавная буква может быть только первая.

          Ок, попробуем поискать, что за «попытки обяснить». В блоге разработчиков нашлось следующее:

          «Popular belief is that ArmA is simply an acronym of Armed Assault. It's in fact true as that is how the name really started with the release of Arma: Armed Assault in Europe. »
          ARMA 2 — The Name Tale

          Да, начиная со второй армы, таки стали писать как обычное слово — Arma, и «попытки объяснить» относятся как раз ко второй части:
          "...release of ARMA 2 (...) it's a good time to clarify some things about the name and also explain why using Armed Assault 2 is wrong..."
          (там же)

          И еще некий набор фактов:

          Первая арма в Стиме теперь тоже пишется не ArmA, а ARMA — но картинка-то осталась старая:
          image
          правда, тут все буквы заглавные, а первая и последняя выделяются размером — но воспринимается это всё равно так же как если бы средние буквы были строчные. (кстати, такое написание логотипа осталось и во второй и в третьей части).

          Ну и в Bohemia Interactive Community Wiki тоже пишется ArmA.

      • PatientZero
        /#10638562

        Да, всё верно. Стоит ещё заметить следующее:

        а) хитовой всё-таки была не Dune, Dune II: The Building of a Dynasty;
        б) полное название первой Halo — это Halo: Combat Evolved;
        в) полное название Hexen — это Hexen: Beyond Heretic;
        г) ни одна из частей серии Wolfenstein (кроме игры 2009 года) не имела название Wolfenstein (хит id Software назывался Wolfenstein 3D).

        • SamsonovAnton
          /#10638572

          Dune II: The Building of a Dynasty, Halo: Combat Evolved, Hexen: Beyond Heretic, Wolfenstein 3D
          Опять же, кто помнит эти подзаголовки (ну хорошо, я тоже помню) или, точнее, считает их неотъемлемой частью названия? В мозгу откладывается только Dune II, Halo, Hexen и Wolfenstein — именно так и не иначе, пусть на коробке с диском написано хоть «World of Warships III: Привет морякам-героям Балтики от доблестных моряков Севастополя».

          Хитовой всё-таки была не Dune, а Dune II: The Building of a Dynasty
          А многие всё равно, говоря Dune, имеют в виду именно Dune II, как и в случае с Wolfenstein 3D.

          • qw1
            /#10639098

            Опять же, кто помнит эти подзаголовки
            Так исследуется вопрос о продаваемости игр. Когда игрок отыграл 100 часов, он для себя может уже и сокращённо называть (Witcher, Dune), на продаваемости это не отражается — игра уже продана. Но когда игра вообще незнакома, перед покупкой игрок видит в маркете полное название и решение купить принимает по нему.

  2. keydon2
    /#10639024

    Странно что вы решили перевести эту посредственную статью.
    Я не специалист по анализу данных, но результаты мне итак очевидны, а причины автором похоже не рассматривались.
    Не знаю как принято в статьях по этой сфере, но я считаю признаком профессионализма указывать хотя бы под спойлер как получались данные и как они считались, а по возможности и сами данные выложить на файлообменник для повторяемости. Возможно даже готовая инструкция по получению данных со стимспая и их анализу была бы даже полезнее самой статьи(хотя я уверен это дело пары часов для специалиста). Кроме того можно было бы понять по запросом были ли у автора ошибки и исправить их.
    Без этого сама статья очень расплывчата. Не удивлюсь, если в 2,8 слов бестселлеров используются предлоги. Выводы по уникальности без выбросов тоже не сделаешь. Интересна интерпретация про несколько частей, но тут тоже довольно смутное разбиение. По франшизам было бы интереснее понять на основе чего их популярность больше и хотелось бы увидеть не только название, а смену разработчика, разницу лет между выпусками с коррекцией на общие тенденции, сравнение пар оригинал-сиквел по успешности, а также корреляцию с инди и корпорациями(они склонны как рекламировать во все щели, так и выпускать\покупать франшизы, скорее всего успешность франшиз не потому что они основаны на предыдущих играх, а потому что корпорации их рекламируют и не любят рисковать созданием новых сеттингов).

  3. TheShock
    /#10639050

    Среднее название состояло из 2,8 слов с отклонением 1,7, что даёт общий интервал от 1 до 5 слов. Это демонстрирует общую тенденцию к более лаконичным названиям, что позволяет нам выбрать один из вариантов: следовать тенденции или намеренно избегать её.

    «Согласно статистики большинство названий содержит в себе от 1 до 5 слов, вы тоже можете назвать свою игру названием из 1-5 слов, или назвать игру названием с 6 и больше словами.»

    Это просто необходимо послать в палату мер и весов как стандартную единицу воды в статье.