Преступность в США и России: сравнительный обзор +113


Мотивация и цель исследования

Цель исследования — на основе анализа открытых статистических данных сравнить ситуацию с преступностью в США и России и попытаться понять:

  • какие преступления количественно преобладают;

  • как изменяется преступность по годам;

  • каков уровень преступности в удельном выражении (на 1 млн. населения);

  • как указанные параметры распределяются территориально — по штатам США и регионам России.

Источники данных

Для анализа используются только открытые официальные данные:

  1. Количество совершенных преступлений по основным преступлениям (убийство, грабёж, нападение при отягчающих обстоятельствах, изнасилование):

    • США: Crime Data Explorer (FBI)

    • Россия: Количество преступлений, зарегистрированных в отчетном периоде: ЕМИСС (данные Генпрокураторы РФ)

  2. Население по регионам России: ЕМИСС (данные Росстата)

Дисклеймер

Зная, как многие любят поспекулировать на тему надежности исходных данных (если не откапывают изъяны в самом анализе), не грех сразу же расставить точки над "ё".

???? Вы наверняка "подшаманили" данные как вам нужно...

???? Все данные были взяты как есть и не подвергались модификации; над ними лишь производятся статистические вычисления. Это вы можете легко проверить, самостоятельно скачав данные по приведенным ссылкам и сравнив их с теми, которые используются мной.

???? Да разве можно доверять нашей статистике? В нашем "THE GULAG" нарисуют что угодно!

???? А каким тогда данным следует доверять? "Независимым" расследованиям "честных" СМИ? ???? Или данным ютуберов / тиктокеров / умных инстаграммеров? ????

???? Да и ФБР что угодно расскажут, чтобы свой зад прикрыть! Это же ИМПЕРИЯ ЛЖИ!

???? / ????

Поскольку данные по преступлениям в России доступны (в указанном источнике) только с 2008 г., то датасет по США также взят за аналогичный период: с 2008 по 2020 г. включительно.

Для использования в Python данные были предварительно сохранены в CSV файлы.

???? Все исходные файлы и Jupyter-ноутбук проекта можно скачать ⚡по ссылке⚡.

Используемые инструменты

Я традиционно использую для анализа Python (у меня версия 3.10) с установленными пакетами:

  • для работы с данными: pandas, numpy

  • для создания карт: folium, geopandas, branca

  • для графиков: matplotlib, seaborn

Работаю в интерактивной оболочке Jupyter.

Всё перечисленное уже идет в комплекте с известными дистрибутивами Python. Я использую WinPython на Windows-машине.

Конечно, вам ничего не мешает проделать то же самое в R, JS, MatLAB или даже Excel. Я выбрал свое оружие :)

Подготовка данных

Итак, после загрузки всех необходимых пакетов, импорта и начальной обработки исходных данных (см. код в Jupyter) получаем следующие наборы данных:

Количество преступлений в США (первые 10 строк из 676)

year

state_abbr

state_name

population

violent_crime

homicide

robbery

aggravated_assault

property_crime

burglary

larceny

motor_vehicle_theft

rape

2008

0

0

304059724

1394461

16465

443563

843683

9774152

2228887

6586206

959059

90750

2008

AK

Alaska

686293

4475

27

645

3356

20090

3237

15225

1628

447

2008

AL

Alabama

4661900

21110

351

7346

11795

190416

50411

126539

13466

1618

2008

AR

Arkansas

2855390

14649

165

2777

10244

110360

33912

69905

6543

1463

2008

AZ

Arizona

6500180

31567

462

9809

19096

266653

58606

169460

38587

2200

2008

CA

California

36756666

185329

2142

69388

104896

1080996

237811

650656

192529

8903

2008

CO

Colorado

4939456

17480

165

3404

11760

139340

28054

97937

13349

2151

2008

CT

Connecticut

3501252

10737

132

4043

5882

87210

15107

63212

8891

680

2008

DC

District of Columbia

591833

8509

186

4430

3707

30211

3788

19958

6465

186

2008

DE

Delaware

873092

6187

57

1847

3912

31385

6783

22045

2557

371

Количество преступлений в России (первые 10 строк из 1118)

year

region

aggravated_assault

armed_robbery

extortion

homicide

larceny

misdemeanor

rape

robbery

population

2008

Алтайский край

926

315

110

377

29218

56

90

4817

2446182

2008

Амурская область

495

183

64

219

10085

21

39

1582

841579

2008

Архангельская область (без а/о)

398

330

91

199

12486

102

87

1953

0

2008

Архангельская область (с а/о)

422

334

101

216

12816

122

88

1998

1251684

2008

Астраханская область

254

265

68

118

8486

175

90

1749

1007911

2008

Белгородская область

232

121

53

98

6864

82

33

789

1523180

2008

Брянская область

334

155

29

155

10997

95

43

1000

1298797

2008

Владимирская область

353

373

50

176

14346

115

28

1910

1462340

2008

Волгоградская область

665

416

89

278

18657

166

153

3283

2620595

2008

Вологодская область

479

345

98

155

12169

257

43

2123

1216955

Как видно, оба датасета имеют сходные столбцы:

  1. year: год, для которого приведены данные

  2. state_abbr, state_name (для США) и region (для России): штат или регион

  3. population: численность населения в указанном регионе в указанный год

  4. остальные столбцы — количество соответствующих преступлений

Здесь следует отметить два момента:

  • в исходных датасетах уже есть суммарные показатели для всей страны: в датасете по США они соответствуют строкам, в которых название штата равно нулю, а в датасете по России — где в столбце region стоит "Российская Федерация";

  • столбцы в российском датасете были переименованы из источника в английские наименования преступлений в соответствии со следующей таблицей:

{'по ст.105 УК РФ (Убийство)': 'homicide', 
 'по ст.111 УК РФ (Умышленное причинение вреда здоровью)': 'aggravated assault',
 'по ст.131 УК РФ (Изнасилование)': 'rape',
 'по ст.158 УК РФ (Кража)': 'larceny',
 'по ст.161 УК РФ (Грабёж)': 'robbery',
 'по ст.162 УК РФ (Разбой)': 'armed robbery',
 'по ст.163 УК РФ (Вымогательство)': 'extortion',
 'по ст.213 УК РФ (Хулиганство)': 'misdemeanor'}

Поскольку у двух полученных наборов данных совпадают только несколько видов преступлений, для исследования мы возьмем только четыре самых "ядреных":

  • убийство (homicide)

  • нападение [с причинением вреда здоровью] (aggravated assault)

  • грабёж (robbery)

  • изнасилование (rape)

Годовые показатели по стране

Начнем обзор данных с самого очевидного — годового количества преступлений в масштабах стран (США и России).

Соответствующие полученные датасеты — в спойлерах ниже.

США

year

homicide

aggravated_assault

robbery

rape

population

homicide_permil

aggravated_assault_permil

robbery_permil

rape_permil

2008

16465

843683

443563

90750

304059724

54.150546

2774.727902

1458.802219

298.461101

2009

15399

812514

408742

89241

307006550

50.158539

2646.568941

1331.378760

290.681095

2010

14722

781844

369089

85593

309330219

47.593152

2527.538378

1193.187659

276.704294

2011

14661

752423

354772

84175

311587816

47.052546

2414.802381

1138.593943

270.148561

2012

14856

762009

355051

85141

313873685

47.331142

2427.756886

1131.190721

271.258803

2013

14319

726777

345093

113695

316497531

45.242059

2296.311752

1090.349738

359.228711

2014

14164

731089

322905

118027

318907401

44.414146

2292.480506

1012.535297

370.098027

2015

15883

764057

328109

126134

320896618

49.495691

2381.006708

1022.475718

393.067402

2016

17413

802982

332797

132414

323405935

53.842549

2482.891973

1029.038011

409.435900

2017

17294

810319

320596

135666

325147121

53.188230

2492.161079

986.002887

417.244968

2018

16374

810982

281278

143765

326687501

50.121293

2482.439633

861.000189

440.068872

2019

16669

822017

268483

143224

328329953

50.769051

2503.630852

817.723140

436.219719

2020

21570

921505

243600

126430

329484123

65.465977

2796.811548

739.337598

383.721069

Россия

year

homicide

aggravated_assault

robbery

rape

population

homicide_permil

aggravated_assault_permil

robbery_permil

rape_permil

2008

19740

45436

243957

6208

142742366

138.291108

318.307741

1709.072133

43.490942

2009

17414

43112

205379

5398

142785349

121.959291

301.935740

1438.375866

37.804999

2010

15324

39745

164547

4907

142849468

107.273763

278.229948

1151.890884

34.350845

2011

14091

38512

127772

4801

142960908

98.565406

269.388328

893.754816

33.582607

2012

13059

37091

110063

4486

143201721

91.193038

259.012250

768.587132

31.326439

2013

12151

34786

92069

4246

143506995

84.671831

242.399334

641.564545

29.587408

2014

11766

32899

77725

4163

146090613

80.539056

225.195852

532.032814

28.496013

2015

11353

30167

72739

3936

146405999

77.544637

206.050300

496.830734

26.884144

2016

10315

27442

61524

3893

146674541

70.325770

187.094501

419.459298

26.541757

2017

9616

24552

56855

3538

146842402

65.485172

167.199662

387.183805

24.093858

2018

8469

23224

50111

3374

146830576

57.678722

158.168691

341.284502

22.978865

2019

7879

21465

45815

3177

146764655

53.684588

146.254560

312.166441

21.646901

2020

7609

20019

38392

3535

146459803

51.952821

136.685968

262.133358

24.136315

США

В абсолютных показателях (количество преступлений в год * 1000) картина в этой стране выглядит следующим образом:

С большим отрывом лидирует нападение (по-видимому, без цели ограбления, т.к. ограбление — это отдельный график). Причем, видно, что после некого спада к 2013 г., количество нападений быстро возрастает. За один только 2020 год рост составил 100 тысяч случаев! Количество грабежей, напротив, падает. Что бы это могло значить? Так и напрашивается вывод о том, что жестокость становится все более бессмысленной. Развлекаются ребята, что тут скажешь ;)

Изнасилования также растут, несмотря на то, что в 2020 г. был небольшой спад. На фоне остальных преступлений убийств кажется мало, и график выглядит плоским; но если приглядеться к цифрам, видно, что и здесь есть рост: после "плато" в 15-17 тыс. убийств за 2008—2019 гг., в 2020 г. их количество резко поднялось до 22 тыс.

Давайте теперь посмотрим на удельные показатели, разделив количество преступлений на численность населения * 1 млн. Это поможет проанализировать "преступные наклонности" нации, так сказать. Имеем:

В принципе, здесь картина та же, почти "пуля в пулю", что говорит нам о независимости преступности в США от численности населения: тенденции будут сохраняться при любой численности. Интересно было бы посмотреть, как они меняются в зависимости от состава населения (по расе, возрасту и т.п.), но это как-нибудь в другой раз.

А пока посмотрим, что там делается на нашем дворе.

Россия

При взгляде на этот график сразу бросается в глаза пикирующий тренд грабежей: их количество с 2008 г. снижается нелинейно, приближаясь к некому плато (на 2020 г. падение еще продолжается). За 13 лет количество грабежей упало более чем в 6 раз. За этот же период в США грабежи сократились в 2 раза. По состоянию на 2020 г. в США грабят в 6 раз чаще, чем у нас (количество ограблений в США на 2020 год соответствует показателю в России на 2008 год).

Остальные три вида преступлений также обнаруживают тенденцию к сокращению, хотя спад здесь не такой заметный. Так, количество нападений (с причинением тяжкого вреда здоровью) сократилось в 2 раза с 2008 по 2020 г. Убийства сократились 2.5 раза — с 20 тыс. в 2008 г. до 8 тыс. в 2020 г. Изнасилования сократились почти в 2 раза — с 6 тыс. в 2008 г. до 3.5 тыс. в 2020 г.

Одним словом, боремся с данными по преступности преступностью :)

В удельных показателях выглядит так:

Подумать только: в 2008 г. почти каждый шестисотый житель России привлекался за ограбление! В целом, картина здесь аналогичная, что опять говорит о том, что в масштабах страны уровень преступности не зависит от численности населения; здесь необходим учет региональных, социально-экономических, этнических и других внешних факторов.

Сравнение показателей на конец периода (2020 г.)

Давайте теперь сравним показатели преступности по США и России на 2020 г. (конец наблюдаемого периода).

При сравнении преступности в США и России можно сделать следующие наблюдения:

  1. Как в абсолютных величинах, так и при расчете на 1 млн. населения в США преступность выше, чем в России по состоянию на 2020 г.

  2. В США уровень преступности растет (за исключением грабежей), а в России — падает.

  3. В США явным лидером из 4 анализируемых видов преступлений является нападение при отягчающих обстоятельствах (на втором месте — ограбление, на третьем — изнасилование, на четвертом — убийство). В России лидирует ограбление (хотя при продолжающемся стремительном падении ситуация может измениться); далее следуют нападение, убийство и изнасилование. Конечно, у нас нет данных о том, как квалифицируются случаи ограбления с нападением (в российских данных, конечно, есть отдельная статья — разбой, но таких данных нет по США). Но и без этого напрашивается вывод о том, что в США преобладает бессмысленное / бытовое насилие, в то время как российский условный преступник более конкретно мотивирован (наживой). Нападений при отягчающих обстоятельствах (с нанесением тяжких телесных повреждений) в США совершается в 46 (!) раз чаще, чем в России (в 20 раз при переходе к удельным показателям).

  4. Если сравнивать количество убийств и изнасилований, то в США изнасилований совершается гораздо больше, чем убийств (и рост заметнее): 126 тыс. изнасилований и 22 тыс. убийств в 2020 г. В России же картина обратная: 3.5 тыс. изнасилований и 8 тыс. убийств в 2020 г. Здесь, наверное, можно подискутировать на тему того, насколько часто в этих двух странах люди заявляют в полицию о совершенном изнасиловании (видимо, в США все же чаще). Также у нас нет информации о том, как отображаются в статистике случаи изнасилования и убийства, совершенные одним человеком в одном и том же месте и времени... Но результат все равно показателен.

  5. По убийствам США обгоняют нашу страну только начиная с 2020 г. и с минимальным отрывом. Если взглянуть на данные 2008—2010 гг., картина была обратная: убивали больше в России (как в абсолютном, так и в удельном выражении). Например, при усреднении показателей за весь период (2008—2020 гг.) в США удельное количество убийств составляет 51 на 1 млн. человек, а у нас — 85 на 1 млн. человек. Вот вам и "лихие нулевые"...

Преступность по регионам

Теперь же будет интересно посмотреть на эти данные в разрезе географического распределения по регионам каждой страны. Это может многое рассказать о глубинных причинах совершаемых преступлений.

США

Рейтинг штатов США по суммарному количеству всех 4 видов преступлений в абсолютном выражении:

То, что мы видим на этой диаграмме, подтверждает наблюдения моего предыдущего исследования, которое я позволю себе здесь процитировать:

"Голливудский" штат намного опережает по этой печальной статистике все остальные. Тройка лидеров — южные штаты (Калифорния, Техас и Флорида); именно про эти штаты снято большинство американских фильмов про бандитов.

Посмотрим на десятку лидеров по каждому виду преступлений:

Везде на пьедестале та же "троица" (хотя по грабежам штат Нью-Йорк вытеснил Флориду на 4-е место). Разница между "суперменом"-Калифорнией и Техасом везде примерно одинаковая, кроме изнасилований: здесь эти два штата соперничают на равных.

Так как без данных по численности населения мы не сможем сделать вывод о том, какие же штаты более безопасные для жизни, посмотрим и на удельные показатели:

"Внезапно" в лидеры выбились малочисленные штаты — Округ Колумбия (где столица страны Вашингтон), Аляска и не такой уж малонаселенный Нью-Мексико.

Топ по видам преступлений выглядит следующим образом:

Ну и чтобы более наглядно было, отобразим удельные показатели преступности на карте:

Аляска против объединенного Юга борются за пальму первенства
Аляска против объединенного Юга борются за пальму первенства

Итак, можно сделать следующие наблюдения по США:

  • самые преступные штаты с точки зрения количества совершаемых преступлений — самые густо населенные (кэп здесь!); это Калифорния, Техас, Флорида и Нью-Йорк

  • в показателях на душу населения с большим отрывом лидирует Округ Колумбия с г. Вашингтон (столица все-таки)

  • по 3 из 4 видов преступлений также лидируют "столичные", хотя по нападениям этот отрыв (от Аляски и Нью-Мексико) не столь заметен

  • по убийствам на втором месте неожиданно Луизиана — штат хлопка, работорговли, джаза, блюза и хм... преступности

    Из Википедии:

    In 2015, Louisiana had a higher murder rate (10.3 per 100,000) than any other state in the country for the 27th straight year. Louisiana is the only state with an annual average murder rate (13.6 per 100,000) at least twice as high as the U.S. annual average (6.6 per 100,000) during that period, according to Bureau of Justice Statistics from FBI Uniform Crime Reports.

    Wikipedia contributors. (2022, January 25). Louisiana. In Wikipedia, The Free Encyclopedia. Retrieved 00:26, January 27, 2022, from https://en.wikipedia.org/w/index.php?title=Louisiana&oldid=1067877269

  • по изнасилованиям на душу населения явным "фаворитом" выступает холодная Аляска... греются ребята ;)

Россия

Все регионы России по количеству преступлений (в абсолютном выражении):

Вот она — Москва, жемчужина нашей Родины! Как десяток других областей вместе взятых. Понимаем, что дело здесь, конечно, в численности населения... До удельных показателей дойдем, а пока топ-10 по количеству преступлений:

Москва или Московская область везде на первом месте, как видите. Особенно что касается грабежей. Вот с "серебряным призером" интереснее: по убийствам Свердловская область потеснила даже столицу, по нападениям на пятки Московской области наступают Кузбасс, Иркутская область и Свердловская область, по изнасилованиям Москву догоняет все та же "жемчужина Урала".

Ладно, что там с удельными показателями?

Ну и где бы вы теперь согласились постоять в "ролексе" в подземном переходе около полуночи? :) Тувинцы зверствуют, поморы из Архангельска тоже не хотят уступать... В Тюменской области процветают ограбления.

На карте России выглядит так:

Суровый русский север, суровая Сибирь... Кавказ меркнет.
Суровый русский север, суровая Сибирь... Кавказ меркнет.

Некоторые наблюдения по России:

  • наибольшее количество преступлений совершается в Москве и Московской области, на втором месте — Свердловская и Иркутская области

  • в удельных показателях тройка лидеров — Тюменская область, Республика Тыва и Архангельская область; в первых двух превалируют грабежи, в Тыве — высокая доля нападений и убийств

  • наиболее преступными регионами в целом являются Сибирь (Иркутская область, Тыва, Забайкалье, Хабаровский край, Кузбасс, Томская область, Тюменская область), Архангельская область и Пермский край

  • наиболее безопасными регионами, согласно официальным данным, является Кавказ (может, просто мало данных?), Центральный и Южный ФО, а также ЯНАО, ХМАО и Камчатка

Что же, наш небольшой обзор на этом завершен. Ссылка на файлы проекта выше (и вот еще раз). В будущем планирую развивать тему и делать новые публикации на Хабре.

Берегите себя в это непростое время! ????

????Поправки

По комментариям моих внимательных читателей были внесены поправки:

  • исправлена ошибка с неправильным подсчетом суммарных и удельных показателей по России; теперь численность населения и соответствующие удельные показатели по преступлениям приведены корректно (в статью выше добавлены сами таблицы данных, чтобы можно было непосредственно их увидеть)

  • исправлены мелкие опечатки (в частности, тире вместо уродливых "--" стали красивыми: "—")

Несмотря на исправление данных, все выводы и тенденциях в графиках остались без изменения: изменились только порядки величин кое-где. Это связано с тем, что в предыдущей версии некорректно завышалась не только численность населения России, но и суммарное количество преступлений, т.к. в формуле бралась сумма по всему датасету, в котором присутствует уже и вся страна, и федеральные округи, и входящие в них области / республики.

Благодарен своим читателям за комментарии и внимание!




К сожалению, не доступен сервер mySQL