О чем поют русские рэперы
Есть мнение, что русский рэп — это набор нецензурных выражений.
Однако большинство слов в рэперских песнях — приличные слова русского языка. Мы взяли композиции из шести популярных плейлистов с рэпом на «Яндекс-музыке», разобрали их на слова, сравнили с частностью слов в русском языке в принципе и узнали, о чем рэперы поют чаще всего.
Что и как мы считали
«Яндекс-музыка» регулярно формирует рейтинг самых популярных песен в разных жанрах: рэп, рок, поп. Мы взяли шесть плейлистов с музыкой в таком стиле — «Русский рэп: открытия», «Новые хиты русского рэпа», «100 хитов русского рэпа», «Вечные хиты русского рэпа», «Пацанский плейлист», «Русский бит» — и изучили, какие слова чаще всего используют российские рэперы. У некоторых новинок тексты песен еще не выложены в открытый доступ, поэтому их не учитывали. В итоге получилось 309 композиций.
Чтобы определить частоту слов, сначала мы адаптировали тексты для анализа — разбили их на отдельные слова, которые привели к начальной форме: глаголы — к неопределенной, то есть инфинитиву; существительные — к именительному падежу единственного числа; прилагательные — к именительному падежу мужского рода. Иными словами, песни стали похожи на набор слов.
Например, первая строчка из песни «Это любовь» Скриптонита — «Я опять на районе потерял себя в одном из дворов» — после адаптации стала выглядеть так: «я, опять, на, район, потерять, себя, в, один, из, двор».
Предварительно мы очистили текст от:
- Знаков препинания и «мусора», например звукоподражаний «ха-ха-ха» и «а-а-а-а-а-а», в том числе и так называемых эдлибов — уоу, yeah и так далее.
- Слов на иностранном языке. Самое популярное из них — baby, которое в разных вариациях, таких как babe, бэби, бэйба, бейба, встречается в 23 треках.
- Нецензурной брани. Популярнее всего однокоренные «по**й» и «на **й», которые выражают пренебрежение или безразличие и встречаются в 22 и 21 тексте соответственно, а также междометие «б**» — его пришлось убирать из 18 песен.
- Жаргонизмов. Самое частое такое слово — «бабки», оно встречается в 25 треках. «Бабло», «кэш», «хоуми» и «бро» — по 10 раз. Слова «бабки» и «кеш» есть в словарях, например в словаре Российской академии наук. Но в частотном словаре русского языка, с которым мы работали, их нет.
- Повторяющихся слов. Например, в уже упоминавшейся песне «Это любовь» Скриптонита существительное «любовь» встречается пять раз, в песне «Лейла» рэперского дуэта Jah Khalib и Makvin имя героини произносят 97 раз. В каждом из этих случаев мы засчитывали только одно из слов.
В итоге осталось около пяти тысяч уникальных слов.
Среди главных «значащих» частей речи, то есть существительных, прилагательных и глаголов, рэперы чаще всего используют слова вроде «быть», «знать», «день» и «большой». Но они и так часто встречаются в русском языке. Поэтому мы сравнили частоту использования слов в рэпе и в обычном русском языке — она приведена в Новом частотном словаре русской лексики. Для дальнейшего анализа отобрали только те слова, что встречаются в рэпе чаще: в десять и более раз — для существительных, в пять и более — для прилагательных и глаголов.
Какие слова встречаются чаще всего
Глаголы. «Любить» — самый частотный рэперский глагол, который встречается в 30,1% песен.
На втором месте — глагол «есть», в рэпе он используется в 25,2% треков. Правда, у этого слова два разных значения — и как часто каждое из них употребляется в рэпе и русском языке, мы не знаем.
На третьем и четвертом местах — «забыть» и «верить»: 18,5 и 13,9% песен соответственно. «Забыть» и «забывать» считаются разными словами, так как это разные виды глагола — совершенный и несовершенный.
Прилагательные. Типичное рэперское прилагательное — «пьяный», его можно встретить в 5,2% песен.
Второе место — у прилагательного «дикий»: оно есть в 3,9% песен, от лица рэперов его слышно в 6,3 раза чаще, чем в обычной жизни.
Третье место делят прилагательные «тупой» и «должный»: они встречаются в 3,6% текстов. При этом у слова «тупой» рекордная разница в частоте употребления между рэпом и русским языком: в 17,3 раза.
Существительные. Самое популярное существительное в рэпе — «пацан», оно встречается в 19,4% песен и в 80,8 раз чаще, чем в русском языке вообще. На втором месте — «сука»: 17,5% песен. На третьем — «дым», на четвертом — «слеза»: 12,9 и 12,3% соответственно.
Самые частые персонажи в рэпе — подруга, детка, брат и его производные: братик, братишка, браток, братан, братуля, братец.
Самые типичные рэперские песни
Мы взяли топ самых частотных слов каждой части речи и посмотрели, в каких песнях они встречаются. Из результатов мы сделали рейтинг самых «типичных» рэперских песен.
Песня с самым высоким содержанием «рэперских» слов — I Got Love Miyagi, Эндшпиля и Рема Дигги. Если посмотреть на список этих слов, можно в общих чертах понять, о чем речь. Всего их 14: «печаль», «дым», «детка», «клуб», «летать», «падать», «есть», «устать», «двигаться», «курить», «улетать», «танцевать», «забрать», «верить».
Также к типичным рэперским песням относятся «Было и было» Смоки Мо и «Осень» Басты и Andro, где по девять частотных слов, «55555» Glebasta Spal — восемь слов.