Например: id - 11180 - идентификатор трека в базе duration - PT2M40S - продолжительность, 2 минуты 40 секунд title - Még néhány perc - название composers - Horváth Jenő; Rákosi János - композиторы performers - Körmendi együttes; Ádám Anna; Németh Lehel - исполнители
А у меня вопрос к коллективному бессознательному. Уже связывались с Тамашем Деаком, с венгерскими ГТРФ - а кто-нибудь когда-нибудь пытался найти самую что ни на есть Анну Адам? Погуглил, но ни даты рождения, ни биографии - ничего. Кроме указаний на порядка 10 произведений. Просто, например, по какой-нибудь условной Майе Кристалинской информации полно. А по Анне Адам пусто.
На правах душнилы: точно определить наличие Анны Адам в "Урне" можно только спектральным анализом вокализа. Без него - это не "точно", а "весьма вероятно" 🤷🏻♂️
Ну, зато может быть заинтересуют кого-то ещё. И он задастся вопросом, почему совпадают вступления. Передаст кому-то третьему, а он может знать, как называется такой приём. Как ранее с последовательностью нот в "Жандармах" и "Шотландии". Как бы то ни было, информация лишней не будет.
2vns27: >зачем нам ваши ноты Потому что если у такой последовательности нот есть определённое название... Ну я не знаю, по аналогии как гамма - это ноты подряд друг за другом, может, это какая-нибудь "восточноевропейская гамма", "пятая последовательность Моцарта", "гармонический ряд Мусоргского", "ложная каденция". Не знаю, не силён в музыке. ...так вот, если у неё есть название, то можно было бы обратиться в сообщество любителей [этой самой последовательности] и узнать у них, в каких произведениях каких исполнителей она чаще всего встречается.
Как бы "почерк" автора. У Пушкина - глагольные рифмы, у Лермонтова - "кровь-любовь" в каждом объёмном произведении. У Шекспира с Волошиным - сонеты.
Пока Нупогодист стал бизнесменом, вброшу свою безумную теорию я.
Вот у нас три произведения. Scotland the Brave Marche des Gendarmes И наша знакомая
У "Шотландии" и "Жандармов" в начале присутствует некая закономерность: 11 нот, две длинные, две короткие с возрастанием, три короткие с возрастанием, две длинные (ровно как первые), короткая, более длинная. "Урна" несколько отличается, но "отголоски" этой закономерности ощущаются.
Вопрос к разбирающимся: может быть, у таких последовательностей нот есть какое-то специальное название?
2Aaxskfg: >Да? Серьёзно? Коты тоже на нашей стороне 😜
2Imil: >Очень надеюсь на архив Норильского телецентра Кстати, в каком он сейчас состоянии? Упустил из виду в этой теме и последнее что помню - он где-то застрял на пароходе. И всех с наступающим! Всем мира
>на прошлой неделе мне удалось сконтактировать >с редактором музыкального архива венгерского радио >и ТВ (www.mtva.hu)
О, поздравляю! Мне они в своё время отвечали, что поиски по архиву то платные, то занимают слишком много времени, а у них много другой работы.
Как их редактор вообще - не занудствует, идёт на контакт? Есть ли возможность уточнить у него насчёт существования гипотетических остальных месяцев в дополнение к Marcius, Aprilis, Szeptember от Petho Zsolt и December от [предположительно] Erwin Jereb?
Может быть, в эстонском архиве имеет смысл выделить уникальные композиции и проверить только их - потому что куча повторов. Интересно, существуют ли подобные архивы в других восточноевропейских странах… Насчёт Венгрии - понятно (существует, но платный).
>Ага. Только сначала нужно сам Питон установить ;-) Нууууу... да, но всё, что он делает - скачивает то, что и так уже лежит рядом. Так что танцы с бубном по сути и не нужны.
>А можно какой-нибудь из этих файлов скачать отдельно? (не скачивая все эти 20 гигов) Может быть, при импорте этих файлов в Excel, там всего лишь нужно установить правильную кодовую страницу? Да, всё можно скачать по отдельности. В эксель импортировать можно (Данные -> Из текста -> С разделителями, кодировка 65001 UTF-8 -> Знак табуляции -> Текстовый для всех полей), но легче скопиро... ...стоп, чего я в самом деле. Вот, готовый эксельник со всем необходимым:
>Кстати, файлы hasMP3.csv и noMP3.csv – изначально с сайта, или их уже твой скрипт создаёт? А, там другой скрипт был, который просто ходил и собирал ссылки. Получается, с сайта, но агрегированное.
Всего там, как ранее говорил waldek, 1206 передач. Но только у 875 есть возможность скачать запись в mp3. 331 можно только прослушать. Списки в файлах hasMP3.csv и noMP3.csv соответственно (это простые текстовые файлы в кодировке UTF-8 с разделителем Tab между столбцами). Файл full.csv - то же самое всё вместе.
Файлы pages.txt, url_list.txt, mp3_list1.txt - mp3_list5.txt и скрипт trashbin3.py использовались для скачивания архива, но можно не обращать на них внимания, потому что скачанный архив и так уже есть рядом) Кому интересно, скрипт запускается так: python trashbin3.py -i <путь к одному из mp3_listN.txt> -o <в какую папку качать> -t <количество потоков>
Самое, наверное, интересное: song_list.csv. Названия компзиций, которые были в каждой передаче. Увы, такие были не во всех. Также по времени попробовал посчитать длину, но так как между композициями иногда говорит диктор, результаты не всегда надёжны. Ещё один минус - очень много повторов. Если заметили что-то интересное, рядом ссылка на передачу.
Файлы csv - текстовые. При открытии экселем наверняка будут кракозябры. При необходимости можно открыть блокнотом и скопировать в эксель Ctrl+A, Ctrl+C, Ctrl+V.
>"Для общего доступа" они есть на самом сайте ;-) Ситуация достаточно шаткая: сегодня есть - завтра нет 🤷🏻♂️ Тут придерживаюсь позиции хранить всё нужное локально. В общем, себе точно скачаю, а там буду смотреть, асилю ли автоматический поиск.
А. Написал почти во сне, поэтому так сумбурно X) Поясню. Скрипт для скачивания всех передач - допишу и выложу с подробной инструкцией. Тут больше проблема в том, куда залить 40 гигов для удобного доступа.
Что там по ссылке со скобками - даже пока подробно не смотрел; просто привёл в качестве иллюстрации к задаче поиска записи внутри более длинной записи. Нууу мало ли, вдруг тут есть программисты, которые занимались подобным и скажут: "Ооо!"
Написал тут скрипт, который может автоматически скачать всё из их архива. Почему-то подумал, что передач всего 100 (одна страница), а не 1206. Скрипт в любом случае может всё выкачать - и было бы полезно это куда-нибудь сложить для обработки (порядка 40 гигов). Кто-нибудь знает подходящий обменник или фтп? Или, может, лучше будет скрипт допилить и выложить?
Вручную это прослушать, мягко говоря, проблематично… Но существует такая известная задача "Sound Event Detection", цель которой - определить наличие образца в потоке аудио (https://github.com/topics/sound-event-detection)
1. Свист и общее звучание какое-то характерное для "Ну погодей". Кто знает наизусть все искомые мелодии - послушайте, пожалуйста. Вдруг это что-то из неопознанного. 2. Какой статус у Норильского архива? Может, там удастся найти недостающие месяцы? 3. Некий пласт культуры под названием "Music for ironing". Возможно, со своими коллекционерами и ценителями. Тут, на форуме, не упоминался. Вероятный вектор поиска?.. Я скачал с ресурса выше всё, что относится к Венгрии, но пока не нашёл ничего интересного. Но я ещё не слушал полуторачасовые конпеляции.
>Так что архив это >единственный реальный выход. Если Урна не найдётся >там, она не найдётся нигде и никогда.
У меня ещё была идея насчёт барахолок и блошиных рынков, где торгуют пластинками. Как раз упоминание о пластинке на Дзене и подтолкнуло. Например, Измайловский, куда мы с нашим всеобщим другом собирались наведаться (но пока так и не добрались - весной, может, сходим).