В современном мире информационных и цифровых технологий появляется необходимость в автоматизации и оптимизации различных процессов в компаниях.
Возрастает потребность и спрос на такие процессы, как запись и расшифровка телефонных звонков, совещаний, конференций, заседаний, визитов к врачу и др. А поскольку в них участвуют несколько говорящих, это затрудняет предоставление точных данных и проведение качественного анализа аудиозаписей.
Для этого требуется уровень технологии, известный как диаризация. Это технический процесс обработки речи, в котором требуется идентифицировать говорящего. Технология основана на разделении потока аудиозаписи и позволяет определить, кто из дикторов говорит в каждый момент времени.