Данные собраны из примерно 1000 часов чтения английской речи с частотой 16 кГц. Данные получены из прочитанных аудиокниг из проекта LibriVox и были тщательно сегментированы и выровнены.
Получить более подробную информацию о проекте, а также скачать набор данных можно по ссылке.