Нередко в процессе учёбы или работы незрячие пользователи сталкиваются с информацией в недоступном или в неудобном формате. Например: ещё недавно, чтобы сделать читаемым для скринридера скан учебника или какого-либо документа в формате pdf, приходилось использовать на компьютере ресурсоёмкую и дорогостоящую программу Abbyy FineReader. Теперь эту и другие задачи по конвертации файлов решает бесплатный онлайн-сервис «Данные в данные». 

О проекте

Около двух лет назад незрячий веб-разработчик из Санкт-Петербурга Артём Плаксин с коллегами Данилом Пылаевым и Бекой Гозалишвили создал сервис «Данные в данные». В настоящее время этот сервис предлагает три вида конвертации файлов, востребованных людьми с нарушением зрения: 

  • Изображения в текст; 
  • Текст в речь; 
  • FB2 в TXT. 

Важная особенность сервиса «Данные в данные» заключается в том, что не требуется ничего устанавливать на ваш компьютер. Взаимодействие с сервисом происходит через браузер, а вся работа выполняется на сервере. Причём максимальный объём загружаемых файлов: 10 ГБ. Сайт полностью доступен для незрячих пользователей. 

Как пользоваться?

  • Прежде всего, стоит пройти простую регистрацию на сайте. Она нужна для того, чтобы не вводить email всякий раз, когда надо загрузить файл на сайт и получить результат конвертации. Также в учётной записи будет доступна история запросов (какие файлы когда преобразованы, готов ли результат к скачиванию).
  • Выбираем задачу: изображения в текст; текст в речь или FB2 в TXT.
  • Указываем желаемые параметры и загружаем файл, который надо преобразовать. 
  • После завершения процесса конвертации получаем по электронной почте ссылку на готовый файл. Результаты конвертации доступны для скачивания по ссылке в течение недели. 

Для каждой задачи, безусловно, параметры свои.

Преобразование изображения в текст

Документы в формате PDF доступны незрячим пользователям только при наличии текстового слоя. К сожалению, документ в формате pdf — это зачастую просто снимок: визуально текст есть, для видящих пользователей этого достаточно, чтобы прочитать информацию, а вот для скринридеров это лишь изображение. Незрячему человеку текст с него не прочитать без оптического распознавания, как и с фотографии текста, например, в формате JPG. Здесь поможет конвертация изображения в текст. 

  • Можно выбрать язык документа. По умолчанию выставлен русский, но, если документ двуязычный, например, сборник упражнений по английскому языку, где задания на русском, а тексты упражнений на английском, выбирайте в качестве второго языка английский. 
  • Далее можно выбрать формат готового файла, качество распознавания (быстрое или наилучшее).

Важно учитывать, что результат распознавания зависит от исходного качества изображения. 

Также, преобразование изображения в текст позволяет распознать файл DJVU. 

Конвертируем текст в речь

Файлы FB2 или TXT можно преобразовать в аудиофайлы, где текст будет начитан синтезатором речи. Это даст возможность прослушать текст даже в самом простом плеере. 

  • Нужно выбрать предпочитаемый голосовой движок (RH Voice или Espeak) и голос, которым будет озвучен текст. Лаборатория RHVoice Lab во главе с Артёмом Плаксиным уже разработала более десяти голосов для синтезатора RHVoice. Есть голоса для русского, английского, татарского, украинского и других языков. Чаще всего, пользователи выбирают голос «Александр» или «Павел». 
  • Если текст двуязычный, можно выбрать различающиеся варианты синтезатора речи для первого и для второго языка. 
  • Далее выбираем высоту, скорость и громкость синтезатора речи.
  • Теперь определяем формат готового файла: MP3 или OGG.
  • Осталось указать: нужно ли разделять наш текст на фрагменты или хотим получить его одним аудиофайлом. Причём если исходный файл формата FB2, то можно разделить аудиозапись на файлы по главам. 

Конвертация FB2 в TXT

Электронную книгу в формате FB2 можно открыть только в специальных приложениях, которые не всегда удобны незрячим пользователям и такой программы просто может не оказаться на вашем устройстве, а книгу нужно прочитать. Для этого, например, можно преобразовать книгу в файл TXT, с его открытием точно проблем не возникнет. 

Примечательно, что сервис «Данные в данные» сохраняет внутреннюю структуру папок в архиве. Если мы загружаем книжную подборку, в которой все книги рассортированы по авторам/сериям/жанрам, то на выходе получим архив с точно такой же структурой, только вместо FB2 будут файлы TXT. А совсем недавно на сайте в тестовом режиме появилась возможность конвертации FB2 в HTML.

Статистика

За неполные два года работы сервиса «Данные в данные» уже выполнено:

  • Преобразование текста в речь: 1934 задачи.
  • Преобразование изображения в текст: 1261 задача.
  • Преобразование FB2 в TXT: 387 задач.

Ссылка на сайт «Данные в данные».

Благодарим Вас за внимание! Пожалуйста, поделитесь с друзьями в соцсетях.