Закрыто

Переводим видео и аудио в текст. Транскрибация на автомате!

Тема в разделе "Бизнес и свое дело", создана пользователем guloc, 27 дек 2019.

Цена: 241300р.
Взнос: 4000р.
89%

Основной список: 73 участников

Статус обсуждения:
Комментирование ограничено.
  1. 27 дек 2019
    #1
    guloc
    guloc ЧКЧлен клуба (А)

    Складчина: Переводим видео и аудио в текст. Транскрибация на автомате!

    Всем привет, под новый год решил выложить складчину которую уже многие ждут! Перевод аудио и видео файлов в текст. Вы сможете создавать огромное количество уникального текста практически на автомате. Эта программа также незаменимый инструмент для транскрибирования текста.

    [​IMG]

    На складчике огромное количество курсов которые вы сможете перевести в текст и получить большое количество уникального контента, для своих сайтов, соц сетей или для создания своих курсов и инструкций.

    В программе есть три сервиса с помощью которых вы сможете преобразовать аудио и видео файлы в текст.

    Для начала вы должны понимать что в любом случае, текст придётся смотреть самому и вносить правки если они будут нужны, так как многое зависит от качества голоса диктора и нет ли в записи посторонних шумов типа музыки.

    Скажу сразу на программу большие планы, и я буду работать над её развитием и дальше.

    Перевод русского языка через Яндекс

    Для наглядности экономии давайте посмотрим сколько вам нужно денег чтобы купить текст на 1000 символов. Обычно это где-то стоит от 40 рублей. И это всего лишь 1000 символов, а теперь представьте сколько нужно программе чтобы перевести целый час аудио в текст!

    Программе для этого нужно всего лишь 36 рублей, вдумайтесь какая экономия денег. За 36 рублей примерно выходит 30 - 50 тыс. символов текста это за 1 час аудио.

    Для того чтобы перевести 10 минут видео в текст, нужно времени около 1 минуты, не нужно включать видео и ждать, пока оно полностью не проиграет, как это предлагают бесплатные сервисы. Экономьте своё время.

    Перевод через IBM

    Здесь можно перевести текст на 17 языков, Русского языка тут пока нет. Качество перевода очень хорошее. Я думаю вам не надо рассказывать сколько стоят статьи на английском и других зарубежных языках. На складчике большое количество курсов на английском языке, с них вы сможете сделать транскрибацию.

    IBM даёт бесплатно переводить 500 минут в месяц, за остальное придётся платить.

    Третий сервис

    Третий сервис не хочу разглашать по некоторым причинам. Он бесплатен, переводит очень хорошо, в некоторых местах даже лучше чем остальные. Он идёт больше как дополнение. Дело в том, что загрузку туда пока нужно делать в ручную (можно от туда получать уже готовые данные других пользователей если они не скрыты их там миллионы, то есть можно и не закачивать, своё а использовать чужие, думаю некоторые люди поняли уже что за сервис, прошу не разглашать его), возможно к концу складчины будет уже на автомате. Но не факт. Он бесспорно вам понравится) В бонусе есть допы к нему.

    Обработка текста

    Когда вы просили, чтобы я сделал данную программу, я говорил, что орфографию ни один сервис проставить не может, на что мне сказали, что даже без орфографии программа будет очень нужна. Но я решил сделать хорошее дополнение для правки орфографии. Как вы поняли, не один сервис не расставляет пунктуацию в тексте, а выдаёт только текст без знаков препинания. В программе реализованы функции которые помогут расставить знаки препинания и заменять слова на ваши.

    Возможности обработки текста:

    1. Простановка знаков препинания такие как запятые, вопросительные знаки, восклицательные, кавычки (правила можно самим изменять и дополнять)
    2. Простановка точек, пока что ни один сервис не может поставить точки в тексте, так как нельзя понять где именно нужно их поставить. Программа может проставлять их в рандоме и делать следующую букву заглавной. Правила рандома можете выставить сами или отключить его.
    3. Замена слов, вы можете заменить слова и афоризмы на ваши
    4. Вставка сео ключей, они ставятся в рандоме перед точками (последовательность можно указать в настройках)
    5. Вставка сео заголовков, они ставятся в рандоме после определённой точки (можно указать в настройках)
    6. Разбивка текста по абзацам, чтобы текст был не одной простынёй, а разбит по абзацам для удобства чтения.

    Программа обрабатывает файлы пакетно, это значит, что вы закинули например какой то видео курс в папку и он переведёт всё видео в текстовый файл, у каждого видео файла будет свой текстовый файл с названием как у видео и всё будет закинуто в отдельную папку.

    Что планируется сделать в ближайшие 2-3 месяца:

    Планируется добавить сервис гугл
    Правку орфографии через Яндекс спеллер
    Добавление пунктуации в английский язык (сейчас вы можете это сделать сами, программа это позволяет)
    Запись текста через микрофон

    Для того чтобы понять качество текста вы можете использовать демо сайты

    Yandex SpeechKit (выбрать распознавание речи) Скрытая ссылка
    Распознавание через IBM (скорость через программу в разы выше) Скрытая ссылка

    Софт полностью самописный Zennoposter не нужен.
    Работает в системе windows.

     
    Последнее редактирование модератором: 3 мар 2020
    17 пользователям это понравилось.
  2. Последние события

    1. stasya969
      stasya969 не участвует.
      18 апр 2020
    2. skladchik.com
      Trampampammm не участвует.
      22 мар 2020
    3. skladchik.com
      Aquadiva7 не участвует.
      22 мар 2020
    4. skladchik.com
      saneksalo не участвует.
      22 мар 2020

    Последние важные события

    1. skladchik.com
      Складчина закрыта.
      21 мар 2020
    2. skladchik.com
      Складчина доступна.
      4 мар 2020
    3. skladchik.com
      Складчина активна.
      4 мар 2020
    4. skladchik.com
      Сбор взносов начинается 04.03.2020.
      2 мар 2020
  3. Отзывы участников

    5/5,
    • 5/5,
      Работой организатора доволен
      Удобная программа! Сэкономит уйму времени на переводе аудио/видео в текст.

      Не все тексты переводит хорошо, но это зависит не от программы, а от других 2 факторов: 1) самого сервиса распознавания: Яндекс, IBM, Google 2) от качества и типа самой аудиозаписи.

      Заранее скажу - музыку сервисы распознают не очень. А вот аудиокниги и инфовидео вполне пригодно.

      Если чуть подкрутить файл "замены запятых", который идет в настройках программы и обработать текст вручную после перевода прогой, то получается очень достойный контент.

      Особо хочу отметить поддержку автора. В специальной ветке он оперативно отвечает всем участникам.

      В моем случае ну прям очень сильно помог. У меня было кучу ошибок при запуске - оказалось проблема в компе. Автор везде подсказывал и помогал, в итоге все заработало - программа запустилась!

      За это автору отдельная благодарность, очень отзывчивый человек!
      11 мар 2020
      19 пользователям это понравилось.
    • 5/5,
      Работой организатора доволен
      Программа крута! Думаю, это мое лучшее приобретение на сайте. Радует поддержка автора. Наверное, есть, что совершенствовать, но, на мой взгляд, нужна только точность транскрибации, а это уже от самой программы не зависит. Да, текст надо вычитывать, но процесс облегчается очень сильно. Думаю, стоимость программы отобьется довольно быстро.
      10 мар 2020
      22 пользователям это понравилось.
  4. Обсуждение
  5. 27 дек 2019
    #2
    guloc
    guloc ЧКЧлен клуба (А)
    Апдейт на 20.01 Добавлен сервис Гугл а также правка текста через яндекс спеллер.
    Апдейт 29.01 добавлена автоматическая простановка пунктуации на английском. (Замены делались профессиональным переводчиком, не бесплатно конечно)
    Апдейт на 10.02 Добавлен перевод голоса в текст через микрофон и отправки готового файла в сервисы обработки, добавлена пакетная обработка вашего текста через фильтра программы.


    Складчина скорее всего запустится в марте, админы не дают запустить раньше 13 февраля, а 18 я уезжаю в отпуск.
    Если там будет доступен интернет то постараюсь запустить раньше.
    До начала складчины также будут вестись работы по усовершенстванию программы, так что на выходе вы получите намного больше функций чем заявлено.

    Также будет доступна функция обработка вашего готового текста, через фильтра программы.
     
    Последнее редактирование модератором: 1 мар 2020
    5 пользователям это понравилось.
  6. 27 дек 2019
    #3
    Interprete
    Interprete МодерМодератор Команда форума
    Готов проверить, если будет работать с английским.
     
    4 пользователям это понравилось.
  7. 27 дек 2019
    #4
    Subconsciou
    Subconsciou ОргОрганизатор (А)
    Готов взять на проверку, работаю как никто другой с очень специфичным текстами и предыдущая программа автора не справляется с ними отчасти :D
    Понятное дело, что ждать уровня человеческой транскрибации здесь не стоит, но оценю адекватно со своего профессионального уровня ;)
     
    4 пользователям это понравилось.
  8. 27 дек 2019
    #5
    oswald
    oswald ОргОрганизатор
    Готов проверить
     
  9. 27 дек 2019
    #6
    Сильвиус
    Сильвиус ЧКЧлен клуба
    Готов проверить
     
  10. 27 дек 2019
    #7
    evgeshik
    evgeshik ЧКЧлен клуба
    Сделай, пожалуйста, пример: с какого ролика и какой на выходе получается текст! Спасибо
     
    1 человеку нравится это.
  11. 27 дек 2019
    #8
    VladimR
    VladimR ЧКЧлен клуба (А)
    Есть зеннопостер, но не могу определиться по бонусу - чем хорош тот или тот вариант. Где больше свободы использования? Там привязка к компу а там к АйДи зенки?... Что еще?
     
  12. 27 дек 2019
    #9
    guloc
    guloc ЧКЧлен клуба (А)
    Где зенки нет там привязок нет никаких. На шаблонах тоже без привязок открытый шаблон
     
    2 пользователям это понравилось.
  13. 28 дек 2019
    #10
    blogeonix
    blogeonix ЧКЧлен клуба
    Когда сборы планируются? А то многовато было до НГ материалов, хочется небольшой передышки :).
     
  14. 28 дек 2019
    #11
    guloc
    guloc ЧКЧлен клуба (А)
    Конец января начало февраля.
     
    3 пользователям это понравилось.
  15. 28 дек 2019
    #12
    analytic
    analytic ОргОрганизатор (А)
    я для английского использую Dragon NaturallySpeaking....если есть возможность сравнить у проверяющих качество = то будет очень круто.
     
    1 человеку нравится это.
  16. 28 дек 2019
    #13
    guloc
    guloc ЧКЧлен клуба (А)
    Ну цены конечно у них зверские) на ibm можешь закинуть аудио и через софт тот и можешь посмотреть, разницу.
     
    1 человеку нравится это.
  17. 28 дек 2019
    #14
    analytic
    analytic ОргОрганизатор (А)
    У меня лицензия = досталось от одной организации года 4 назад. Рекомендуете сравнивать с ibm? Надо будет попробовать=) Спасибо
     
  18. 29 дек 2019
    #15
    reywal
    reywal ЧКЧлен клуба
    @guloc
    Вопрос об озвучке транскрибированного текста из видео после перевода.
    При переводе субтитров меняется длина слов и озвучка на новом языке идет несинхронно видео. Это выглядит ужасно если озвучивать просто текст без редактуры пауз между предложениями.
    Планируете ли вы реализовать озвучку с паузами на основе таймметок из файле субтитров (srt)? Т.е. озвучивать не просто txt файлы а файлы с таймингом
    Это ОЧЕНЬ важно для качественной озвучки переводного контента..
     
  19. 29 дек 2019
    #16
    reywal
    reywal ЧКЧлен клуба
    Это конечно относится не строго к данному проекту по транскрибации, больше к вашим темам озвучки, но все взаимосвязано)
     
  20. 29 дек 2019
    #17
    Astronavt
    Astronavt ЧКЧлен клуба
    доступны для транскрибации только русский язык? Или другие тоже? в частности меня польский интересует
     
  21. 29 дек 2019
    #18
    evgeshik
    evgeshik ЧКЧлен клуба
    @guloc ответь на просьбу выше по поводу примеров
     
  22. 30 дек 2019
    #19
    guloc
    guloc ЧКЧлен клуба (А)
    Да меня уже просили такое сделать. Текст озвучивает отлично, другое дело когда ты эти субтитры закидываешь в видео. Буду думать как это сделать, если есть сервисы для создания такой озвучки напиши я такого не видел. Самому будет трудно такое сделать, но я попробую.
    Польского нет, но доступны 18 языков вроде как, когда гугл сделаю будет доступно в 2 раза больше.
     
    4 пользователям это понравилось.
  23. 30 дек 2019
    #20
    guloc
    guloc ЧКЧлен клуба (А)
    Сделаю как приеду из отпуска уехал до 9 января.
     
    2 пользователям это понравилось.
Статус обсуждения:
Комментирование ограничено.