Новости

Word трансформирует речь в текст. Начало новой эпохи

Word стал умнее

Корпорация Microsoft интегрировала в текстовый редактор Word функцию «расшифровки» (транскрибирования) аудиозаписей – Transcribe. Приложение научилось переводить записи диалогов в текст с возможностью его последующего редактирования. Над нововведением специалисты Microsoft работали несколько лет – впервые оно было анонсировано еще в 2019 г., но в доступную обычным потребителям версию Word ее добавили только сейчас.

Для запуска функции необходимо нажать кнопку «Диктовать» (Dictate) в строке меню, а затем в выпадающем списке нужно выбрать пункт «Транскрибировать» (Transcribe).

На момент публикации материала нововведение было доступно в веб-версии Word для пользователей сервиса Microsoft 365 (раньше он назывался Office 365). Microsoft реализовала поддержку только английского языка, но это ограничение временное – специалисты работают над внедрением других языков, хотя и не раскрывают конкретные сроки. Также до конца 2020 г. Transcribe появится в мобильной версии Word.

Чему научился Word

Word умеет преобразовывать речь в текст «на лету» – для этого в нем предусмотрена возможность записи разговора. Также можно загружать в него уже готовые записи, но пока только в форматах wav, mp3, m4a и mp4. В этом случае на преобразование может потребоваться несколько минут, в зависимости от размера загружаемого файла и длительности самой беседы.

word601.jpg

С новой функцией Word больше не нужно использовать сторонние приложения для распознавания речи

Функция распознавания текста Transcribe основана на облачных технологиях Microsoft и использует алгоритмы искусственного интеллекта. Результат ее деятельности можно сохранять в отдельном документе Word или копировать в уже имеющиеся. Также система умеет распознавать голоса нескольких собеседников и помечать их, но пока это работает только для двух человек.

Итоговый текст диалога может содержать ошибки, и Word позволяет устранить их вручную. Например, если кликнуть на ту или иную часть текста, приложение автоматически воспроизведет соответствующий фрагмент записи, притом сможет сделать это с замедленной скоростью.

Gif-transcription-with-audio-upload.gif

Microsoft постаралась максимально упростить работу с инструментом транскрибирования

Использовать новую «фишку» Microsoft можно будет, к примеру, если потребуется вставить текст точную цитату из интервью, записанного на диктофон. Также она может упростить процесс дословной записи речи или, к примеру, лекции в вузе.

Без ограничений не обошлось

По состоянию на 26 августа функция Transcribe в веб-версии Word работала далеко не на полную мощность. Помимо того, что она распознает лишь английскую речь, она также не может обработать файл весом более 200 МБ, если речь идет о загружаемых пользователями записях.

Пример работы Word Transcribe

Однако самое серьезное ограничение связано с длительностью распознаваемых диалогов, что пока исключает Transcribe из списка инструментов тех, кто профессионально занимается переводом (транскрибирования) аудиозаписей разговоров в текст. Word может расшифровать не более пяти (5) часов диалогов, притом в месяц.

Обойти это ограничение пока никак нельзя. Даже нет возможности купить дополнительные часы за деньги, как и научить Word работать с файлами весом свыше 200 МБ.

Развитие имеющихся возможностей

Инструмент Transcribe стал дополнением к функции Dictate, которую можно обнаружить в том же выпадающем списке. Она была добавлена в состав Microsoft 365 еще в июне 2017 г. и была создана в рамках экспериментальной программы Microsoft Garage, поощряющей сотрудников Microsoft работать над проектами, которые им интересны, даже если они не связаны с их основной деятельностью.

Название Dictate полностью отражает суть функции – с ее помощью пользователь может надиктовывать записи в Word, а также в OneNote, PowerPoint и Outlook. После диктовки речь транскрибируется в текст, который в дальнейшем можно редактировать. На момент запуска Dictate, в отличие от Transcribe, поддерживал 20 наиболее распространенных языков и имел возможность перевода текста на 60 языков, притом в реальном времени.

Word трансформирует речь в текст. Начало новой эпохи
27 Августа 2020
Word трансформирует речь в текст. Начало новой эпохи

В веб-версии редактора Word из состава Microsoft 365 появился инструмент транскрибирования речи в текст. Поддерживаются как монологи, так и диалоги с указанием числа участников беседы. Word может переводить произнесенные слова в текст «на...

Подробнее
Как соцобъекты автоматизируют!
27 Августа 2020
Как соцобъекты автоматизируют!
«Ростелеком» получит из федерального бюджета 2,7 млрд руб. на проведение каналов связи до объектов РТРС. На этих объектах планируется размещать базовые станции стандарта LTE, к которым будут подключаться органы власти, школы, фельдшерско-акушерские...
Подробнее
Акция OKI на принтер С612n - скидка 27%
24 Марта 2020
Акция OKI на принтер С612n - скидка 27%
Компания OKI объявляет о специальном предложении на цветной принтер формата А4 С612n. Период действия предложения — с 23.03.2020 по 20.05.2020 года. Специальная цена на принтер со скидкой 27%  - ВСЕГО 18 958 руб ( вместо 25 970 руб)!
...
Подробнее

г. Воронеж, 394019, ул. 9 Января, 180 / 9 Yanvarya str., 180, 394019

info@dakor-group.ru +7 (473) 212-00-14

Группа компаний ДАКОР © 2003 - 2016