Меню Закрыть

Cat инструменты что это

Содержание

Коты – животные непростые, и хотя самым продвинутым спикером среди них считается Чеширский кот, наш Васька из Лукоморья сказки говорит не хуже британца. В этом посте мы расскажем вам о том, как мы выбирали CAT (Computer-Aided Translation — систему автоматизированного перевода) для синхроподкастов, какую выбрали и почему.

Сколько ни штудируй английскую грамматику, ни зубри слова, а понимать английскую речь на слух это не поможет. Чтобы научиться ловить смысл сказанного надо слушать, слушать и еще раз слушать английскую речь. Именно поэтому в конце 2017 мы выпустили новый продукт — синхроподкасты — обучающие ролики с видео, аудио и синхронизированным текстом.

Синхронные подкасты позволяют одновременно слушать английскую речь (текст читается очень разборчиво, в медленном темпе), видеть соответствующие события на экране и читать перевод текущего фрагмента речи.

Создание синхроподкастов — процесс сложный, но благодаря тому, что материал должен отвечать привычной учебной форме (типичные тембры, четкая артикуляция, произношение, близкое к эталонному), здесь удается применять технологию автоматизированного перевода. Для тех, кто не в теме: автоматизированный перевод и машинный перевод — это не одно и то же. Термином «машинный перевод» называют действие, когда текст переводится с одного естественного языка на другой с использованием специального программного обеспечения. Автоматизированный перевод отличается тем, что весь процесс перевода осуществляется человеком, компьютер лишь помогает ему произвести готовый текст либо за меньшее время, либо с лучшим качеством.

Какие CAT-системы мы анализировали при выборе

Приступая к созданию синхроподкастов, мы, конечно, обозрели широкий арсенал систем САТ. Если вы попробуете поискать такие программы в Гугле или Яндексе, то одной из первых в списке будет CAT-система Deja Vu.

Deja Vu. Это очень простая программа, без нагромождений и лишнего функционала, разработанная испанской компанией Atril Language Engineering, специализирующейся на разработке компьютерных систем для автоматизации работы переводчиков и переводческих агентств. Но и возможностей у нее не очень много. Достоинство – занимает мало места на компьютере.

Deja Vu X может создавать проекты и работать с форматами Microsoft Word, Rich Text Format, Windows Help, Microsoft Excel, Micosoft PowerPoint, Microsoft Access, OpenOffice/StarOffice, Adobe FrameMaker MIF, Adobe InDesign, Adobe PageMaker tagged text, QuarkXPress XTG, Interleaf ASCII, HTML, ASP/ASP.NET, PHP, JavaScript, VBScript, HTML Help, SGML, XML, RC, C/C++/Java, Java properties, IBM TM untranslated segments, Trados WorkBench documents, TradosTag TTX, Trados TagEditor BIF, Trados TagEditor TMX, GNU PO и POT files и файлами в кодах ASCII.

Версия Deja Vu Х Standard рассчитана на переводчиков-фрилансеров, желающих иметь простой и удобный инструмент для работы. Позволяет создавать полноценные проекты, однако в ней отсутствуют некоторые автоматизированные функции, которые есть в версии Professional.

Целевая группа профессиональной версии — те же переводчики-фрилансеры. Но Déjà Vu Professional уже обладает такими автоматизированными функциями, как предперевод, автопоиск по базам данных, автоподстановка перевода по всем аналогичным сегментам на проекте, автопополнение баз данных, а также автосборка перевода из фрагментов, хранящихся в базах данных. Использование функций Лексикона позволяет создавать глоссарии на основе переводимых проектов, определить частотность употребления терминов и использовать полученные глоссарии для контроля качества.

Для агентств и отделов переводов выпущена версия Deja Vu Workgroup. Это достаточно мощный инструмент, включающий все функции версии Professional, и дополненный функционалом для организации коллективной работы, управлению проектами и интеграции.

Deja Vu X TeaM Server – еще более продвинутая система, дает возможность пользователям Deja Vu X2 Workgroup делиться базами данных в режиме реального времени по всему миру. Обеспечивает единообразие и производительность, уменьшает проектные затраты. Разные схемы лицензирования могут снизить или совсем исключить ручное администрирование проектов.

MemoQ — еще одна широко распространенная CAT-система. Ее любят локализаторы, поскольку в отличие от других она совместима с файлами Excel. В MemoQ можно загружать разные типы файлов, и она не привередлива к их объему и содержанию. Но у нее непривычный функционал, и многие пользователи, имеющие опыт работы с другими системами, на первых порах испытывают трудности в настройке.

MultiTerm — программа, которую переводчики используют для создания базы переводов, популярна в узкоспециализированных сообществах, которые занимаются переводами текстов по определенным тематикам. Одно из достоинств MultiTerm — возможность создавать глоссарии для использования в CAT-системах, которые впоследствии вручную можно подключить к автоматизированным системам. Но есть и недостатки. Программа не отличается дружественным интерфейсом, и новичкам довольно сложно разобраться в настройках.

Across — также достаточно популярная система с простым интерфейсом. Но отношение к ней неоднозначно. Все дело в «прозрачности»: проектные данные находятся в открытом доступе. Такой системой можно пользоваться, если вопрос о защите данных не актуален.

XTM — сложная система, используемая крупными компаниями в промышленных целях. Рассчитана на масштабные проекты и большие объемы данных. Главное — суметь правильно ее настроить. Тогда пользователям будет удобно с ней работать, они сэкономят массу времени. А вот переводчикам эта программа вряд ли подойдет.

Читайте также:  Bios не сохраняет настройки

TRADOS. Все перечисленные выше системы по тем или иным параметрам уступают яркому лидеру среди коммерческих систем – Trados. Этот продукт разработан немецкой компанией Trados GmbH, и является одним из мировых лидеров в данном классе. У системы огромное количество достоинств. Среди ключевых — на данный момент Trados поддерживает 93 языка (больше, чем все остальные системы). И по объему базы памяти переводов она лучше всех известных нам систем. Из недостатков можно отметить специфичный интерфейс. Впрочем, удобство интерфейса – дело вкуса и привычки. Есть проблемы с поддержкой некоторых форматов. Она привередлива к объему и типу файлов (например, уступает по этому параметру MemoQ). И Trados совсем не умеет извлекать текст из картинок.

SmartCAT. Это бесплатная облачная браузерная среда, обеспечивающая совместную работу целой команды переводчиков. Разумеется, SmartCAT — не первая в своем классе. Но по многим параметрам она опережает аналоги, как платные, так и бесплатные. Почему так получилось, становится понятно, если мы поинтересуемся происхождением этой системы. Изначально разработчиком SmartCAT была компания ABBYY, она-то и заложила в продукте широкие функциональные возможности. Сегодня Smartcat — самостоятельная фирма.

Почему мы выбрали SmartCAT

Рассмотрим подробнее функционал системы. Ее главный козырь – многочисленные лингвистические ресурсы, облегчающие работу переводчиков с однотипными текстами, содержащими стандартные фразы и предложения. Как правило, это общепринятые термины — технические, юридические, экономические, научные и т.д., описания товаров и услуг, деловая документация и многое другое. Тут ключевую роль играют базы Translation Memory — базы памяти переводов. В них хранятся когда-то переведенные тексты. Понятно, что эти базы постоянно пополняются новыми переводами.

Другой важный ресурс — глоссарии, которые содержат термины и понятия, принятые в какой-то конкретной отрасли, или компании. SmartCAT позволяет накапливать и поддерживать в актуальном состоянии корпоративные глоссарии и обеспечивает исполнителей правильными данными. А автоматические проверки гарантируют контроль качества перевода, обнаруживая несоответствия в терминах и датах, и отмечая орфографические, пунктуационные и другие ошибки.

Само собой, SmartCAT способна также выполнять и машинный перевод.
Указанные ресурсы системы облегчают работу человека, использующего CAT. Система предлагает варианты перевода отдельных фрагментов, опираясь на имеющиеся тексты из баз памяти переводов и глоссарии с корпоративной терминологией. Переводчик может просто воспользоваться предложенным вариантом, либо отредактировать его, либо, в крайнем случае, перевести текст по собственному разумению.

Особо следует остановиться на форматах файлов, поддерживаемых системой SmartCAT. Их список весьма внушителен: bmp, dcx, pcx, png, jp2, jpc, jpg, jpeg, jfif, tif, tiff, gif, pdf, djvu, djv, jb2, docx, doc, txt, rtf, odt, xlsx, xls, ppt, pptx, potx, pps, ppsx, odp, ttx, sdlxliff, xlf, xliff, srt. Обращает внимание то, что в приведенном списке немало графических форматов. Это приятное наследие ABBYY. Нередко переводчикам приходится работать с документами не в виде текста, а в виде изображений. Чтобы извлечь текст, его необходимо сначала распознать. SmartCAT интегрирован с OCR-технологиями ABBYY: достаточно загрузить графический файл, и система извлечет текст для перевода. Если вам хоть раз приходилось вручную вбивать текст, глядя на картинку, вы по достоинству оцените прелесть использования OCR-технологии.

Еще один комплимент от ABBYY — возможность использования словарей Lingvo. Небольшое, но все же удобство, когда все необходимое для перевода у вас под рукой.

Когда в описании системы встречаются слова «облачная среда», многие потенциальные пользователи рефлекторно напрягаются: «А как обстоят дела с безопасностью? Не украдут ли мои данные?» Ответим честно: взломать можно что угодно. Просто целесообразность взлома определяется соотношением затраченных времени и сил, и полученным результатом. В системе SmartCAT данные хранятся в дата-центре уровня Tier 4 и передаются по защищенным каналам, а уровень доступа к материалам регулируется с помощью системы распределения прав.

Заканчивая краткое описание SmartCAT, добавим, что интерфейс системы интуитивно понятен любому, кто когда-либо работал с CAT-инструментами: вы увидите на привычном месте оригинальный текст и перевод, окно совпадений с памятью переводов и глоссарием. Имеется отдельное окно для поиска в памяти, глоссариях и словарях, и еще одно окно — для результатов проверки качества, истории изменений фрагмента текста и комментариев.

Ну и еще несколько функций и особенностей, которые нельзя обойти молчанием

Итого

Хорошенько проанализировав весь арсенал достойных внимания систем САТ, в финале мы выбирали из двух: Trados и SmartCAT. Сравнение их функциональных возможностей показало, что примерно на 95% (это субъективная оценка автора) данные системы идентичны. С одной стороны, большее число поддерживаемых языков и больший объем базы памяти переводов Trados, с другой, дружелюбный интерфейс, поддержка графических форматов и способность извлекать текст из изображений, меньшая требовательность к объему файлов, масса полезных дополнительных функций и бесплатность SmartCAT.

В итоге мы выбрали SmartCAT. И хотя британец Тrados (сегодня система принадлежит британской компании SDL International) хорош и в моде, российская система CAT по ряду параметров превосходит зарубежный аналог и при этом проста в использовании, удобна и не капризна.

Читайте также:  Пользуясь геометрическим смыслом определенного интеграла вычислите

Константин Геращенко, редактор образовательного онлайн-ресурса Puzzle English

CAT-программы — специальные приложения, которые помогают автоматизировать процесс перевода. Сервисы работают по принципу текстовых редакторов, но с отличиями. CAT-программы предлагают доступ к словарям, глоссариям, запоминают выбор переводчика и в следующих схожих файлах автоматически подставляют перевод ранее переведенных слова. Данные программы помогают сократить время работы переводчиков над однотипными текстами, а также сокращают процент грамматических, пунктуационных и орфографических ошибок. Мы собрали 7 лучших CAT-программ и сделали обзор, чтобы вы смогли выбрать лучшего помощника.

Что такое CAT-программы и как они работают

Computer-Aided (Assisted) Translation — это автоматизированный, компьютерный перевод, при этом он полностью отличается от общепринятого понятия «машинный перевод». Программы запоминают предыдущие тексты или отдельные фрагменты и автоматически подставляют совпадающие сегменты в новых документах. Например, переводчик работает над документами, где есть фрагменты и параграфы, которые повторяются. Специалист может каждый раз заново переводить тексты или сделать это единожды, а CAT-программа предложит их. Второй вариант также подходит и для работы с художественной литературой, например, с шутками, идиомами, авторскими приемами.
CAT-инструменты помогают с:

  • переводом документации;
  • локализацией программного обеспечения;
  • работой со словарями терминов;
  • созданием проектов и организацией работы с ними;
  • проверкой качества перевода.

Подобные сервисы улучшат работу с большими массивами информации, помогут собрать отдельную базу данных с узкоспециализированной лексикой под конкретную сферу деятельности.

В чем основные преимущества CAT-программ

Современный автоматизированный перевод позволяет собирать собственную библиотеку переводов. Особенно это актуально в случаях, когда слова, словосочетания и даже предложения повторяются много раз. В таких случаях CAT-программа автоматически заменяет уже знакомые слова и помогает переводчику не делать работу дважды.
Что умеют CAT-программы:

  • помогать переводчику собирать личные словари и глоссарии, которые состоят из слов и словосочетаний по конкретным тематикам (экономика, юриспруденция, маркетинг, медицина);
  • сохранять форматирование исходного текста, что очень удобно в работе с многоуровневыми списками;
  • создавать авторские глоссарии с терминами, аббревиатурами, специфическими понятиями, которые используются в какой-то узконаправленной сфере.

7 лучших CAT-программ для бизнеса

С рождения идеи автоматизированного перевода в 1933 году и до нашего времени появилось много сервисов для автоматизации переводческого процесса. Некоторые из них бесплатные. Мы собрали самые удобные платные инструменты, которые можно применить в работе уже сегодня.

  1. Trados Studio. Профессиональная программа с большим количеством специфических настроек помогает работать с текстами в формате документов, презентаций, HTML. Сервис подходит для крупных проектов, поэтому его чаще всего используют компании, которые специализируются на переводах.
  2. SmartCAT. Современная программа с понятным интерфейсом, которая больше подходит для реализации небольших проектов. Чаще всего ее используют фрилансеры, а также специалисты компаний, которым редко приходится переводить тексты.
  3. MemoQ. Инструмент подходит для локализации, работает с любыми документами независимо от размера файлов и их содержания. Сервис пользуется популярностью у программистов и у специалистов, которые адаптируют ПО под иностранных пользователей.
  4. Wordfast. Эта CAT-программа предоставляет дополнительные возможности ТМ для Office Word или автономный инструмент для работы переводчиков на любой платформе. Преимущество этого продукта в интуитивном интерфейсе, возможности самостоятельно настроить набор функций, а также работе с внешними словарями в любом формате. Утилита подходит для фрилансеров, бюро переводов и корпораций.
  5. OmegaT. Бесплатная программа автоматизированного перевода с интуитивным интерфейсом подойдет для фрилансеров и специализированных бюро. Сервис работает с 30 форматами файлов, есть встроенный инструмент проверки орфографии, а также интерфейс для Google Translate.
  6. Déjà Vu. Программа с простым интерфейсом подходит для работы фрилансерам-переводчикам и агентствам. Сервис работает с 32 самыми популярными форматами, есть дополнительные функции для удобной работы с глоссариями и словарями.
  7. Transit NXT Professional. Специальная программа для локализации продуктов, сайтов и приложений. Ее особенность в том, что она сохраняет перевод не отдельного выражения, а всего контекста. Это очень облегчает работу с маркетинговыми текстами, где стилистика выходит на первый план. Удобный и простой сервис, есть много пакетов услуг, так что и одиночный фрилансер, и крупная компания смогут найти здесь что-то полезное для себя.

Начинающим и профессиональным переводчикам стоит обратить внимание на CAT-программами. Сервисы только в первое время кажутся сложными и неудобными, но уже через пару недель вы не сможете представить рабочий процесс без этих инструментов. Для более быстрого обучения найдите специальные курсы по CAT-программам или обучайтесь самостоятельно по видео на YouTube или профильных форумах.
Автоматизированный перевод — будущее, которое делает жизнь и работу проще. Профессиональные программы уменьшают затраты времени и ресурсов, но не отменяют человеческое участие. Сэкономленное время на переводах повторов можно применить для креатива, например, в маркетинговых текстах.

Автоматизи́рованный перево́д (АП, англ. Computer-Aided Translation ) — перевод текстов на компьютере с использованием компьютерных технологий. От машинного перевода (МП) он отличается тем, что весь процесс перевода осуществляется человеком, компьютер лишь помогает ему произвести готовый текст либо за меньшее время, либо с лучшим качеством. [ источник не указан 654 дня ]

Читайте также:  Cda формат как записать

Содержание

История [ править | править код ]

Одним из пионеров идеи автоматизированного перевода является советский учёный Пётр Петрович Троянский, предложивший в 1933 году «машину для подбора и печатания слов при переводе с одного языка на другой». Машина состояла из стола с наклонной поверхностью, перед которым был закреплён фотоаппарат, синхронизированный с печатной машинкой. На поверхности стола располагалось «глоссарное поле» — свободно двигающаяся пластина с напечатанными на ней словами на трёх, четырёх и более языках [1] .

Практическая реализация идеи автоматизированного перевода началась с момента появления компьютеров: переводчики всегда выступали против стандартной в те годы концепции МП, на которую было направлено большинство исследований в области компьютерной лингвистики, но поддерживали использование компьютеров для помощи переводчикам.

В 1960-е годы Европейское объединение угля и стали (предшественник современного Евросоюза) стало создавать терминологические базы данных под общим названием Eurodicautom [2] . В Советском Союзе для создания баз такого рода был создан ВИНИТИ.

В современной форме идея АП была развита в статье Мартина Кея 1980 года [3] , который выдвинул следующий тезис: «By taking over what is mechanical and routine, it (computer) frees human beings for what is essentially human» («Компьютер берёт на себя рутинные операции и освобождает человека для операций, требующих человеческого мышления»).

В настоящее время наиболее распространённые способы использования компьютеров при письменном переводе — работа со словарями и глоссариями, памятью переводов (англ. Translation Memory, TM ), содержащей примеры ранее переведённых текстов, терминологическими базами, а также использование так называемых корпусов, больших коллекций текстов на одном или нескольких языках, что даёт сжатое описание того, как слова и выражения реально используются в языке в целом или в конкретной предметной области.

Для локализации программного обеспечения часто применяются специализированные средства, например, Passolo, которые позволяют переводить меню и сообщения в программных ресурсах и непосредственно в откомпилированных программах, а также тестировать корректность локализации. Для перевода аудиовизуальных материалов (главным образом фильмов) также используются специализированные средства, например Aegisub, которые объединяют в себе некоторые аспекты памяти переводов, но дополнительно обеспечивают возможности появления субтитров по времени, их форматирования на экране, следования видеостандартам и т. п.

При синхронном переводе использование средств автоматизированного перевода из-за его специфики ограничено. Одним из примеров является использование словарей, загружаемых на КПК. Другим примером может служить полуавтоматическое извлечение списков терминов при подготовке к синхронному переводу в узкой предметной области [4] .

В узких предметных областях при большом количестве исходных текстов и устоявшейся терминологии переводчики могут использовать и машинный перевод, который может обеспечить хорошее качество перевода терминологии и устойчивых выражений в узкой области. Переводчик в этом случае осуществляет пост-редактирование полученного текста. Более половины текстов внутри Еврокомиссии (главным образом юридические тексты и текущая корреспонденция) переводится с использованием МП.

Общий обзор [ править | править код ]

Автоматизированный перевод — это широкое и не совсем точное понятие, охватывающее широкий спектр простых и сложных инструментов. Они могут включать:

  • Программы для проверки правописания, которые могут быть встроены в текстовые редакторы или дополнительные программы;
  • Программы для проверки грамматики, которые также встраиваются в текстовые редакторы или дополнительные программы;
  • Программы для управления терминологией, которые позволяют переводчикам управлять своей собственной терминологической базой в электронной форме. Это может быть и простая таблица, созданная в текстовом редакторе, и электронная таблица, и база данных, созданная в программе FileMaker. Для более трудоёмких (и более дорогих) решений существует специальное программное обеспечение, например LogiTerm, MultiTerm, Termex, TermStar и т. п.
  • Словари на компакт-дисках, одноязычные или многоязычные;
  • Терминологическиебазы данных, хранимые на компакт-дисках или подключаемые по Интернету, например The Open Terminology Forum или TERMIUM;
  • Программы для полнотекстового поиска (или индексаторы), которые позволяют пользователю обращаться с запросами к ранее переведённым текстам или разного рода справочным документам. В индустрии переводов известны такие индексаторы, как Naturel, ISYS Search Software и dtSearch;
  • Программы конкорданса, позволяющие находить примеры слов или выражений в употребляемом контексте в одноязычном, двуязычном или многоязычном корпусе, как битекст или память переводов, например Transit NXT;
  • Битекст, одно из нововведений последнего времени, это результат слияния исходного текста и его перевода, который впоследствии может быть проанализирован при помощи программ для полнотекстового поиска или конкорданса;
  • Программное обеспечение для управления проектами, которое позволяет лингвистам структурировать сложные переводческие проекты, передавать выполнение различных задач разным сотрудникам и наблюдать за процессом выполнения этих задач;
  • Программы управления памятью переводов (TMM), состоящие из базы данных сегментов текста на исходном языке и их переводов на один или более целевых языков, например Transit NXT;
  • Почти полностью автоматические системы, напоминающие машинный перевод, но позволяющие пользователю вносить определённые изменения в сомнительных случаях. Иногда такие программы называют машинным переводом с участием человека.

Рекомендуем к прочтению

Добавить комментарий

Ваш адрес email не будет опубликован.