Форматы документов


eng
 



Форматы документов

Поддерживаемые форматы документов

Нами разработаны фильтры для следующих форматов файлов (DTP):

  • RTF (Word)
  • MIF (FrameMaker)
  • HTML
  • SGML
  • XML
  • InterLeaf ASCII
  • PowerPoint
  • TROFF/NROFF

Фильтры позволяют извлекать текст, подлежащий переводу, с гарантированным сохранением формата файла. Это значит, что информация о шаблоне, структуре, шрифтах/стилях, таблицах, рисунках и ссылках полностью сохраняется.

В расположенной ниже таблице отмечены возможности и особенности работы фильтров для каждого формата документа:

Формат документа
Возможности и особенности фильтра
RTF (Word) Выделение текста из документа и последующая его вставка. Выделяется только текст из основного потока. По умолчанию, текст из WordDraw, плавающих рамок и подобных объектов не извлекается. Имеется механизм для ручного "включения" подобных объектов в основной поток текста. C помощью предварительной (ручной) обработки можно маскировать требуемые части документа от перевода.
MIF (FrameMaker) Выделение текста из документа и последующая его вставка. Выделяется весь текст, включая информацию, которая содержится на специальных страницах (reference и master page). Текст может быть отсортирован для удобства последующего (ручного) пост-редактирования (внутренний порядок хранения текста в MIF отличается от его логического представления в документе). Имеется возможность отдельной обработки переменных, с указанием переменных, не подлежащих переводу. Также можно указывать текст, не подлежащий переводу, на основании следующих параметров: стиль шрифта, название стиля параграфа или структурного элемента (для структурированных документов).
HTML
SGML
XML
Выделение текста из документа и последующая его вставка. Указание текста, не подлежащего переводу, на основании комбинации тегов и атрибутов в тегах. Предусмотрен режим работы без раскрытия entities в соответствующие текстовые представления.
InterLeaf ASCII Выделение текста из документа и последующая его вставка. Возможен режим работы без выделения таких элементов, как strings и/или microdocuments.
PowerPoint Выделение текста из документа и последующая его вставка.
TROFF/NROFF Выделение текста из документа и последующая его вставка.
Из-за отсутствия единого стандарта на макрокоманды, используемые при создании документов, необходима предварительная настройка фильтра под конкретные документы (с учетом применяемых в них пакетов макрокоманд).

Список наших фильтров постоянно расширяется. Так, в ближайшее время появится фильтр для "извлечения" текстовых сегментов системы Translation Memory "Transit".


© "БП "Аргонавт" 2002 - 2014