MT2007

Совместный проект с языковым порталом Uz-Translations

Новости

 

Последние новости по развитию MT2007 и сопутствующая информация.


23.02.2009 - Обновление MT2007 (версия 1.0.3.5)

  • Локализован интерфейс. На данный момент есть русский и английский интерфейс программы. Перевести интерфейс на любые другие языки может выполнить сам пользователь. Весь текст находится в папке Localization в файлах с расширением *.lng. Это обычный xml файл. Если кто-то переведет интерфейс на новый язык, просьба прислать файл мне - я выложу на сайт. Для переключения на другой язык локализации запустите файл LanguageSelector.exe и выберите желаемый язык.
  • Добавлен новый фильтр - Simple XML. С его помощью можно переводить файлы xml (содержимое узлов), за исключением атрибутов. Используя этот фильтр, например, можно перевести языковый файл интерфейса на другой язык.
  • Добавлена возможность внести в программу дополнительные языки переводов, отсутствующие в данный момент (кроме 12 встроенных). Для этого достаточно прописать параметры нового языка в файле LanguageDefinitions.xml. Для примера там прописаны параметры для Узбекского языка (латиница и кириллица). По аналогии можно прописать любой другой язык и он появится в списке выбора языка перевода (с или на) при создании проекта. Однако там пока отсутствует возможность указывать параметры для сервиса перевода Гугл.
  • Исправлены некоторые ошибки в фильтрах Word'а и OpenOffice'а.

11.10.2008 - Обновление MT2007(версия 1.0.3.3) и XDXF2MT2007(версия 1.0.0.1)

Большая часть обновления МТ2007 связана с исправлением ошибок, вылезавших в процессе работы (присланные переводчиками, использующих МТ2007 в реальной работе), однако, есть и новые функции:
  • Добавлен фильтр XLIFF. Экспорта в XLIFF пока нет
  • В функцию перевода, вызываемую по кнопке "Перевести" добавлена возможность подключать репозиторий, а не только файлы предыдущих проектов.
  • Изменен алгоритм перевода при прогоне текста через репозиторий и подключенные базы (кнопка "Перевести"). Теперь полные совпадения автоматически маркируются зеленым цветом и при дальнейшем выполнении перевода вручную (при переходе на следующее предложение) пропускаются. То есть выделяется следующее не-зеленое предложение. Остальные предложения с совпадением 50%-98% маркируются желтым цветом. Пропуск "зеленых" предложений можно отключить на тулбаре, сняв чекбокс "Пропускать "зеленые" предложения при переходе на след.предл.
  • Добавлена "горячая" кнопка F4 в редактор перевода, позволяющая копировать текст перевода наиболее похожего предложения в текущее переводимое предложение (дублирует действие кнопки "синяя стрелочка вниз" в поле показа похожего предложения).
  • Скорректирована ошибка с кодировкой при переводе с русского текста при использовании сервиса Google Translate.
  • Теперь в полный дистрибутив включены утилиты TextAlign для подготовки TMX файлов из текстов оригинал-перевод и конвертатор XDXF2MT2007. Их можно скачать и отдельно.
  • Добавлен еще один документ, описывающий некоторые аспекты работы в программе. Написан переводчиком, активно использующим МТ2007 в повседневной работе  Elina Bondarenko.
XDXF2MT2007:
  • Конвертатор теперь понимает и структуру XDXF, получаемую после конвертации словарей DSL в XDXF утилитой dsl2xdxf

23.08.2008 - Обновление TextAlign (версия 1.0.0.2)

  • Небольшие исправления. Добавилась "горячая клавиша" разрезки предложения Shift+Ins.
  • Добавилось контекстное меню склейки+резки+удаления по нажатию правой кнопки мышки.
  • Исправлена ошибка, когда после открытия данных файла промежуточного состояния работы кнопки склейки+резки+удаления оставались заблокированными.

15.06.2008 - Обновление MT2007 (версия 1.0.3.1)

  • Исправлена ошибка, возникавшая при экспорте в репозиторий проекта, созданного из TMX файла.
  • Реализован экспорт пользовательских сегментов в текстовый файл с возможностью последующего их возврата в проект. Необходимо, если вы хотите проверить внешним средством проверки орфографии сегменты. 
  • Реализован импорт в проект текстов, ранее выгруженных в текстовый файл (возможно для проверки орфографии внешними средствами или для других целей). Импорт поддерживается в тех же режимах, что и экспорт - только перевод, оригинал и перевод в одном файле, оригинал и перевод в разных файлах.
  • Встроена система EBMT - Example Based Machine Translation.
 

31.03.2008

  • Разработана отдельная утилита конвертации словарей из формата XDXF в MT2007 (XDXF2MT2007).

23.03.2008

  • Разработана новая программа TextAlign для сопоставления предложений из файлов оригинала и перевода и формирования из них файла TMX. Взять программу можно со страницы скачек. Программа как и все мои остальные разработки на этом сайте бесплатна для личного использования.
  • Разработана новая программа FictionAnalizer. Предназначена в основном для анализа русских текстов художественной направленности, однако может использоваться по своему назначению и для текстов не-художественного направления. Программа проверяет наличие дубляжа в предложении одинаковых или однокоренных слов. Все такие предложения составляются в список, перемещаясь по которому в основном окне производится выделение и показ текущего предложения, где все это можно и поправить, а затем сохранить в файл. В основном тексте дубляж выделяется цветом. Одинаковые слова - оттенками красного фона, однокоренные слова - оттенками синего. Анализ можно проводить и для пар (три-пар и более) предложений.
  • Просьба скачавшим программы сообщить на мой е-мейл mt2007@nm.ru были ли вам полезны какие-либо из разработанных мною программ. Особенно, если возникают проблемы с использованием. Мне все это нужно для своей личной статистики и особенно важно для моего стимула в дальнейшей разработки подобных программ и развития текущих версий.

28.02.2008

  • Обновлена программа TransCounter. Теперь данные расчета можно выгрузить в Excell файл. Расчет можно производить одновременно по трем параметрам и расценкам - символы на страницу, слова на страницу и по стоимости одного слова на документ.
  • Исправленны битые ссылки на скачивание TransWatcher и CorrectWordTags. См. страницу скачивания.

26.02.2008 - обновление MT2007 (версия 1.0.3.0)

  • Мультиязычная версия. Направление перевода можно выбирать из 12 языков: English, Russian, Danish, Dutch, Finnish, French, German, Italian, Norwegian, Portuguese, Spanish, Swedish. Для некоторых пар (не для всех) поддерживается он-лайн перевод GoogleTranslate и Multitran (зависит от ограничений он-лайн движков, список пар переводов которых постоянно растет - при появлении новых пар перевода указанных движков, они будут добавляться в MT2007 ). Однако встроенные словари пока есть только для пары Английский->Русский. К следующей версии планируется выпуск конвертатора для словарей из открытого формата XDXF в формат MT2007.
  • Улучшен встроенный орфографический модуль. Для всех указанных языков поддерживается орфографическая проверка. Орфографические словари взяты из пакета OpenOffice. Исправлено: 1) Теперь корректно предлагает замену неправильному слову. 2) Теперь можно остановить длительный процесс проверки. 3) Скорость проверки увеличена.
  • Добавлены новые фильтры входных файлов: OpenDocument Text (*.odt) и OpenDocument SpreadSheet (*.ods). Пока в редакции RC1 для отлова возможных ошибок. При нахождении таковых, просьба сообщить разработчику.
  • Внесены изменения в модуль подстановки терминов (сегментов). 1) Для сегментов на основе регулярных выражений можно выставлять последовательность подстановки. 2) Для "плоских" сегментов можно включить/выключить учет регистра.
  • Добавлена возможность помечать переводимые секции цветом (переведено, частично переведено, непереведено, проблемная секция...) с автоматическим "закрытием" (пометкой зеленым цветом) текущей секции при переходе на следующую в процессе перевода и оставлять примечания (заметки) для каждой секции.
  • Можно настроить фоновый цвет для вводимых изменений в текст перевода в редакторе 
  • Добавлена возможность склейки/резки секций (пункт меню "Редактировать").
  • Внесены некоторые мелкие изменения и улучшения, а так же устранены некоторые ошибки.

03.12.2007 - обновление (версия 1.0.2.8)

  • В программе установлен новый универсальный фильтр импорта-экспорта для MS Office 2007. Он заменяет предыдущий фильтр для docx. Теперь MT2007 может работать с файлами Word 2007 (*.docx, *.docm), Exell 2007 (*.xlsx, *.xlsm), PowerPoint 2007 (*.pptx, *.pptm). Корректность экспорта данных увеличена (сохранение форматирования) до максимума.
  • Изменения в экспорте данных в ТМХ. Теперь можно при выгрузке данных указывать, что делать с непереведёнными  предложениями: 1) не экспортировать; 2) экспортировать как пустые; 3) экспортировать оригиналы в качестве перевода.
  • В редакторе перевода добавилась справка по "горячим" клавишам (F1).

26.11.2007 - обновление (версия 1.0.2.7)

  • Небольшие корректировки подстановки сегментов (терминов)
  • Импорт сегментов на основе регулярных выражений из предыдущих проектов
  • Интеграция с ПРОМТом. В тулбаре появилась отдельная панель для работы с ПРОМТом. Вызвать перевод текущего предложения можно или из тулбара, или в редакторе перевода CTRL+P. Перевод показывается в окне, которое раньше использовалось только для перевода Google. Для работы ПРОМТа в МТ2007, ПРОМТ должен быть настроен на интеграцию с MS офисом. Весь функционал разрабатывался и тестировался под версией PROMT-8 Giant.
  • Выкладываю на суд пользователей бетта версию универсального фильтра для всех документов MS офиса 2007 формата OpenXml. Все настройки для работы с определенным типом файла прописываются в файле Filters.xml. На данный момент там прописаны настройки на файлы Экселя 2007 и Ворда 2007. Так как это бетта версия фильтра, то чтобы можно было потестировать его работу на вордовских документах и, чтобы они не пересекались с уже существующим внутренним фильтром файлов Ворда (docx), для последних фильтр настроен на расширение файла docl. Тоесть, чтобы потестировать  работу фильтра на вордовских документах, необходимо переименовать их расширение на docl. В отличие от существующего встроенного фильтра, данный универсальный кроме прочего "видит" и колонтитулы. Екселовские файлы берутся как есть. Единственная недоработка - это то, что для всех файлов (кроме вордовских) программа МТ2007 еще не умеет показывать теги в процессе перевода, в результате чего в переводе (например файла xlsx) может теряться некоторое форматирование. О всех замеченных косяках, прошу незамедлительно сообщать разработчкиу, то есть мне.

30.10.2007 - обновление (версия 1.0.2.6)

Небольшие изменения по просьбе трудящихся и исправление одной ошибки
  • Колонка с оригинальными предложениями в реестре по умолчанию заблокирована для редактирования. Для разблокировки щелкнуть правой кнопкой мышки на реестре и в меню выбрать "Разблокировать", аналогично для блокировки
  • При добавлении сегмента из редактора перевода (выделили фразу, нажали Ctrl+N), после возврата в редактор выделенная фраза (добавленная в список сегментов) автоматически меняется на перевод.
  • Исправлена ошибка при формированиия файла перевода для файлов типа Word 2003 Xml. В предыдущем обновлении (1.0.2.5) в перевод попадали служебные символы МТ2007
  • ВНИМАНИЕ! Для скачивания файлов появилось "зеркало" с большей пропускной способностью (скоростью) при скачивания. Адрес: http://cosmos2.ru/downloads/MT2007/

23.10.2007 - обновление (версия 1.0.2.5)

  • Подправлен фильтр импорта docx файлов. Корректно импортируется тип объекта "поле" и при экспорте сохраняет, если они есть, пробелы между тэгами (раньше они терялись)
  • Изменения в редакторе перевода. Добавлять новый сгемент по Ctrl+N теперь можно не только непосредственно в поле перевода, но и в информационных полях, показывающих различия между текущим и похожим предложением.
  • Под этими информационными полями появился сплиттер, с помощью которого можно изменять размеры информационного поля.
  • Для каждого информационного поля и для поля ввода перевода можно менять размер шрифта по "горячей" клавише Ctrl+ и Ctrl-

04.10.2007 - обновление (версия 1.0.2.4)

  • Реализована работа с единым репозиторием. В настройках появилась закладка работы с репозиториями. Там же можно настраивать справочник тематик для проектов. Для каждого нового проекта теперь необходимо указывать к какой тематике он относится. Эта тематика используется при экспорте текущего переведенного проекта в репозиторий, то есть данные из этого проекта соотносятся с указанной тематикой. Этот же репозиторий используется непосредственно при переводе (в нем производится поиск похожих сегментов). Автоматически поиск производится среди данных, помеченных кодом тематики данного проекта. Однако в настройках можно указать, что для данного проекта при поиске необходимо использовать и данные других тематик. При открытии проекта, если не установлен текущий репозиторий, создается стандартный в каталоге программы в подпапке \Repositories\CommonRepository.rep. Однако в настройках можно указать другой файл репозитория.
  •  При добавлении нового сегмента в окне ввода показывается количество таких сегментов в текущем проекте.
  • Окно ввода нового сегмента можно закрыть кнопкой Esc

24.09.2007 - обновление (версия 1.0.2.3)

  • Если в настройках установлен переключатель "Автоматический поиск подобных предложений при переходе на новую секция (Ctrl+Enter)", то автоматически будет производится поиск (как при нажатии Ctrl+F) и в редакторе перевода будет показано лучшее совпадение вместе с переводом. Кроме того, цветом (красным) будут выделены куски текста (слова) не совпадающие в предложениях (найденном и текущем). При переходе на другие найденные совпадения в окне поиска также будет показано различие между ними и текущим предложением.
  • В редакторе перевода появились два новых поля - найденное похожее предложение и текущее с цветовыми различиями между ними (см.выше)
  • Оптимизирован алгоритм поиска и подстановки в процессе перевода (раньше при кол-ве секций свыше 10000 начинало заметно тормозить).
  • В редакторе перевода добавилась горячая клавиша Ctrl+G - поиск перевода в Гугле
  • При Ctrl+G и Ctrl+F происходит автоматическое переключение (или показ) на соответствующую закладку
  • При сохранении данных также происходит сохранение расположение (размещение) закладок. После открытия проекта это расположение восстанавливается.

18.09.2007 - обновление (версия 1.0.2.2)

Новое:

  • В редакторе добавил пару "горячих" клавиш - Ctrl+U - привести к верхнему регистру слово (на котором курсор стоит) или выделенную часть текста. Ctrl+L - к нижнему регистру
  • Подправил регистр символов подстановки перевода из памяти.
  • Некоторые корректировки цвета в редакторе (знаки препинания черным, а не серым)
  • Полностью отвязал программу от WORD'а, все равно на данный момент его функции не используются....

28.08.2007 - обновление (версия 1.0.2.1)

Новое:

  • Полностью переписан фильтр импорта-экспорта файлов формата docx, docm, Word2003 xml. Теперь корректно читает текст из объектов любой вложенности.
  • Добавлена возможность настройки размера шрифта для списка секций
  • В строке состояния показывает текущую секцию и сколько осталось секций до конца файла
  • Исправлены некоторые неточности при поиске информации
  • Модуль "Грубые совпадения" переименован в "Поиск"

19.07.2007 - обновление (версия 1.0.2.0)

В этом обновлении появилось много новых функций, поэтому номер версии перепрыгнул сразу на 1.0.2.0

Новое:

  • Реализована работа с регулярными выражениями (RegEx). Теперь можно подключать сегменты, реализованные с помощью регулярных выражений для подстановки во время перевода. Механизм достаточно мощный, чтобы реализовать очень сложные логические механизмы подстановки. Этот инструмент доступен из меню "Сервис"-"Регулярные выражения". Кроме того, он позволяет отлаживать регулярные выражения на тестовых текстах или на текстах из текущей базы данных. По каждому отлаживаемому выражению тут же можно посчитать количество секций в базе, ему соответствующих, или выбрать и показать эти секции. В программе реализована общая база данных регулярных выражений (доступная для всех проектов), в которую можно записывать отлаживаемые выражения или те, которые могут быть наиболее востребованы во многих переводах, и база регулярных выражений текущего проекта, куда их можно копировать из общей базы выражений и которая реально будет использоваться при переводе.
  • Заработала функция настройки (левая кнопка меню). В ней можно устанавливать общие для программы настройки и настройки текущего проекта. В общих настройках указывается папка проектов, где по умолчанию проекты будут создаваться, имя переводчика по умолчанию, последовательность подстановки сегментов в перевод - сегментов на основе регулярных выражений и простых (плоских) сегментов.
    В настройках текущего проекта подключаются память существующих переводов, которые будут использоваться при переводе и тип проверки орфографии (см. ниже).
  • Улучшен механизм подстановки переводов. Теперь, кроме предварительного перевода по базе существующих переводов целых предложений, автоматически при переходе на новую непереведенную секцию подставляются переводы из подключённых баз, оригиналы которых содержаться в переводимом (текущем) предложении.
  • Теперь можно подключить механизм орфографической проверки ОРФО 9. Эта проверка работает как при вызове основной функции "орфография" программы, так и в процессе перевода (см.настройки). То есть можно установить проверку орфографии при переходе в редакторе перевода из переведённой секции в новую. Подключение производится в настройках, там же можно проверить, возможна ли работа с ОРФО 9. Для доступа к ядру ОРФО используется его библиотека orfoieaddin.dll, соответственно при установке ОРФО надо добавить интеграцию с IE. В следующей версии планируется добавить вызов толковых словарей ОРФО из редактора перевода.
    В редакторе перевода можно непосредственно проверить конкретное слово, нажав кнопку CTRL+O (курсор должен находиться на этом слове).
  • Расширен поиск похожих предложений из редактора перевода. Теперь при нажатии CTRL+F поиск производится и в подключенных базах переводов.
  • Улучшен механизм цветовой раскраски информации в редакторе. Красным цветом выделяются непереведенные слова (английские), зелёным - русские, цифры - синим, прочие знаки - серым.
  • Из опытной эксплуатации выявлено, что механизм показа при наборе слова списка похожих слов используется редко, его работа изменена. Автоматически он не показывается, но его можно вызвать CTRL+Space.

13.06.2007 - обновление (версия 1.0.1.4)

Новое:

  • Выгрузка данных в текстовый файл(ы)(меню "Сервис"). По выбору - только перевод, оригинал и перевод в 1 файл, оригинал и перевод в 2 разных файла. Выбор кодировки - Windows 1251 или UTF-8.
  • Выгрузка данных в TMX. Поддерживаются форматы 1.1 и 1.4. При выгрузке также можно указывать кодировку. Выгруженный ТМХ проверен в WordFast'е.
  • Снова заработал поиск в переводчике Google (изменение формата)
  • Исправлен баг: раньше нельзя было открыть другой существующий проект, если в программу был уже загружен проект, нужно было только заново программу запускать.

В редакторе перевода реализовано несколько "горячих" клавиш для ускорения работы:

  • CTRL+S - сохранить все
  • CTRL+F - найти похожее предложение в ранее переведенном в данном проекте (показыватся в секции "Грубые совпадения"). Если при нажатии этой комбинации в редакторе выделен текст, то ищется его вхождение в тексте. Сначала в тексте оригинала, если не найдено - в тексте переводов.
  • CTRL+N - открывается окно ввода нового сегмента. Если есть выделение в тексте - этот выделенный текст подставляется в окно ввода нового сегмента в качестве оригинала.
  •  CTRL+D - поиск выделенного слова или фразы в словарях.

14.05.2007 - обновление (версия 1.0.1.2)

В данной версии системы появилась возможность поиска синонимов русских слов. В редакторе перевода необходимо установить курсор на существующее слово и нажать кнопку F2. Появится окно с синонимами данного слова. В этом же окне можно вводить произвольные слова и искать их синонимы. Из-за большого размера (20Мб в архиве), файл базы синонимов скачивается отдельно на странице закачки (необходимо только при обновлении). Его надо распаковать в папку с программой (в дистрибутив база синонимов включена).

Появился импорт из файлов TMX. Создается обычный проект, но в качестве исходного файла указывается файл в формате TMX. При импорте пользователем выбираются языки оригинала и перевода (из существующих в файле). Также перед импортом указывается, нужно ли очищать существующие теги форматирования в процессе импорта. После создания проекта, данные можно при необходимости редактировать, а саму базу данных использовать для переводов других проектов. Импортирование тестировалось на файлах TMX формата 1.1 и 1.4.

Изменился принцип поиска информации в памяти переводов. Теперь размер базы данных переводов практически не влияет на скорость поиска перевода в базе данных. Для этого во время создания проекта строится отдельный индексный файл. Так же, если для перевода данных использовать существующую память переводов, но не проиндексированную, то сначала строится индекс, а затем производится перевод.

 

02.05.2007 - обновление (версия 1.0.1.0)

В этом обновлении представлен новый (дополнительный) редактор перевода. Вводить переводы можно и по старинке, но советую попробовать использовать этот дополнительный редактор. При вводе слов перевода автоматически предлагается список переводов сегментов, соответствующих вводимому слову, а также список ранее вводимых во всем документе слов.
Кроме того, он поддерживает все те же "горячие" клавиши вставки оригиналов в перевод, вставки определенных тэгов. Если используется механизм подстановки переведенных сегментов, то непереведенные сегменты выделяются темно-красным цветом.

26.04.2007 - обновление (версия 1.0.0.9)

Вышла очередная версия MT2007. Из нововведений: Появился импорт сегментов из текстового файла, как с переводами, так и без. Добавились кнопки на панели для вставки текста оригинала с переведенными сегментами в секцию перевода независимо от текущего режима подстановки сегментов. Вставка также может производиться "горячими" клавишами - F11 и F12 (вставка с тэгами).

21.04.2007 - обновление (версия 1.0.0.8)

Вышла очередная версия MT2007. Из нововведений: добавился импорт файлов MS Word XML, Macro Enabled Word 2007 (*.docm).

19.04.2007 - Открыт сайт MT2007

Долгое время своего сайта у программы не было. Основной информацией о развитии программы был форум в ГОРОДЕ ПЕРЕВОДЧИКОВ (обсуждения и в настоящее время происходят там). Однако многие спрашивают у меня ссылки на информацию по программе и достаточно сложно навскидку приводить адрес вышеуказанного форума, поэтому я пришел к выводу, что необходимо организовать этот сайт с краткой информацией и необходимыми ссылками. Для начала сайт будет расположен на бесплатном хостинге NewMail (http://mt2007.nm.ru) и работать в тестовом режиме. Посмотрим как будут идти дела дальше, при необходимости будем расширяться дальше.