The Word Bible Software

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск
«The Word»
TheWord.png
Тип

Библейское ПО

Разработчики

Costas Stergiou. Версия 3.0x

Написана на

неизвестно

Операционная система

Windows 9x, ME, 2000, XP, Vista, 7. Программа совместима с 64-битными версиями Windows 2000, Windows XP, Windows Vista и Windows 7. 6-го февраля 2011-го года на официальном форуме программы был выложен релиз для Mac OS, для которой, как и для операционной системы Linux, работа программы возможна через эмулятор Wine.

Языки интерфейса

23 языка, включая русский, английский, африкаанс, албанский, португальский (Бразилия), болгарский, каталанский, китайский, чешский, датский, голландский, финский, французский, немецкий, греческий, венгерский, итальянский, малайский, польский, румынский, словацкий, испанский, тайский.

Последняя версия

3.2.1.1167 (3 февраля 2011)

Лицензия

Свободное использование. Исходный код закрыт.

Сайт

http://www.theword.net

«TheWord» (встречаются разные варианты написания названия, например, «The Word» и «theWord») — бесплатная компьютерная программа категории «Bible Study Software» (библейские учебные программы). Изначально ориентированная на работу под операционной системой Windows, со временем программа приобрела черты кроссплатформенного ПО (по крайне мере, если признаком таковой считать возможность работы через эмуляторы типа Wine под Linux на разных версиях Mac OS. Существует также родственный проект iBibleStudy HD который дает возможность использовать модули к TheWord на iPod[1]). А в 2013 году под именем TheWord toGo была анонсирована версия «TheWord» под Pocket PC. Но в отличие от TheWord (по состоянию на апрель 2013 года) она распространяется платно, — это портативная сборка на USB Flash[2]).

Название программы происходит от первых слов в Евангелии от Иоанна «In the beginning was The Word» («Вначале было Слово»). Впервые «TheWord» была выпущена её разработчиком Костасом Стержо в 2003 году.

«The Word» может использоваться для решения разного рода задач в религиозной сфере, — от изучения и преподавания до создания авторских материалов. В отличие от большинства других программ подобного рода программа «The Word» предоставляет пользователям удобную платформу для накопления разносторонней текстовой и графической информации. На официальном сайте доступно для скачивания более 200 модулей (это переводы Библий, книги, справочники, атласы, комментарии), но вокруг программы сложилась любительская «индустрия» по производству модулей, так что реальное число материалов доступных для скачивания с сайтов сторонних разработчиков гораздо больше.[3] В последнее время в русскоязычном сегменте складывается тенденция расширения круга потенциальных пользователей программы за счет создания модулей с нерелигиозным содержанием.

В 2008 году, в одном из обзоров библейского софта[4] программа получила довольно высокую оценку. Несмотря на свою бесплатность, в этой рецензии она была оценена как превосходящая по своим возможностям многие платные программы. В частности, из двадцати программ в обзоре она разделила почетное второе место вместе с SwordSearcher 5, уступив первое место только WORDsearch 8. В обзоре давались оценки интерфейсу, технической поддержке, расширяемости, количеству ресурсов, реализации возможностей поиска и его скорости, а также был выставлен средний балл, учитывающий все плюсы и минусы.

Возможности[править | править вики-текст]

The Word поддерживает следующие функции:

  1. «Быстрый поиск» (то есть без необходимости набора текста, просто выделив текст и получив результаты) по текстам Библий и внутри библиотеки модулей.
  1. Поиск тем в модуле по мере набора текста с режимом автоматической фильтрации результата.
    • Например, если набрать слово «word», в окне будут выведены все заголовки, в которых это слово так или иначе встречается. Остальные заголовки в словаре автоматически скроются (то есть отфильтруются). Это заметная отличительная особенность TheWord. Lingvo и другие программы, которые ищут слова по мере набора, начиная с первой буквы, выведут только те соответствия, которые начинаются со слова «word». Если слово «word» будет в корне или вторым/третьим по счёту, то оно не будет найдено. То же самое отчасти касается и разного рода скобок и других не обязательных знаков которые могут встречаться перед терминами. В отличие от других оболочек однако эта опция работает одновременно только с одним словарем (модулем). Для поиска по набору модулей придется воспользоваться другим окном поиска, в котором однако отсутствует режим поиска в реальном времени (по мере набора текста).
  2. Группировка тем в результатах поиска реализована «по материалу».
    • В отличии, в частности, от программы Lingvo, в которой окно результатов не отличается компактностью и требует зачастую длительной прокрутки, в TheWord результаты выводятся списком тем, содержание которых можно в полной мере оценить с наведением курсора (на всплывающем окне), либо открыть с помощью клика в (активном) окне книжного типа. Так можно селективно вывести результаты одного запроса (то есть разные темы) на десяток различных окон. В целом с учётом множества настроек модель поиска в TheWord довольно гибкая и компактная. В ней сравнительно легко и быстро можно определить, какой источник представляет наибольший интерес, и тем самым можно заметно сэкономить время при работе. Расширить возможности вывода информации при нехватке места на экране можно с запуском нескольких приложений (не исключается и возможность работы на нескольких мониторах).
  3. Полнотекстовый поиск в словарях и книгах (в книжных окнах в целом).
    • Это довольно редкая для словарных оболочек опция, позволяющая производить поиск не только в заголовках тем но и в их содержании. Пример работы: http://www.youtube.com/watch?v=NO4Ng6dsKtU
    • Эта же опция автоматически активирует построение индекса в новых модулях. Если же был запущен поиск по набору или по всем модулям то это приведёт к пакетной индексации материалов, в которых еще не был построен поисковый индекс.
    • При большом объёме справочных материалов и словарей (десятки гигабайт) рекомендуется использовать SSD для ускорения работы поиска.
  4. Гибкое создание поисковых наборов из материалов справочно-энциклопедического характера
    • В том числе комбинаций отраслевых словарей и словарей общей языковой направленности. Пример создания: http://www.youtube.com/watch?v=9bF4loNAyb4
  5. Быстрый поиск книжных модулей по любым данным из его заголовка.
    • Фактически поиск идет одновременно не по одному названию а по двум. Например если у словаря есть название на языке оригинала и был вписан отдельно (в отдельную графу) русский перевод этого названия.
  6. Сжатие модулей книжного типа (книг, словарей, атласов, комментариев…)
    • Примерное сжатие: трёх-пятикратное в зависимости от объёмности тем модуля и от объёма иллюстраций. В целом чем меньше объём статей тем ниже эффективность сжатия. Что касается эффективности — то для сравнения WinRar на максимальных настройках может создать архив в 6,5 раз меньший по объёму, чем сжатый модуль *.twm (при условии, что архивироваться будет несжатый, незашифрованный модуль, не содержащий заметного объёма иллюстраций). Поэтому для архивного хранения и распространения больше подходят модули не сжатые внутренними средствами программы.
    • В качестве дополнительной опции имеется возможность сжать поисковый индекс. Эта опция снижает скорость поиска на 50 %. Эффективность сжатия может очень сильно колебаться от модуля к модулю. Иногда доходит до 25 % но чаще всего держится в районе 10 %.
  7. Поддержка создания собственных модулей Библий, общих книг, атласов, словарей, комментариев
    • В в конце 2011 года была реализована также поддержка модулей гибридного типа «общая книга-комментарий».
    • Модули книжного типа поддерживают иерархическую структуризацию тем как это и принято в книгах.
    • Программа имеет внутренние инструменты для редактирования текстов, но при копировании текстов из внешних приложений стиль также сохраняется, — настолько, насколько позволяют возможности формата RTF. В частности очень хорошие результаты дает копирование из программ MS Word и Help&Manual.
    • В отличие от словарей многих других программ, использующих XML, подобные форматы книжные модули The Word менее интерактивны (то есть больше приближены к печатным вариантам), более сложно устроены внутренне, зачастую более громоздки. Но в свою очередь они позволяют редактировать статьи в реальном времени не обращаясь к внешним приложениям для правки файла словаря (и не требуя таких процедур, как компиляция и декомпиляция словаря), позволяют вести совместную работу с материалами (чтение, поиск, (с некоторыми ограничениями и запись)). В целом программа позволяет создавать сравнительно более элегантные и привлекательные материалы, не ограниченные узким набором правил форматирования текста. // Пример переноса в модуль избранного материала с сайта (создание сборника (компиляция материалов)). В процессе используется текстовый процессор MS Word и автокликер Clickermann: http://www.youtube.com/watch?v=vi5glwa_uvM
  8. Поддержка продажи защищённых авторским правом модулей (то есть существует проверка лицензионности используемого материала).
  9. Настраиваемый в широких пределах мультиязычный интерфейс пользователя.
    • Есть возможность запуска нескольких окон с библейским, книжным или справочным материалом. Вкупе с возможностью запуска нескольких копий приложения на нескольких мониторах это позволяет выводить на мониторы очень большое количество информации по интересующей тематике. Хотя слабые возможности вывода аналитической информации и расширенного поиска в книжных окнах по состоянию на апрель 2013 года являются слабой стороной этой программы.
  10. Поддержка редактируемых внешними средствами скинов (Однако возможность изменения иконок отсутствует).
  11. Возможность гибкой замены, сохранения и восстановления рабочего пространства (расположение окон и панелей инструментов).
    • Можно использовать разные варианты стыкования соседних окон (докинг) или использовать «плавающие окна» без стыковки. Пример работы с рабочим пространством: http://www.youtube.com/watch?v=eXjC8rXSmnw
  12. Расширенные возможности по компоновке комментариев к Библии при выводе их на монитор.
    • При составлении русских комментариев их авторами чаще всего используются библейские тексты с такой разбивкой на стихи которая не совместима с Библией Короля Якова 1611 года (по которой и производиться выравнивание всех библейских текстов в TheWord). Кроме того некоторые комментарии имеют довольно размытые границы не привязанные к конкретным стихам, поэтому может потребоваться и разбивка и самих комментариев. Это приводит к необходимости прописывать оглавление комментариев практически вручную параллельно следя за соответствием теме в Писании. Учитывая все сказанное а также то что в полной Библии содержится порядка 32000 тысяч стихов, — создание модулей подключаемых комментариев на сегодняшний день является самой трудоёмкой частью работы модульмейкеров.
  13. Расширенные возможности по структуризации модулей в соответствии с тематикой или языком.
    • Для потребностей каталогизации материалов можно воссоздать всю древовидную структуру УДК. При этом каждое окно имеет «автономное самоуправление» в этом вопросе. Иными словами можно создать несколько каталогов (действует на все окна) и переключаться с одного виртуального каталога на другой в рамках отдельно открытого книжного окна не затрагивая работу с каталогами на других открытых книжных окнах).
  14. Отображение большого количества справочной информации к тексту Библии из баз данных на всплывающих окнах.
    • Формально программа поддерживает одновременную работу текста Библии с одним из модулей номеров Стронга на выбор но эту «проблему» удается решить с помощью регулярного выражения внедряемого в тело модуля переводящего определения Стронга из служебной категории в категорию словарную. Так как эта категория не имеет подобного ограничения на число словарей задействованных в поиске то становиться возможным подключить к работе сразу все словари с номерами Стронга[5]. Однако не желательно внедрять это выражение в модули в которых с помощью регулярных выражений была реализована подсветка и переключение разночтений между критическими изданиями (например Нового Завета Nestle Aland-а; Wescott-Hort-а или United Bible Societies (UBS)).
  15. Расширенная возможность лингвистического анализа библейских текстов.
  16. Возможность подстрочного перевода слов по наведению. Функция работает с Библиями и с подключенными к библейскому окну комментариями. В комментарий можно подставить любой текст для перевода. Можно использовать любые словари и книги подключенные к программе). Пример работы: http://www.youtube.com/watch?v=BacIH9_IVsI
  17. Режим сравнения библейских текстов (в котором есть несколько вариантов отображения информации).
  18. Расширенные возможности по форматированию библейских стихов при копировании. Можно также настроить вывод с использованием BbCode отдельного форума.
  19. Копирование стиха используя сразу несколько переводов Библий (что удобно например когда необходимо привести список существующих разночтений для определенного места в качестве довода).
  20. Унификация разбивки библейских текстов по стандарту King James Version (Библия короля Якова) издания 1611 года (KJV).
    • Примечание: Это весьма важная особенность программы. Дело в том что древний текст священных писаний не был разбит на главы и стихи. И очень часто наблюдается произвол переводчиков которые считают допустимым перекроить деление стихов в пределах глав для более удобного чтения. В результате сравнение переводов и аппарат ссылок к библейским местам может давать ошибки (надо заранее знать какой версией Библии пользовался автор приводивший ссылку на Писание). При создании Библейских модулей текст стихов подвергается согласованию. Это позволяет просто и удобно сравнивать переводы Библий на предмет разночтений. Список несоответствий между западным и восточным «стандартами» можно посмотреть например в статье «Библия» / «Библейский словарь» к русской канонической Библии. В. П. Вихлянцев. 1998.
  21. Поддержка перекрестных ссылок, а также сносок и примечаний сделанных переводчиками и издателями.
  22. Доступ к библейским стихам через два разных навигатора или через панель закладок.
  23. Мониторинг буфера обмена Windows с целью отображения текста опознанных ссылок.
  24. Извлечение перекрестных ссылок из Библий (текстовый формат) и компиляция их в модули перекрестных ссылок (формат баз данных).
  25. Формирование списков/коллекций стихов на любые определенные пользователем темы.
  26. Возможность просмотра факсимиле книг с автоматическим уменьшением страниц по ширине/высоте окна.
  27. Возможность сослаться на источник (на конкретный топик материала (это может быть словарная статья, глава книги, а для сканированных книг и конвертированных в изображения PDF и DjVu файлов это будет ссылка на конкретную страницу документа/книги. Также возможно создание ссылки-закладки на определенное место в топике (то есть на нужный участок текста). С первым и вторым типом ссылок будут работать всплывающие подсказки и переход (при клике))
  28. Расширенные настройки шрифтов для интерфейса:
    • Возможность зуммирования текста в любом из окон — будь то работа со словарем, книгой или с Библией. Тексты Библий настраиваются индивидуально. А книжные модули «по окну». Так например если были открыты 10 окон со словарями, — то при необходимости можно задать свои настроки размера для каждого из них (для изменения масштаба предусмотрено сочетание Ctrl + Прокрутка колеса мыши).
    • Возможность настройки масштаба для списка статей в словарях (актуальная проблема словарных оболочек для переводчиков работающих с иероглифами).
    • Поддержка символов Unicode. Данные в модулях храняться в формате RTF, и если необходима поддержка Unicode то символы кодируются с помощью escape последовательностей и проблем с отображением нужных символов (в том числе для составления поисковых запросов) в целом не возникает (при наличии нужных шрифтов). В этом отношении TheWord не имеет ограничений и принципиально отличается например от Lingvo — в которой реализована поддержка только для пары десятков языков (из более чем 6000 известных).
    • Стиль шрифта библейского модуля (размеры, гарнитура) можно настроить как на уровне настроек ПО, так и на уровне изменения тегов самого модуля. Для серьезных изменений (особенно в соответствии со стандартами разметки Библейских текстов типа en:Zefania XML) потребуется знание некоторых регулярных выражений.
  29. Поддерживается интеграция шрифта в словарные и книжные модули, — что отменяет необходимость их установки для каждого отдельного пользователя. Соответственно, — если не возникнет проблемы с глубинными языковыми настройками самой операционной системы, то вид отображения одних и тех же материалов на разных компьютерах будет идентичен.
  30. Поддержка планирования для годового цикла чтения религиозной литературы.
  31. Автоматическое обновление. В том числе проверка новых версий для уже установленных модулей, проверка новых и обновленных файлов локализации интерфейса, и выхода стабильного релиза для самой программы)
  32. Система отслеживания ошибок

Проблемы[править | править вики-текст]

По состоянию на первую половину 2014 года известны следующие недостатки:

  1. Проблема большого числа модулей. В конце октября 2013 года выяснилось что пограмма периодически отказывается работать с большим числом модулей под Windows (ориентировочно свыше 1000 модулей). Каждые несколько дней TheWord начинает проверку хэш сумм модулей и эта проверка заканчивается ошибкой связанной с тем что TheWord как 32-х битное приложение имеет ограничение в 2 Gb RAM на процесс (собственно это ограничение самой ОС семейства Windows). Это ограничение на некоторое время поставило в затруднительное положение развитие русской портативной сборки Prelude каталог которой содержал свыше 2000х тысяч материалов, в то время как программа безболезненно была способна запускаться и работать лишь с половиной доступных материалов. Решение этой проблемы было найдено случайно в начале мая 2014 года. Для обхода проблемы нужно применить 4 Gb patch от Daniel Pistelli © 2007 для исполняемого файла программы. После патча на платформах Windows с архитектурой 64 бита эта проблема отпадает напрочь. Она остается лишь на ОС с архитектурой 32 бита. Для ее решения (а оно связано лишь с необходимостью сверки хэш сумм модулей) потребуется запустить программу под управлением ОС Windows с архитектурой 64 бита и выключив программу дождаться ее исчезновения в диспетчере задач (процедура эта не быстрая). После чего можно вернутся для работы на ОС Windows с архитектурой 32 бита. Так что для работы с большими каталогами пользователь фактически должен иметь доступ к двум ОС Windows с разной разрядностью.
  2. Проблемы у сборок после beta 1361. Начиная с beta-версии 1362 (28 апреля 2013) программа идет с обновленным рендерингом. Переработка рендеринга может негативно сказываться на отображении некоторых материалов (в частности на конвертированных из под Lingvo). Сама ошибка в рендеринге неприятная, но не критична. Спустя примерно год, на апрель 2014 года она все еще не была исправлена.
  3. Проблемы с отменой действий для плавающих окон. У beta версии 1361 этой проблемы еще нет, видимо она появилась в поздних beta-х. Возможно даже с 1362. На пристыкованных окнах эта проблема не наблюдается. Начиная с 1409 эта проблема можно сказать решилась с переездом панели форматирования непосредственно на плавающие окна. Хотя такой способ решения проблемы привнес перегруженность интерфейса управления книжного окна (открытых для редактирования модулей). Если окно не активно (= не выделено, = не в фокусе) то панель форматирования скрывается автоматически.
  4. Поддержка пакетов аудио файлов для словарей. Программа не имеет своего модуля для работы с аудио или видео. Невозможно внедрять аудиофайлы непосредственно в модули. Хотя можно создать словарь со ссылками на отдельные файлы любого формата, но такие ссылки будет открывать внешнее приложение. Самый большой недостаток связанный конкретно с аудио — хранение большого числа небольших аудиофайлов в папке приложения. Та же самая проблема например отсутствует в .LSD (скомпилированных) словарях Lingvo.
  5. Проблема расширения словарных баз: Отсутствуют простые конвертеры для популярных форматов словарей что несколько ограничивает потенциал программы и её использование за узкими рамками религиозной сферы. Хотя в первой четверти 2012 года на языке Ruby был написан конвертер для DSL словарей Lingvo но позднее выявились недостатки этой технологии и сотрудничество с программистом прервалось. К началу 2013 года был разработан другой техпроцесс переноса словарей Lingvo на платформу TheWord в котором используются такие программы пакетной обработки как UltraEdit, TextPipe, PowerGrep. Хотя этот процесс имеет гораздо больше преимуществ по части качества, но он слишком трудоемок и относительно сложен для массового использования и предусматривает большое число «ручных» операций. По своей сути это процесс конвертации словарей в формат HTML с последующей резкой, переименованием и импортом в sqlite с помощью ImporterTool (конвертация в RTF в этом процессе не производиться).
  6. Не очень удачная реализация поиска слова по словарям с использованием режима всплывающих окон. Программа ограничивает число найденных статей первой попавшейся. Так что если в словаре есть 20 статей содержащих слово «Аарон» то вполне возможно что программа отобразит не того Аарона которого вы искали исследуя текст Библии. Если бы поиск ограничивался строгим результатом 1 к 1 отсекавшим статьи содержащие более одного слова то этой проблемы не существовало. Ограничение «до первой попавшейся» вероятно связано с тем что в словарях могут встречаться сотни статей содержащие то или иное слово или часть речи.
  7. Программная оболочка настройками по умолчанию несколько затрудняет отображение символов Unicode при составлении поисковых запросов. Для возможности ввода символов на разных языках мира в окне поиска потребуется установить Unicode шрифт для интерфейса — это делается правкой 5-й строки языкового файла (файла локализации) в любом текстовом редакторе. Как вариант: font=Arial Unicode MS или font=Universalia). Сам шрифт устанавливать в систему не обязательно — достаточно его скопировать в папку TheWord (официально рекомендуемая — папка «Cache», но для портативных сборок можно использовать любую папку. Также изменение шрифта повлияет и на основной шрифт модуля созданного с помощью инструмента импорта Importer Tool). Этот шрифт можно виртуально заменить настройкой модуля и самой программы.
  8. Проблема ссылок в Unicode. Существует проблема работоспособности ссылок, если они содержат в окончании пути символы Unicode — например японские иероглифы. Для символа «ключ 10» имеющего начертание такая ссылка будет иметь вид (например): tw://[self]?t=儿 Ссылка будет отображаться и будет менять вид курсора при наведении, но не будет реагировать на клик мыши. Эта проблема может быть актуальна при конвертации китайских, японских и других словарей, в частности, из-под Lingvo. При ручном вводе ссылки такая проблема не наблюдается.
  9. Проблема смены шрифта. Существует проблема не желательности смены шрифта в книжных окнах для некоторых материалов. После некоторых шрифтов текст может оказаться не читаемым даже при возврате к родному шрифту. Хотя эта проблема устраняется кнопкой отмены, — но помогает это только в том случае если еще не был сделан переход на другой топик, иначе изменения запишутся в базу данных, а история отмен будет автоматически очищена.

Общая картина, связанная с развитием TheWord к середине сентября 2012 года[править | править вики-текст]

Англоязычное направление — некоторые проблемы связанные с отсутствием координации действий.[править | править вики-текст]

Исходный код программы закрыт и это в принципе говорит о том что программа развивается централизованно. Совсем иная картина с модулями к программе. Костас Стержо публикует далеко не все материалы доступные к TheWord на официальном сайте. Для этого существует множество причин. Одна из них — риск нарушения авторских прав. Другая причина в занятости. Эти и другие причины привели к тому что сегодня большая часть англоязычных материалов разбросана на таких файлообменниках как 4shared. Судя по всему в англоязычном направлении не существовало жесткой директивной концепции развития которая бы могла сформировать централизованный подход по ряду вопросов которые в настоящее время превратились в наболевшие проблемы для пользователей. Прежде всего отсутствовало соглашение о названии имен файлов между разработчиками (для новых материалов и обновлений) что привело к появлению дубликатов под схожими именами. На одном сервере может лежать по сути тот же самый материал что и на другом но только более старый. Может также встречаться один и тот же материал под разными названиями. Причем у многих модулей даже не заполнены внутренние информационные поля которые позволяют определить: название оригинального материала, название на языке оригинала, автора, год издания, номер издания, издателя, версию модуля, создателя модуля, редактора модуля, разного рода примечания и описания. Более-менее точное идентифицирование таких неподписанных материалов может занимать довольно много времени что создает серьёзные неудобства пользователям.

Первого марта 2012 года на англоязычном под форуме было сделано анонсирование открытия нового не официального ресурса с «говорящим» названием www.wordmodules.com (посвященного модулям к TheWord). Вполне возможно что его появление со временем положит конец царящему хаосу, хотя бы частично. Однако если начальные ожидания не оправдаются, то ситуация может стать ещё более запутанной.[6]

Первые шаги TheWord в русском направлении[править | править вики-текст]

К началу 2011 года на официальной странице загрузок и на сайтах сторонних разработчиков было доступно более 700 модулей к программе, большая часть из которых была на английском языке. Русская локализация программы (работа над которой шла в течение порядка 20 дней) была по существу закончена 9-го декабря 2010 года. Практически одновременно (с ноября 2010-го года), на недавно открывшемся официальном русскоязычном подфоруме программы[7] стали появляться первые русскоязычные модули созданные усилиями энтузиастов. До этого времени к программе прилагался только один русскоязычный модуль, — модуль Русского Синодального Перевода (RST) из-за чего программа была малопригодна для использования широкой русскоязычной аудиторией.

К середине 2011 года число только русских переводов Библий к этой программе превышало десяток, не говоря уже о словарях, и прочих книжных модулях.

  • С октября 2011 года резко увеличилось число книжных модулей с объёмными словарями (содержащими от 5 до 85 тысяч статей) что стало возможным благодаря освоению и широкому использованию разных программ по автоматизации процессов (среди которых «Clickermann», «ABC Amber Text Converter», «TextPipe» и «Offline Explorer».
  • В начале января 2012 года общее число доступных модулей превышало 80. Но эта цифра практически моментально удвоилась за счет того что буквально за три дня в формат TWM были конвертированы более 40 модулей словарей от небольшой и малоизвестной программы Interpretatio (которая с 2010 года не подавала признаков развития). Общий объём перенесенных статей составлял более 876 тысяч. При этом некоторые словари решено было не публиковать по этическим соображениям (в частности «Словарь воровского жаргона» и «Словарь матерных слов и выражений»).

Резкое увеличение числа словарных баз данных фактически сделало программу The Word одной из самых крупных программ по работе со словарями и энциклопедиями в русскоязычном языковом пространстве. Кроме того стало ясно что программа TheWord может быть перспективной в качестве платформы для накопления материалов энциклопедического характера. А сам формат .twm в перспективе может стать таким же востребованным как .PDF или MS Word. Хотя ещё очень многое зависит от масштабов реализации поддержки этого формата. Например возможность печати различных документов в формат TWM или же конвертация.

Преимуществом программы является лёгкость, с которой можно создать для себя небольшой словарик (несколько тысяч статей) насыщенный графикой, таблицами, стилями шрифтов, регистром, формулами, — с помощью Importer Tool или автокликера. Хотя могут встречаться и исключения (положительные и отрицательные), особенно с большими словарями и со словарями с имена статей которых могут представлять сложность на этапах обработки (в случае их переноса в имена файлов на жестком диске, что бывает необходимо при использовании Importer Tool). Кроме того инструментарий и схемы разработанные под (упомянутую выше) Lingvo хоть и требуют гораздо большей квалификации в работе, но они в свою очередь пока ещё позволяют обходить гораздо больше технических проблем, связанных с извлечением нужной информации и проблем по её конвертации.

В конце мая 2012 года в формат TheWord была конвертирована небольшая часть (около 250) словарей в формате DSL, доступных к программе Abbyy Lingvo. Работа по написанию программы-обработчика, и его тестирование заняли примерно три месяца (с марта по май 2012 года). Особенностью обработки стала возможность автоматического заполнения многочисленных информационных полей, предназначенных для описания модулей — пожалуй, самая трудоёмкая проблема, с которой можно было бы столкнуться в процессе работы по конвертации словарей. При конвертации не удалось сохранить многочисленные особенности форматирования статей. В течение нескольких месяцев собирался пользовательский материал из различных источников (около 20), и общее число словарей под Lingvo подлежащих пересмотру для возможной последующей конвертации в июле 2012 года составляло более 3000.

В целом словари в формате Lingvo LSD занимают меньший объём, так как основу их составляет сжатый текстовый файл с XML форматированием. В то же самое время файл словаря в формате TheWord также является текстовым но сама карточка, даже пустая занимает примерно 1 кб места, чисто по техническим причинам. Это впрочем заметно влияет только на размер очень больших словарей с сотнями тысяч статей с маленьким содержанием которые очень плохо поддаются сжатию средствами программы.

  • Помимо того, что программа предоставляет конечным пользователям кроссплатформенную универсальную оболочку для работы со словарями и энциклопедиями, она также облегчает задачи по созданию энциклопедий для разработчиков. Фактически стадия разработки оболочки не нужна — достаточно иметь только информационные данные в формате более менее пригодном для конвертации. Это обстоятельство упрощает процесс по созданию новых энциклопедических материалов (не требующих динамического обновления).
  • Внутренними средствами программы накапливаемая информация может принимать разные структурные формы (что реализовано за счет инструмента создания категорий). Это например позволяет исключать из поля зрения пользователя не нужные ему энциклопедические данные и заодно уменьшает время на обработку поисковых запросов.
  • Периодически по мере появления новых библейских модулей к TheWord идёт процесс по конвертации их для программы «mySword»[8] работающую на платформе Android. Эта операционная система широко используется в коммуникаторах и планшетных компьютерах.

Централизм в русском направлении[править | править вики-текст]

Если в англоязычном направлении на протяжении многих лет вплоть до 2012 года наблюдался хаос в плане систематизации модулей то русскому сообществу модульмейкеров в течение первого года своей работы удавалось избегать этой проблемы, Но произошло это не благодаря малочисленности и согласию внутри группы разработчиков, а благодаря тому обстоятельству что новые модули и обновления публикуются в основном одним человеком в составе настроенной портативной сборки на торрент-трекерах с высокой степенью посещаемости, на которых уже сформировалась своеобразная «группа русскоязычных подписчиков».

К слову проблема запущенности структурно-тематического характера и каталогизации опубликованных некогда материалов характерна не только для англоязычного направления TheWord, — в частности схожие проблемы имеются с пользовательскими словарями Abbyy Lingvo, которые сейчас в основном разрабатываются «Lingvo сообществом» Руборда которое также пытается их решить и для этого даже создало определенный свод правил для разработчиков. Однако, несмотря на то что такие правила были приняты и в принципе соблюдаются уже не один год, к началу марта 2012 на Руборде отсутствует удобная систематизация ресурсов по языковым и тематическим направлениям. И эта болезненная ситуация в 2012 году вызывала определенные опасения за судьбу русского направления TheWord у которого к марту 2012 года по большому счету не было ни официального сайта русских разработчиков, ни жестких правил оформления и анонсирования. Хотя в этих направлениях велись определенные работы и были намечены определенные цели. К марту 2012 года также не было и элементарной справочной системы по часто задаваемым вопросам (FAQ) для модульмейкеров не говоря уже о справочной системе на базе MediaWiki. FTP-сервера для архивного хранения и синхронизации измененных ресурсов к марту 2012 года также не было создано. Поэтому распространение программы во многом зависит от наличия сидов на торрент-треккере. Что касается создания HTTP сервера для ведения совместной работы с документами (на базе SharePoint) то даже обсуждения на эту тему практически не велись в связи с отсутствием экономических возможностей для комплексной реализации намеченного.

В августе 2012 года были созданы первые два русских модуля Библий более полно использовавшие возможности программы, связанные с разметкой библейских текстов. В частности впервые появились:

  • Сноски (примечания переводчиков),
  • Разбивка текстов сделанная переводчиками.
  • Выделение слов Иисуса заданным цветом.
  • Расширенная поддержка заголовков книг.

В это же время была произведена частичная огласовка Библий на русском языке. Правда большинство модулей при этом без ёфикации. Была сделана первая удачная попытка создать модуль который показывал бы мельчайшие отличия между родственными переводами. В частности между Синодальным переводом в ревизии 1988 года и ревизией 2000 года христианской миссии Свет на Востоке «Юбилейное издание».

Удалось создать также ряд английских Библий со сложной разметкой библейских текстов. Примечательно то что это сделал один из русских разработчиков модулей. Так как в английском направлении у многих из них не было достойных аналогов по степени реализации возможностей. За счёт этих модулей была увеличена база модуля перекрестных ссылок программы — что значительно расширило возможности программы по отслеживанию связей между библейскими стихами.

Версии и разработка программы[править | править вики-текст]

Официальные стабильные релизы TheWord выходят крайне редко в частности официальный релиз под номером 3.2.1.1167 опубликованный 3-го февраля 2011 года не был обновлен и спустя год в 2012 году. Однако существует страница загрузки бета-версий[9] которая по большому счету может компенсировать желание пользователя работать с последней версией программы. В частности в начале марта 2012 года был доступен бета-релиз под номером 3.2.1.1258 номер и дата выхода которого по сути означают что в течение года с момента официального релиза было опубликовано порядка 90 бета-версий каждая из которых содержала одно или несколько изменений, включая новые функции, баг-фиксы или откат. (Смотрите также: Стадии разработки программного обеспечения)

Примечание: Как правило в скачиваемую бета-версию входит только исполняемый файл программы (theword.exe) и очень редко обновляемый языковой (англоязычный) файл (english.lng) которые надо просто скопировать в директорию с установленной программой. Таким образом переустановка большинства компонентов приложения при обновлении не требуется. Так как программа имеет очень большое количество опций и настроек то быть может не будет лишним отметить и тот плюс программы что при обновлении она сохраняет уже существующие настройки (в том числе при обновлении с помощью инсталлятора стабильного релиза). Также в пакет бета-версии входит и чисто информационный файл changelog.txt со списком изменений от версии к версии, — начиная с сравнительно поздней версии 3.0.1.866. К началу июня 2013 года этот файл насчитывал 1116 строк). (Смотрите также: Журнализация изменений проекта).

Портативная версия The Word[править | править вики-текст]

Установщик портативной версии (с возможностью установки программы на USB-Flash) включается в основной установщик версии 3.0, который содержит в себе опцию установки «Portable». Ограничений по сравнению с базовой версией не имеет. Некоторое время назад портативная сборка «The Word» распространялась только в качестве специального бонуса для меценатов.

Вероятно в будущем с ростом числа доступных материалов TheWord будет распространяться в основном готовыми портативными сборками позволяющими сократить время на настройку и подготовку к работе. Состав сборок может быть изначально ограничен представлениями их создателей о том что должно входить в сборку и для каких целей. Прежде всего это какие-то личные религиозные взгляды и профессиональная ориентация на какую-то отдельную сферу знаний. Можно например создать сборку заточенную на эзотерику, магию и гадания от которой будут «шарахаться» религиозные круги.

В русском направлении единственный активный проект на начало мая 2013 года — сборка под названием Prelude. Собственно имя Prelude сборка получила только после 23-го обновления, что бы стало ясно что это один из возможных проектов такого рода. Объём этой сборки — около 910 материалов с общим объёмом в 45 гигабайт. Помимо большого числа собственных наработок в неё входит и некоторое число материалов с ограниченного числа англоязычных сайтов занимающихся разработкой и распространением модулей для TheWord. Поскольку TheWord практически не предлагает какой то модели централизованного обновления то в ходе эволюции русской сборки была предусмотрена некая модель позволяющая увидеть «производителя» модуля.

Так как в англоязычном сегменте зачастую имена файлов мало о чём говорят то в результате некоторой унификации и стандартизации пришлось изменить и имена файлов на более информативные. Помимо всего прочего отмечаются даты вкючения материалов в состав сборки для возможности оценить необходимость обновления того или иного материала. Такие «ревизии» происходят не часто и как правило включают в себя далеко не все группы модулей из доступных к свободному скачиванию. Хотя необходимость этого уже давно назрела и перезрела, но реализации возможности включения разных прочих материалов препятствует слабое представление о том что они из себя представляют и насколько в принципе могут быть интересны для серьезного, качественного (по мнению автора Prelude) развития. На решение этой проблемы нужны довольно большие аналитические усилия.

С мая 2013 года в русской Portable сборке была решена проблема избыточности материалов, то есть стало возможно за считанные секунды отключить из загрузки целые тематические каталоги (состоящие из потенциально ненужных конкретному пользователю материалов).

Инструмент импорта «Importer Tool»[править | править вики-текст]

Этот небольшой (размером около 1,5 Мб) и не требующий инсталляции инструмент используется для импорта разного рода публичных ресурсов находящихся в различных форматах для того что бы использовать их непосредственно в «The Word». С течением времени он также развивается и прибавляет в функционале. Например «Importer Tool» позволяет пакетно импортировать файлы в формате RTF вместе с подпапками. В процессе конвертации названия файлов конвертируются в заголовки тем а содержание файлов в содержание тем. Структура подпапок после импорта также сохраняется, — она конвертируется в раскрывающиеся списки тем. Форматирование и стили текста (размеры шрифтов, отступы, цвета) в процессе импорта программа в целом не изменяет. В создаваемый модуль внедряются также и шрифты используемые в документе. Также «Importer Tool» позволяет пакетно импортировать и графические файлы с разных носителей с сохранением в модуле древовидной структуры подпапок что в целом позволяет быстро переносить PDF или DjVu файлы в графическом формате. Процесс конвертации RTF и графических файлов отличается простотой и как правило не занимает много времени. Программа поддерживает импорт файлов с именами на иврите и других языках. Хотя на самом деле гораздо большую проблему представляет обработка таких файлов перед импортом. Дело в том что ни один программный, пакетный RTF конвертер из опробованных в ходе работ по конвертации словарей на может увидеть названия html файлов на языках оличающихся от европейских. Возможно конечно в этой проблеме играют роль и региональные настройки операционных систем.

Иногда с помощью Importer Tool можно получить вполне удовлетворительный результат минуя процесс конвертации HTML в RTF но это касается только очень простых по своей структуре HTML файлов. Как правило там где есть сложный дизайн HTML страниц прямой их импорт дает отрицательный результат. Пример работы: http://www.youtube.com/watch?v=6UTjdyIIQoY импорт скачанной в формате HTML базы данных по словарям Lingvo с сайта lingvodics.com.

В марте 2013 года после того как были созданы пять сотен новых модулей на основе импорта HTML страниц через Importer Tool, в этой утилите появилась важная возможность создания имени топика с помощью прочтения информации между двух заданных тегов лежащих в пределах одной строки (в UTF-8). Это обстоятельство может существенно упростить конвертацию многочисленных онлайновых словарей по большей части основой для которых сегодня служит формат HTML. Как правило в web-словарях одна статья располагается на одной странице а тег TITLE либо H1 содержит в себе название статьи. Поэтому скачав страницы онлайнового словаря на диск и «скормив» его этой программе на выходе можно получить готовый словарь. Хотя всё же на практике останется проблема борьбы с «допечатной подготовкой» в виде борьбы с рекламой и прочими ненужными элементами страницы если при скачивании не пользоваться парсерами контента (типа Content Downloader). Есть также некоторые проблемы с импортом картинок. Так, иллюстрация если не была внедрена в тело файла будет лежать отдельно. И ссылки на иллюстрации таким образом надо менять (как правило с помощью регулярных выражений). Но в целом для удобства импорта материалов формата HTML с картинками желательна их конвертация в RTF. Исключения из этого правила редки, касаются разве что только словарей.

Также «Importer Tool» позволяет преобразовывать в формат TWM (фактически форматом является база данных SQLite) и модули от некоторых других библейских программ, например: «Unbound Bible», «Zefania XML», «E-Sword» (поддерживается импорт только не защищенных паролем модулей). Примеры того, как при помощи инструмента «Importer Tool» можно преобразовать модули можно увидеть на сайте DoctorDaveT.com[10]. Формат файлов этого модуля является открытым, документация и спецификации доступны на официальном сайте.

В ареле 2014 года ради интереса была произведена попытка пакетной конвертации книг формата FB2 по религиозной тематике из библиотеки Флибуста. Удалось импортировать более 3000 книг в один модуль. Использовались фактически файлы формата HTML (конвертированные из FB2 в Calibre). Сами FB2 были скачаны из Flibusta с помощью MyHomeLib. В ходе конвертации HTML проблему вызвали лишь два файла из всей коллекции (с большим для HTML объемом). Похоже Importer Tool не способна конвертировать (обработать) большие HTML файлы. Точная граница критичного объема файла не была выяснена, - она лежит где-то в районе от 11 до 30 Мб. Но и 11 Мб достаточно для импорта абсолютного большинства материалов. В остальных случаях материал придется делить на части.

В Importer Tool иногда происходят заметные изменения. В сборках 72 и 73 заметно отличается рендеринг. Хотя в целом 73 выглядит предпочтительнее, но в ней уже не подхватывается шрифт прописанный в первых строках языкового (.lng) файла TheWord.

«theWord Library Manager»[править | править вики-текст]

Утилита (о которой стало известно в конце июля 2013 года) позволяющая быстро анализировать и изменять некоторые свойства модулей. Была создана сторонним разработчиком Jerry в ответ на нежелание Костаса создать аналогичный инструмент внутри программы для решения специфических задач узкого круга российских модульмейкеров. Надо сказать возможности этой программы превзошли начальные пожелания, а само её появление стало неожиданным подарком упрощающим ведение работ по расширению русской портативной сборки. К сожалению у программы был выявлен один существенный недостаток - она удаляет картинки из тем (= статей, = карточек) модуля если в этих темах нет текста. Тоже самое характерно и для другого инструмента - twModUtils от Jerry.

«twModUtils»[править | править вики-текст]

Утилита для изменения стиля шрифта в модуле. В отличии от Importer Tool гораздо удобнее, но (как выяснилось в ходе использования) имеет один недостаток - она стирает картинки из (= статей, = карточек) модуля если в этих темах нет текста. Так что карточки с картинками будут открываться, но уже будут пустыми. Впрочем если заранее известно что в модуле нет лежащих отдельно иллюстраций то она все еще актуальна.

«SQLite Regexer»[править | править вики-текст]

Программа созданная для поиска и замены при помощи регулярных выражений в базах данных SQLite с учетом узкой специфики таких программ как TheWord и eSword (форматы *.cmtx, *.dctx, *.twm, …). Работает с несжатыми модулями контент которых находиться в формате RTF. Автор Jerry.

Горячие клавиши[править | править вики-текст]

Сочетание клавиш в программе которые отсутствуют в хинтах:

  • CTRL+SHIFT+L - Перезагружает языковой файл (удобно при внесении правок, - не надо перезапускать саму программу).
  • CTRL+SHIFT+S - Обновляет последний использовавшийся рабочий стол.
  • CTRL+SHIFT+U - Открывает и закрывает модуль.
  • CTRL+ALT+SHIFT+D - Удаление топика модуля без предупреждения
  • CTRL+SHIFT Автоматически детектирует ссылки на библейские стихи в текущем окне
  • CTRL+ALT+SHIFT+Insert - Выдает подсказку о номере строки к текущему стиху Библии.
  • CTRL+SHIFT+R - Перезагружает файл библейского модуля (удобно при внесении правок, - не надо перезапускать саму программу). Может быть изменена с помощью свойства bible.module.reload.hot.key (значение по умолчанию — 86, соответствующее значению ascii «R»)
  • CTRL+ цифры 0-9 - перемещает на соответствующий номер панели закладок (с цифровой клавиатурой на работает)
  • Зажатая правая клавиша мыши заменяет нажатую Shift - для получения контроля над всплывающими окнами (удерживает от закрытия).

Примечания[править | править вики-текст]