к библиотеке   4GL   к обработке текстовой информации   к алгоритмизации

Обработка текстовой информации

Обработка документов средствами текстовых процессоров

Основные понятия и характеристики текстовых процессоров

Сейчас работа с текстовыми документами производится при помощи персональных компьютеров, что является удобным и надежным методом. Программное обеспечение, предназначенное для обработки документов с помощью компьютера; условно разделяют на две категории: текстовые редакторы и текстовые процессоры. Формально будем различать их следующим образом.
Текстовые редакторы представляют собой простейшие программы, предназначенные для самого примитивного редактирования текста. Как правило, они не имеют развитых средств форматирования. Классическим примером текстового редактора является, например, уже упоминавшийся ранее Windows Notepad. Текстовые процессоры содержат гораздо более развитые средства создания и оформления документов. В качестве примеров рассмотрим наиболее широко применяемые на данный момент в мировой практике, и особенно в российской экономической науке, текстовые процессоры.
Если говорить об общемировой практике, то основными инструментами для подготовки текстовых документов являются процессоры Word компании Microsoft; Word Perfect фирмы Corel; а также пакет StarOffice, разработанный немецкой компанией StarDivision GMBH.
Word Perfect - широко распространенный ранее на Западе текстовый процессор. Во многих небольших офисах он использовался для решения практически всех задач. Для поклонников Word Perfect самое знаменательное событие - появление комплекта Word Perfect Office 2000, представляющего собой модернизацию Word Perfect 8. Радикальной перестройки фирма Corel не планирует, однако собирается дополнить его приложением Trellix для работы с документами в Web. Trellix превращает документы WordPerfect в привлекательно выглядящие Web-страницы, автоматически снабжая их шрифтами, цветом и навигационными кнопками, позволяющими разбивать длинные документы на удобные для работы части. Пользователям, которые создают технически сложные документы, понравятся и некоторые другие усовершенствования, в том числе возможность оперативного перехода на такие элементы, как таблицы или примечания внутри документа. Бесспорным плюсом является наличие функции RealTimePreview, которая в удобной форме показывает, как те или иные предполагаемые изменения шрифтов, выравнивания и других параметров форматирования могут повлиять на внешний вид документа.
Остальные функции помогают наладить взаимодействие между продуктами Microsoft и Corel. Пользователи WordPerfect смогут работать с расширением Word (*.doc), как с установленным по умолчанию собственным форматом файлов. По заверению фирмы Corel, приложения ее комплекса будут также с высокой степенью надежности импортировать файлы из соответствующих разделов MS Office.
Разработчики StarOffice не выделяют, как таковой, текстовый процессор, а рассматривают весь пакет в комплексе. В последнее время ведется довольно активное обсуждение пакета StarOffice, особенно в связи с операционной системой Linux. Многим кажется, что именно такого продукта не хватало долгое время ОС Linux для того, чтобы наконец утвердиться на рабочем столе экономиста, бухгалтера или секретаря и распространиться по всем компьютерам в офисах многочисленных мелких фирм по всему миру. StarOffice хвалят за сходство с MS Office, за то, что разработчики честно стали использовать фактический стандарт вместо того, чтобы обременить мир еще одним. Это полный стандартный набор программ для офиса, совместимый с большим числом различных форматов документов, включая (начиная с версии 5.0) и формат MS Word 2000.
По замыслу разработчиков, пакет StarOffice должен содержать практически все, что может потребоваться в повседневной работе на компьютере. В него входят диспетчер файлов StarDesktop, текстовый редактор StarWriter, редактор Web-страниц и по совместительству Web-броузер StarWriter / Web, электронная таблица StarCalc, база данных StarBase, редактор диаграмм StarChart, графический редактор Starlmage, редактор презентаций Starlmpress, программы работы с электронной почтой и новостями StarMail и StarDiscussion. Начиная с версии 4.0, все Компоненты пакета интегрированы в единую большую программу.
Встроенная поддержка русского языка в StarOffice 5.0 - последней версии - не предусмотрена. Однако StarCalc, Starlmage, StarWriter и StarMail поддаются некоторому подобию русификации. Для этого необходимо русифицировать среду работы StarOffice - графическую среду X Window операционной системы Unix, что зачастую является непростой задачей. Также не имеется важных элементов поддержки русификации: проверки грамматики, орфографии и пр. Поэтому в настоящее время в России этот текстовый редактор, как и остальные приложения StarOffice 5.0, практически не распространен.

5.2.2. Microsoft Word 2000 и его новые национальные возможности
Word 2000 является наиболее часто используемым в нашей стране текстовым процессором, поскольку представляет собой приложение MS Office 2000 - разработки компании Microsoft, проводящей политику активного внедрения своих, продуктов в России за счет поддержки русского языка и создания русифицированнных версий. В ноябре 1992 г. компания открыла представительство по странам СНГ, в задачи которого входят развитие рынка программного обеспечения на территории бывшего СССР, а также внедрение и локализация новейших технологий.
Справедливости ради, надо отметить, что MS Word является самым популярным текстовым редактором не только в среде MS Windows, но и в среде операционной системы MacOS на компьютерах фирмы Apple, хотя для российского пользователя этот факт представляет исключительно теоретический интерес.
Первые версии MS Word появились в середине 80-х годов. В то время этот текстовый процессор работал в среде MS DOS. Последняя DOS-версия этого продукта носила номер 5.0 и могла работать в графическом режиме. Первая Windows-версия появилась с выходом Windows 3.0. Долгое время MS Word находился "в тени" Word Perfect, но с выпуском версии 6.5 этот текстовый процессор занял лидирующее положение на рынке. Все Windows-версии этого продукта отличаются хорошей интеграцией с операционной средой и другими продуктами MS Office - пакетом офисных программ Microsoft. Начиная с 1995 года, все версии MS Word являются 32-битными приложениями. Версия 7.0 (Word 95) была первым текстовым процессором, который полностью использовал возможности новой ОС. Следующая версия, 8.0, имела ряд улучшений, основными из которых были усовершенствованные средства интеграции и настройки, а также новый формат файлов DOC. Также там впервые появилась возможность работы с форматом HTML, что позднее стало приобретать все большую важность. Microsoft Word 2000 с самого начала разрабатывался как инструмент, с помощью которого пользователи в любой стране мира могли бы легко и просто создавать не только обычные печатные документы, но и сообщения электронной почты, а также документы для публикации в World Wide Web. HTML выбран в Word 2000 в качестве одного из основных форматов создаваемых файлов, что способствует дальнейшему закреплению ведущего положения этого приложения в области создания Web-документов и сообщений электронной почты.
По сравнению с предыдущими версиями Word 2000 имеет также ряд преимуществ, носящих не столь радикальный характер: улучшенные средства автоматической проверки орфографии, табличные и графические инструменты, значительно модернизированый Web-инструментарий. Некоторые из новшеств не очень приглянулись давним пользователям MS Word, хорошо освоившим особенности предыдущей версии, но это, скорее, вопрос вкуса и привычки. В любом случае, для тех, кто уже знаком с MS Word, нововведения должны быть интересны, поэтому далее мы рассмотрим основные привнесенные изменения.
Новые возможности Word 2000 по сравнению с предыдущими версиями
HTML как равноправный формат хранения файлов. Все имеющиеся в Word функции и средства (за исключением возможности создания версий документа и использования паролей) сохраняют свое действие после преобразований из формата Word DOC в формат HTML и обратно. Это означает, что Word 2000 предоставляет пользователям возможность создавать документы в формате Word, сохранять их в формате HTML и снова открывать в Word, используя для их обработки все функции, доступные в Word.
Принцип "Click-n-Type" ("Щелкнуть и ввести"). Пользователи могут начинать вводить текст в любом месте страницы, предварительно поместив туда курсор и дважды щелкнув кнопкой мыши. Эта функция упрощает разметку сложных документов.
Функция "Собрать и вставить". Пользователи могут скопировать в буфер обмена MS Office до 12 блоков информации, каждый из которых затем можно будет в произвольном порядке вставить нужное число раз в любой документ MS Office. Эта новая функция упрощает сбор информации, полученной из различных источников.
Система настраиваемых меню. В меню отображаются теперь только те функции и команды, с которыми пользователи работают наиболее часто. Меню можно легко развернуть, отобразив в них весь список команд; кроме того, развертывание меню может производиться автоматически в соответствии с правилами технологии. По идее, меню, подстраивающиеся к нуждам пользователя, должны способствовать устранению неразберихи, однако в данном случае это как раз тот вариант, когда вы можете быть еще больше сбиты с толку, - особенно это почувствуют пользователи, привыкшие к старой (и все еще действующей) системе Office-меню.
Темы создаются и согласовываются между приложениями Word и Microsoft FrontPage, последнее из которых является специализированным средством создания и управления Web-узлами. Благодаря этому упрощается создание и редактирование с помощью Word и FrontPage согласованных по внешнему виду Web-страниц.
Автоматическое определение языка. Благодаря автоматическому определению зыка, на котором пользователь производит ввод текста, в Word 2000 правильно осуществляется выбор средств проверки орфографии и грамматики, списка автозамены и других инструментов проверки правописания. Кроме того, были несколько скорректированы задаваемые вручную языковые настройки, что сделало их более доступными и удобными в работе.
Помимо совершенно новых функций, в Word 2000 были расширены и улучшены некоторые имевшиеся до этого в MS Word возможности.

Word 2000: усовершенствованные возможности
Web-страниц. В Word 2000 пользователи могут легко создавать профессионально оформленные Web-страницы и многостраничные Web-узлы при помощи специального мастера.
Предварительный просмотр Web-страниц. В процессе работы в Word 2000 можно просматривать Web-страницы в используемом по умолчанию броузере даже без их предварительного сохранения.
Оглавление. В Word 2000 генерация оглавлений может выполняться автоматически с использованием нескольких параметров, позволяющих работать в режиме интерактивного просмотра, в том числе с использованием рамок.
Гиперссылки. Word 2000 имеет усовершенствованный интерфейс гиперссылок, облегчающий создание, удаление и редактирование гиперссылок в документах.
Таблицы. Теперь поддерживаются вложенные таблицы (таблицы, размещаемые внутри ячеек таблицы), перемещаемые таблицы (текст в этом случае обтекает таблицу), размещение таблиц в любом месте страницы (в том числе друг рядом с другом) и объединение строк заголовка (строки заголовка должны включать в себя первую строку таблицы). Пользователи могут применять функцию обтекания текста вокруг графических изображений, находящихся внутри ячейки таблицы. Графические объекты Word 2000, размещенные внутри ячейки таблицы или же вне ее, обладают одинаковыми свойствами.
HTML-форматирование таблиц. В Word 2000 поддерживаются HTML-параметры форматирования таблиц, включая возможность создания вложенных таблиц, использование функции автоподбора, перемещение таблицы в любое место страницы, задание интервалов между ячейками и способа заполнения ячеек и правильное оформление трехмерных границ в формате HTML.

Новые возможности автозамены

В предыдущих версиях приложения Word исправление ошибок в написании слов с помощью функции автозамены проводилось на базе использования специального списка. Теперь функция автозамены может по ходу дела исправлять и те явные ошибки в написании слов, которые не указаны в списке для автозамены.

Средства проверки орфографии и грамматики

В Word 2000 / Word XP оба этих популярных средства поверки правописания получили дальнейшее развитие благодаря добавлению новых слов в словарь, совершенствованию логики предлагаемых вариантов замены и уменьшению числа "ложных" флагов грамматических ошибок.

Средства расширения функциональных возможностей Word. Макросы

Текстовый процессор MS Word всегда отличался большим количеством функций и, главное, мощными возможностями настройки. Встроенный в текстовый процессор язык программирования VBA (Visual Basic for Applications) помогает довольно сильно расширить потенциал этого продукта за счет написания макросов - сценариев, позволяющих автоматизировать многие операции. Активизировать написание макроса можно через меню Сервис > Макрос (рис. 5.5).

Рис. 5.5. Работа с макросами в среде MS Word

Использование макросов создает огромные функциональные возможности, но может представлять и потенциальную опасность. Использование VBA для создания макросов в Word и других приложениях MS Office позволяет:
-автоматизировать выполнение часто повторяющихся сложных операций;
-производить интеграцию между различными программными продуктами;
-настроить Word для редактирования специальным образом оформленных текстов.
Процессор Word способен сохранять макросы внутри документа, а при открытии или закрытии файла автоматически запускать их. Однако здесь есть один очень серьезный недостаток - с макросами могут распространяться вирусы.
Для того чтобы подготовить пользователя к возможным неприятностям, рассмотрим примерный алгоритм работы Word-макровирусов. Этот алгоритм хорошо знают и используют для борьбы с вирусами фирмы, выпускающие антивирусные программы.
Большинство известных Word-вирусов при запуске переносят свой код (макросы) в область глобальных макросов документа ("общие" макросы). Для этого они используют команды копирования макросов MacroCopy, Organizer.Copy либо редактор макросов - вирус вызывает его, создает новый макрос, вставляет в него свой код, который и сохраняет в документе.
Первый способ проникновения вирусов заключается, в целом, в изменении общего шаблона Word NORMALDOT. При выходе из Word глобальные макросы (включая макросы вируса) автоматически записываются в файл *.DOT глобальных макросов (практически всегда это NORMALDOT). Таким образом, при следующем запуске Word вирус активизируется в момент загрузки глобальных макросов, то есть сразу.
Затем вирус переопределяет (или уже содержит в себе) один или несколько стандартных макросов (например, FileOpen, FileSave, FileSaveAs, FilePrint) и перехватывает таким образом команды работы с файлами. При вызове этих команд вирус заражает файл, к которому идет обращение. Для этого вирус конвертирует файл в формат DOT (что делает невозможными дальнейшие изменения формата файла, то есть конвертирование в какой-либо иной формат) и записывает в файл свои макросы, включая Auto-макрос.
Таким образом, если вирус перехватывает макрос FileSaveAs, то заражается каждый файл *.DOC, сохраняемый через перехваченный вирусом макрос. Если перехвачен макрос FileOpen, то вирус записывается в файл при его считывании с диска.
Второй способ внедрения вируса в систему используется значительно реже - он базируется на так называемых Add-in-файлах, то есть файлах, являющихся служебными дополнениями к Word. В этом случае NORMAL.DOT не изменяется и внешне все выглядит, вроде бы, нормально, но Word при запуске загружает макросы вируса из файла (или файлов), определенного как Add-in. Этот способ практически полностью повторяет заражение глобальных макросов, за тем исключением, что макросы вируса хранятся не в NORMALDOT, а в каком-либо другом файле.
Возможно также внедрение вируса в файлы, расположенные в каталоге STARTUР, - Word автоматически подгружает файлы-шаблоны из этого каталога, но такие вирусы пока не встречались.
Эти способы внедрения в систему представляют собой некоторый аналог резидентных DOS-вирусов. Вирус постоянно находится внутри Word и заражает все файлы.
Третий способ. Аналогом нерезидентности являются макровирусы, которые не переносят свой код в область системных макросов, - для заражения других файлов- документов они либо ищут их при помощи встроенных в Word функций работы с файлами, либо обращаются к списку последних редактированных файлов (Recently used file list). Затем такие вирусы открывают документ, заражают его и закрывают. Периодические вспышки "эпидемий" заставили задуматься о последствиях, к которым могут привести макровирусы, а также о важности защиты от них. Далее приводится несколько рекомендаций по защите от макровирусов.
ВНИМАНИЕ
Заранее используйте встроенную функцию защиты от макровирусов.

Работая с Word 2000, выберите в меню Сервис > Макрос > Безопасность (Tools > Macro > Security), отметьте закладку Уровень безопасности (Security Level) и задайте опцию Высокая (High) или Средняя (Medium). После этого нажмите ОК. На практике предпочтительнее выбирать опцию Средняя, поскольку Высокая может автоматически не пропускать макросы, содержащиеся в документе, без сообщения об этом. Тогда, если по каким-либо причинам пользователь не догадывается о существовании Макросов в документе, он будет долго бороться с возникающими неприятностями, неправильно идентифицировав их причину. С другой стороны, включение опции Высокая практически гарантированно спасет вас от проникновения макровирусов, так что решайте в каждом конкретном случае.
ВНИМАНИЕ
Проявляйте осмотрительность при открытии документов, содержащих макросы,

Когда вы открываете файл, содержащий макрос, на экране появляется диалоговое окно. Если вы не уверены в безопасности макроса, то нажмите одну из кнопок - Отключить макросы (Disable Macros) или Не открывать документ (Do not open). В первом случае Word откроет документ с атрибутом "только для чтения" - чтобы его сохранить после редактирования, отметьте пункты Файл > Сохранить как (File > Save As). Редактор Word позволяет сохранить документ после редактирования, но удаляет из него макрос. Будьте внимательны: возможно, вместе с удалением макроса вы потеряете некоторые удобства и возможности по редактированию документа.
ВНИМАНИЕ
Осторожно относитесь к письмам, приходящим по электронной почте.

Следует иметь точные сведения об источнике вашей корреспонденции. Если вы не знаете, чьи это документы, то не открывайте их.
ВНИМАНИЕ
Неплохо иметь на вашем компьютере антивирусную программу,

Если вы все же боитесь заразиться каким-либо ужасным вирусом, то установите одну из существующих антивирусных программ. Но при этом надо учитывать, что и здесь есть обратная сторона медали:
- первых, не все антивирусные программы способны обнаружить вирусы Word;
- во-вторых, особенности их работы иногда могут раздражать, потому что работа с документом ведется медленнее, периодически приходится отвлекаться на диалог с антивирусной программой, не всегда удачный, и т. д.
Поэтому универсальное средство - сохранять бдительность. А также быть в курсе последних событий и следить за новой информацией, касающейся защиты от вирусов, которые распространяются через макросы, и за ситуацией, сложившейся в данный момент.

к библиотеке   4GL   к обработке текстовой информации   к алгоритмизации

Знаете ли Вы, что, как ни тужатся релятивисты, CMB (космическое микроволновое излучение) - прямое доказательство существования эфира, системы абсолютного отсчета в космосе, и, следовательно, опровержение Пуанкаре-эйнштейновского релятивизма, утверждающего, что все ИСО равноправны, а эфира нет. Это фоновое излучение пространства имеет свою абсолютную систему отсчета, а значит никакого релятивизма быть не может. Подробнее читайте в FAQ по эфирной физике.

НОВОСТИ ФОРУМА

Форум Рыцари теории эфира


Рыцари теории эфира
 10.11.2021 - 12:37: ПЕРСОНАЛИИ - Personalias -> WHO IS WHO - КТО ЕСТЬ КТО - Карим_Хайдаров.
10.11.2021 - 12:36: СОВЕСТЬ - Conscience -> РАСЧЕЛОВЕЧИВАНИЕ ЧЕЛОВЕКА. КОМУ ЭТО НАДО? - Карим_Хайдаров.
10.11.2021 - 12:36: ВОСПИТАНИЕ, ПРОСВЕЩЕНИЕ, ОБРАЗОВАНИЕ - Upbringing, Inlightening, Education -> Просвещение от д.м.н. Александра Алексеевича Редько - Карим_Хайдаров.
10.11.2021 - 12:35: ЭКОЛОГИЯ - Ecology -> Биологическая безопасность населения - Карим_Хайдаров.
10.11.2021 - 12:34: ВОЙНА, ПОЛИТИКА И НАУКА - War, Politics and Science -> Проблема государственного терроризма - Карим_Хайдаров.
10.11.2021 - 12:34: ВОЙНА, ПОЛИТИКА И НАУКА - War, Politics and Science -> ПРАВОСУДИЯ.НЕТ - Карим_Хайдаров.
10.11.2021 - 12:34: ВОСПИТАНИЕ, ПРОСВЕЩЕНИЕ, ОБРАЗОВАНИЕ - Upbringing, Inlightening, Education -> Просвещение от Вадима Глогера, США - Карим_Хайдаров.
10.11.2021 - 09:18: НОВЫЕ ТЕХНОЛОГИИ - New Technologies -> Волновая генетика Петра Гаряева, 5G-контроль и управление - Карим_Хайдаров.
10.11.2021 - 09:18: ЭКОЛОГИЯ - Ecology -> ЭКОЛОГИЯ ДЛЯ ВСЕХ - Карим_Хайдаров.
10.11.2021 - 09:16: ЭКОЛОГИЯ - Ecology -> ПРОБЛЕМЫ МЕДИЦИНЫ - Карим_Хайдаров.
10.11.2021 - 09:15: ВОСПИТАНИЕ, ПРОСВЕЩЕНИЕ, ОБРАЗОВАНИЕ - Upbringing, Inlightening, Education -> Просвещение от Екатерины Коваленко - Карим_Хайдаров.
10.11.2021 - 09:13: ВОСПИТАНИЕ, ПРОСВЕЩЕНИЕ, ОБРАЗОВАНИЕ - Upbringing, Inlightening, Education -> Просвещение от Вильгельма Варкентина - Карим_Хайдаров.
Bourabai Research - Технологии XXI века Bourabai Research Institution