Как сохранить веб страницу в вордовский формат
Перейти к содержимому

Как сохранить веб страницу в вордовский формат

  • автор:

Ограничения при сохранении документа Microsoft Word как веб-страницу

При сохранении документа Microsoft Word как веб-страницу (меню файл , выберите команду Сохранить как веб-страницы), Microsoft Word автоматически преобразует страницу в формате HTML (Hypertext Markup Language), язык, используемый веб-обозревателями для чтения веб-страниц.

Поскольку Word отображается примерно так, как страница будет отображаться в веб-обозревателе (Microsoft Internet Explorer), некоторые виды форматирования и другие элементы, которые не поддерживаются HTML или веб-страницу, в среде разработки веб-страницы, не отображаются в Microsoft Word (или в веб-обозревателях).

Дополнительные сведения

При сохранении документа Word 2000 как веб-страницу, Microsoft Word выводится предупреждение с сообщением «Некоторые свойства данного документа не поддерживаются веб-обозревателями» и показывает сводку по возможности, не поддерживаемые и способ их отображения в веб-обозревателе.

Примечание: Если не указано иное, компоненты, указанные в приведенных ниже таблицах также ведут себя так же, как в списке, если выполните одно из следующих действий:

    В Word 6.0 или Word 95 при открытии документа веб-страницы, которая была создана (Сохранить как веб-страницу) в Word 2007, Word 2003, Word 2002 или Word 2000. Можно заново сохранить его в формате HTML (*.htm, * .html, *.htx), а затем снова откройте файл в одном из этих более поздних версиях Microsoft Word.

В следующих таблицах перечислены элементы, которые Microsoft Word изменяет или удаляет при сохранении файла как веб-страницу.

Как сохранить веб страницу в вордовский формат

Сохранение и использование файлов в формате HTML и XML

Если вы работаете на локальном компьютере, то документ, созданный в Microsoft Office, по умолчанию сохраняете в двоичном формате, имеющем расширение .doc, .xls, .ppt и т.п., в зависимости от приложения, в котором он создавался. Документ Word можно сохранить в формате HTML (Hypertext Markup Language) и XML (extensible Markup Language — расширяемый язык разметки) и опубликовать в корпоративной сети или в Интернете, выбрав в меню Файл (File) команду Сохранить как Веб-страницу (Save As Web-Page). Поле Тип файла (Save as type) диалогового окна команды сохранить файл в таких форматах как: Веб-страница (Web Page), Веб-страница с фильтром (Web Page, Filtered) и Веб-архив (Web Archive). Формат Веб-страница (Web Page) сохраняет все возможности редактирования документа в формате HTML. Формат Веб-страница с фильтром (Web Page, Filtered) удаляет часть HTML кода и уменьшает размер файла. Формат Веб-архив (Single file Web Page) позволяет переслать содержимое (текст и графику) в одном файле *.mht, *.mhtml.
При использовании любого из вышеназванных форматов в каждом документе сохраняются все параметры форматирования. Пользователи корпоративной сети или в Интернете, на компьютерах которых не установлен Microsoft Office, могут просматривать файлы, сохраненные в форматах HTML или XML, в обозревателе или в других программах просмотра Интернета.
Office обеспечивает высокую точность воспроизведения в окне обозревателя отформатированного документа, который выглядит точно так же, как в окне приложения. Сохраняются параметры диаграмм и рисунков, например, цвета и характеристики линий. Начинающий пользователь, не умеющий программировать, может создать в Office 2003 веб-страницу и опубликовать ее на веб-сервере без потери качества и функциональных возможностей документа. Автоматическое определение кодировки HTML и XML позволяет увидеть правильные символы в любой языковой среде.

Особенности сохранения файлов в формате HTML

Различают статический и динамический форматы HTML. Статический формат используется в тех случаях, когда данные изменяются редко, динамический — когда необходимо отобразить последние на момент публикации данные. Отметим, что уже Access 2002 поддерживал преобразование объектов в два динамических формата HTML: ASP (Active Server Pages) и IDC/HTX. Файл с расширением asp используется для динамических веб-страниц, с расширением idc содержит запрос в форме инструкции SQL, с расширением htx содержит команды и инструкции по форматированию. Вместо данных в файлы с расширением htx. включены шаблоны, указывающие место вставки данных из запроса в файле с расширением idc.
При сохранении документа в формате HTML Office 2003 создает в заданном каталоге один HTML-файл (например, otchet.htm) и папку с тем же именем, включающую все вспомогательные файлы документа и управляющий основной файл. В отдельный файл помещаются каждый рисунок, Электронная таблица, слайд презентации, набор вспомогательных данных. Все графические изображения в зависимости от содержания автоматически преобразуются в формат .GIF, JPG, JPEG или .PNG. Например, штриховые рисунки сохраняются в формате GIF, а фотографии — в JPEG. При перемещении таких документов необходимо копировать как основной HTML-файл, так и папку со вспомогательными файлами. (Подробнее см. ниже раздел «Типы файлов, используемые для отображения рисунков и графики на веб-странице»)
Для облегчения редактирования нерастровой графики с помощью соответствующих программ при преобразовании документа Office 2003 в формат HTML графические изображения сохраняются как во внутреннем формате, так и в формате обозревателя.
В качестве примера приведем порядок преобразования объекта базы данных Access в динамический формат HTML:
1. В окне База данных (Database) выделите щелчком мыши требуемый объект и выберите в меню Файл (File) команду Экспорт (Export To).
2. В диалоговом окне Экспорт объекта (Export To) в поле Тип файла (Save as type) выделите строку Microsoft IIS 1-2 или Страницы Microsoft ASP (Microsoft Active Server Pages).
3. Выберите папку, в которой будет сохранен экспортируемый файл и введите имя файла латинскими буквами в поле Имя файла (File name).
4. Нажмите кнопку Экспорт (Export) .
5. При использовании формата Active Server Pages появится диалоговое окно Настройка вывода файла ASP (Microsoft Active Server Pages Output Options) , в котором укажите назовите источник данных ODBC. Он будет использован на веб-сервере для доступа к данным. Введите адрес сервера, на котором будет размещен файл ASP.

Использование ценных в формате XML

Office 2003 поддерживает язык XML (extensible Markup Language — расширяемый язык разметки). Этот язык обеспечивает интуитивно понятные мощные средства коллективной работы и широко используется при обмене информацией в Интернете независимо от применяемой платформы, формата данных. Формат XML разработан на базе HTML как формат универсального представления данных в корпоративных сетях и в Интернете. Он обладает более широкими возможностями, чем HTML. В этом формате можно представить любой документ Office.
XML упрощает выборку данных из документов Office 2003 в другие XML-приложения. Можно разделить содержимое документа и границы его двоичного формата. Содержимое становится доступным для процессов автоматического сбора и анализа данных с последующей корректировкой. Документ XML может состоять из нескольких файлов разных типов, например, файла XML, содержащего данные; файла ASP, содержащего веб-страницу для просмотра документа; файла xsd, содержащего описание структуры данных и т.д. Единый документ можно просмотреть в Internet Explorer версии 5 и выше. Файл, в формате HTML содержит сценарий, который загружает данные из источника в формате XML.
В отличие от универсальных тегов HTML, теги XML могут видоизменяться разработчиками и поэтому должны передаваться тому ПО, которое их использует. Microsoft предполагает использовать XML-формы исключительно на корпоративном рынке. В связи с тем, что некоторые обозреватели не работают с XML, в Word предусмотрена возможность сохранения документа в виде фильтрованной веб-страницы без использования дескрипторов XML. Для использования этой возможности в меню Сервис (Tools) выберите команду Параметры (Options) , а затем откройте вкладку Общие (General) , нажмите кнопку Параметры веб-документа (Web Options) и перейдите на вкладку Обозреватели (Browsers) , установите или снимите флажок Отключение компонентов, не поддерживаемых этим обозревателем. Совокупность XML-тегов, определяющих элементы документа, называется схемой (schema).
Сохранение и открытие файлов XML в Word 2003 может использоваться для интеграции с основными бизнес-данными предприятия. Инструмент графического связывания в Excel обеспечивает связывание заданной пользователем схемы XML с ячейками электронной таблицы Excel.

Как перенести страничку сайта в Word

Как перенести страничку сайта в Word

Страничка веб-сайта и документ Word используют совершенно разные форматы для представления информации. Давайте уточним.

Формат веб-страниц — HTML — хорош для публикации в сети. Основная задача: выводить информацию на любом типе устройств, не только на стационарных компьютерах с Windows, но и на ноутбуках, нетбуках с Анроидом, на системах с Юниксами, и даже на мобильных телефонах. Естественно, для решения этой задачи в страничку изначально заложена возможность подстройки под условия работы. Умеет растягиваться, подбирать шрифт, цвет и обрезать лишнее.

Документ Word’a — это в первую очередь макет для вывода на печать. Главный принцип: на экране видим точную копию того, что будет на бумаге после печати.

Как видим задачи совершенно разные. Поэтому перенести веб-страничку один-в-один в документ Word не выйдет. Такое бывает крайне редко. Только если страничка совсем простая.

Если уж что-то и переносить в Word с веб-страницы, то только содержательную часть, т.е. текст, представляющий интерес. Копирование элементов дизайна, рекламных и навигационных вставок — бесперспективная затея.

Для переноса текста в Word делайте так:

  1. Запустите Word.
  1. Подготовьте документ, в который собираетесь перенести текст. Например, создайте новый.
  1. Запустите браузер и перейдите на страничку с нужным материалом. Если страничка уже открыта в браузере, то переключитесь в это окно.
  1. Выделите нужный фрагмент текста.
  1. Скопируйте в буфер обмена. Для этого либо нажмите CTRL+С, либо кликните правой кнопкой и в контекстном меню выберите пункт «Копировать»
  1. Переключитесь обратно в окно Word.
  1. Установите курсор в то место, в которое будет вставлен текст.

  1. Перейдите в режим «Специальная вставка». Либо нажмите CTRL+ALT+V, либо кликните в пункт меню «Главная», на ленте кликните по выпадающему списку под иконкой «Вставить» и выберите «Специальная вставка. «
  1. В диалоговом окне выбирайте режим «Неформатированный текст» (Если вставляются кракозябры, попробуйте «Текст в кодировке Юникод».)

Если в тексте есть иллюстрации, лучше их сохранить отдельно — обычными файлами изображений. Кликаете на картинке правой кнопкой, выбираете «Сохранить изображение как . » и указываете папку на диске.

Конечно, такой способ неидеален. Красивое форматирование и прочие фентиклюшечки обрежутся. Но нам ведь главное суть перетащить и зафиксировать, да?

Если вам понравилась шпаргалка, порекомендуйте ее друзьям с соцсетях. Это можно сделать с помощью кнопок:

Опубликован: 22 октября 2014, 17:02

Как скачать все страницы сайта в формате word?

Добрый день. Нужна помощь.
Как сохранить все страницы сайта и чтоб на выходе были страницы не html, а ворд.
Понятно что текст можно копировать/вставлять вручную, либо сохранять страницы в html, открывать в ворд и пересохранять в док. А можно это как-то сделать централизовано/автоматизированно? Страниц на сайте около сотни.
Буду признателен за решение

  • Вопрос задан более трёх лет назад
  • 4885 просмотров

Комментировать

Решения вопроса 0

Ответы на вопрос 2

teknik2008

Алексей Шашенков @teknik2008

Расскажите про GOLANG. Мне интересно

Я бы на этой либе замутил бы тему

Ответ написан более трёх лет назад

Комментировать

Нравится Комментировать

zamboga

Бизнес-аналитика, фин. моделирование, дашборды

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *