Кодировка pdf как исправить
Перейти к содержимому

Кодировка pdf как исправить

  • автор:

Кодировка pdf как исправить

Фыфка » Пт сен 22, 2006 13:26

Вопрос не совсем в тему, но может, кто подскажет неучу?

Иногда приходится переводить брошюры в формате PDF. Обычно я открываю их в Corel Draw, удаляю английский текст и забиваю русский, а потом снова сохраняю как документ PDF. А вчера случайно обнаружила, что если скопировать фрагмент русского текста из такого PDF-файла и вставить в Ворд, он отображается в виде квадратиков. В принципе, заказчику это не важно, но так ведь быть не должно! В чем тут может быть дело? Или в Кореле такие вещи вообще делать не полагается?

P.S. Кодировка стоит ANSI 1251, пробовала ставить другие — эффект тот же. Никакой защиты от копирования и пр. нет, файл сохраняю как PDF для редактирования.

Каждый рабочий день сокращает жизнь на 8 часов.

Фыфка
Сообщения: 305 Зарегистрирован: Сб окт 02, 2004 21:50 Откуда: Москва

  • ICQ

Бродяга » Пт сен 22, 2006 13:32

А если этот файл открыть в Акробате и попробовать копировать из него?
А потом уже поздно было редактировать. © bagira:)

Бродяга
Сообщения: 4948 Зарегистрирован: Ср дек 07, 2005 13:34

toothless_farmer » Пт сен 22, 2006 13:49

Corel какой?
Наск. я помню, более-менее нормальная обработка различных кодовых страниц появилась только в Corel 12 — до этого был сплошной кошмар.
Далее, Акробат использует свою внутреннюю кодировку, которая с майкрософтовской имеет мало общего. Возможно, проблема в конвертере CDR->PDF.
Можно попробовать не сохранять в виде PDF, а печатать в PDF (если есть полный Acrobat).

One horsepower is the amount of energy needed to pull one horse.

toothless_farmer
Сообщения: 451 Зарегистрирован: Чт сен 21, 2006 09:42 Откуда: 55°45’8″ N, 37°37’56» E, Sol-3, Sector 01 Язык(-и): ENRU, RUEN, ITRU, RUIT

esperantisto » Пт сен 22, 2006 13:50

А шрифт? Может, при создании PDF использовался шрифт, отсутствующий у Вас, а Word не может сделать толковую замену…

«И вообще погаными тряпками гнать этих переводчиков. Ишь чего удумали — переводить. Да ещё, чтоб удобно им было, хотят.» (на форуме разработчиков ПО)

esperantisto
Сообщения: 7032 Зарегистрирован: Ср фев 25, 2004 12:14 Откуда: Менск Язык(-и): En→Ru/Be, De→Ru/Be

esperantisto » Пт сен 22, 2006 13:55

toothless_farmer писал(а): Можно попробовать не сохранять в виде PDF, а печатать в PDF (если есть полный Acrobat).

Ой, ну зачем тратиться на этого бегемота, если есть pdfcreator: http://www.pdfforge.org/products/pdfcreator/

esperantisto
Сообщения: 7032 Зарегистрирован: Ср фев 25, 2004 12:14 Откуда: Менск Язык(-и): En→Ru/Be, De→Ru/Be

Фыфка » Пт сен 22, 2006 14:52

toothless_farmer писал(а): Можно попробовать не сохранять в виде PDF, а печатать в PDF (если есть полный Acrobat).

Эврика! Попробовала так — все скопировалось нормально
Спасибо!

Ой, ну зачем тратиться на этого бегемота, если есть pdfcreator:

Да привыкла я уже к Корелу, вот и продолжаю все в нем ковырять
Версия как раз 12-я и стоит.

Каждый рабочий день сокращает жизнь на 8 часов.

Фыфка
Сообщения: 305 Зарегистрирован: Сб окт 02, 2004 21:50 Откуда: Москва

  • ICQ

mikegor » Пт сен 22, 2006 16:40

Я тоже работаю с Corel Draw 12 и давно замечал, что у него проблемы с кирилицей. Я часто редактирую и русифицирую в нем векторные рисунки, извлеченные из PDF, и пользуюсь сохранением в формате WMF, чтобы потом вставлять такие рисунки в Word. Так вот, нажимая на кнопку «сохранить», никогда не знаешь, сохранится ли русский текст нормально или в виде знаков вопроса. Я уж экспериментировал, пытался выявить, с чем же все-таки коррелируют такие проблемы при сохранении. Ничего не удалось найти, никакая игра с опциями или с последовательностью действий при редактировании ничего не дала. Т.е. поведение это носит случайный характер, глюк где-то сидит, в общем.

An Arbeitsplätzen kann es laut zugehen. Verlassen Sie sich nicht auf verbale Kommunikation!

mikegor
Сообщения: 2334 Зарегистрирован: Пт дек 02, 2005 20:47 Откуда: Moscow Язык(-и): нем-рус,дат-рус

toothless_farmer » Сб сен 23, 2006 18:51

mikegor писал(а): Я тоже работаю с Corel Draw 12 и давно замечал, что у него проблемы с кирилицей. Я часто редактирую и русифицирую в нем векторные рисунки, извлеченные из PDF, и пользуюсь сохранением в формате WMF, чтобы потом вставлять такие рисунки в Word. Так вот, нажимая на кнопку «сохранить», никогда не знаешь, сохранится ли русский текст нормально или в виде знаков вопроса. Я уж экспериментировал, пытался выявить, с чем же все-таки коррелируют такие проблемы при сохранении. Ничего не удалось найти, никакая игра с опциями или с последовательностью действий при редактировании ничего не дала. Т.е. поведение это носит случайный характер, глюк где-то сидит, в общем.

Сохраняйте все-таки как CDR (для архива), а в Word вставляйте в формате EMF — он гораздо более предсказуемо ведет себя с русским текстом. Либо через cut/paste — но опять же в виде enhanced metafile

toothless_farmer
Сообщения: 451 Зарегистрирован: Чт сен 21, 2006 09:42 Откуда: 55°45’8″ N, 37°37’56» E, Sol-3, Sector 01 Язык(-и): ENRU, RUEN, ITRU, RUIT

mikegor » Сб сен 23, 2006 19:02

Да, я так и делаю, обязатель архивирую CDR. И способом cut — затем в Worde Правка — Специальная вставка — EMF тоже сейчас пользуюсь. Правда, последнее время только с Adobe Illustrator (у него с кириллицей проблем не наблюдалось), с Corel Draw уже некоторое время не работал и этот способ с ним не пробовал, а проблемы возникали всегда именно при сохранении EMF-файла, который я затем вставлял в Word. Безусловно cut/paste проще, чем сохранение промежуточного EMF-файла.

An Arbeitsplätzen kann es laut zugehen. Verlassen Sie sich nicht auf verbale Kommunikation!

mikegor
Сообщения: 2334 Зарегистрирован: Пт дек 02, 2005 20:47 Откуда: Moscow Язык(-и): нем-рус,дат-рус

Эвка » Ср сен 27, 2006 14:42

А без Корела как-нибудь можно всё сделать?
Если не трудно, хотя бы намекните, через какую прогу и какими путями перекинуть содержимое ПДФ-ки в Ворд без потерь? А то посты выше не для чайника.
*застенчиво улыбается*

Эвка
Сообщения: 148 Зарегистрирован: Сб июл 08, 2006 15:28 Откуда: Latvia

Бродяга » Ср сен 27, 2006 14:48

Если нужно просто перекинуть PDF в Ворд на уровне «чайника», то можно использовать SolidConverter PDF 3.1. Подробности в этой ветке: http://trworkshop.net/forum/viewtopic.p . 8&start=80

Дополнительные ручные действия для более точной развёрстки выполняются при помощи BCL Jade.

Ещё можно попробовать FineReader версии не ниже 8.0.

А потом уже поздно было редактировать. © bagira:)

Бродяга
Сообщения: 4948 Зарегистрирован: Ср дек 07, 2005 13:34

Эвка » Ср сен 27, 2006 15:05

Спасибо! пробуем.

Эвка
Сообщения: 148 Зарегистрирован: Сб июл 08, 2006 15:28 Откуда: Latvia

Re: «Кракозябры» при копировании текста из файла PFD

vodek » Сб июл 07, 2012 11:46

Текст -> Переопределение шрифтов -> и «врукопашную» назначить символу нужную «букву». 😉

Изображение

Если совсем никак не получается изменить кодировку в PDF — это самый быстрый способ получить текст без распознавания.

«Пробежаться» по используемым в документе внедренным шрифтам и назначить символам нужный код в разы быстрее чем OCR и последующая вычитка распознанного текста.

Изображение

Для тех символов которые не вводятся с клавиатуры надо в поле «Экспорт в..» -> «шестнадц.» вести код символа который можно узнать используя, например, программу Таблица символов имеющуюся в любой версии Windows (шестнадцатиричный код символа отображается в левом нижнем углу окна программы).

Изображение

Так же код символа можно узнать из диалогового окна » Символ » программы MS Word

Настройки преобразования Adobe PDF

Стиль преобразования в файл PDF представляет собой группу параметров, определяющих ход процесса создания документа PDF. Эти параметры служат для обеспечения баланс размера и качества файла в зависимости от характера использования этого документа PDF. Большинство предварительно определенных стилей используются во всех приложениях Adobe Creative Cloud, включая InDesign, Illustrator, Photoshop и Acrobat. Для особых условий вывода пользователь может также создавать и передавать другим свои пользовательские стили. Сохраненный файл стиля PDF имеет суффикс .joboptions.

Некоторые из следующих стилей недоступны до тех пор, пока вы не переместите их из папки «Дополнения» по умолчанию в папку «Параметры» для пользовательских параметров.

Примечание.

Acrobat Standard не содержит папку «Вспомогательные элементы». Стили, установленные в папке «Вспомогательные элементы», доступны только в программе Acrobat Pro .

Папки «Distiller», «Вспомогательные элементы» и «Настройки» по умолчанию находятся в следующих расположениях.

  • (Windows 11 (64-разрядная); Windows 10, версия 1810 или более поздняя (32- и 64-разрядная); Windows 8, 8.1 (32- и 64-разрядная)†; Windows 7 SP1 (32- и 64-разрядная); Windows Server — 2008 R2 (64-разрядная), 2012 (64-разрядная), 2012 R2 (64-разрядная)†, 2016 (64-разрядная) или 2019 (64-разрядная)) ProgramData/Adobe/Adobe PDF
  • (Acrobat Pro для macOS) Library/Application Support/Adobe/Adobe PDF

Файлы настроек по умолчанию, которые устанавливаются с Distiller, доступны только для чтения и скрыты .

Пользовательские настройки находятся в следующих расположениях:

  • Users/[имя пользователя]/AppData/Roaming/Adobe/Adobe PDF/Settings (Windows 11 (64-разрядная); Windows 10, версия 1810 или более поздняя (32- и 64-разрядная); Windows 8, 8.1 (32- и 64-разрядная)†; Windows 7 SP1 (32- и 64-разрядная); Windows Server — 2008 R2 (64-разрядная), 2012 (64-разрядная), 2012 R2 (64-разрядная)†, 2016 (64-разрядная) или 2019 (64-разрядная))
  • (Acrobat Pro для macOS ) Users /[имя пользователя]/ Library / Application Support/Adobe / Adobe PDF / Settings

В некоторых приложениях пакета Adobe Creative Cloud часть наборов недоступна.

Примечание.

Время от времени рекомендуется проверять параметры файлов PDF. Автоматический возврат к параметрам по умолчанию в программе не предусмотрен. Программы, способные создавать документы PDF, используют последний из заданных или выбранных параметров.

Предназначен для создания документов PDF для высококачественной печати на настольных принтерах и пробопечатных устройствах. В этом шаблоне используется PDF версии 1.4, разрешение цветных изображений и изображений в градациях серого уменьшено до 300 пикс/дюйм, а монохромных изображений — до 1200 пикс/дюйм. В этой версии предусмотрено встраивание подмножеств всех шрифтов, сохранение цветов без распределения прозрачности (для типов файлов, предусматривающих изменение прозрачности). Такие файлы PDF можно открыть в программах Acrobat 10x и Acrobat Reader 10x или более поздних версиях.

Страницы большого формата (Acrobat Pro)

Позволяет создавать файлы PDF, пригодные для просмотра и печати инженерно-технической документации, формат которой превышает 200 x 200 дюймов (508 x 508 см). Такие файлы PDF можно открыть в Acrobat и Acrobat Reader 10.x или более поздних версиях.

PDF/A‑ 1b: 2005 (CMYK и RGB)

Используется при создании электронных документов, предназначенных для длительного (архивного) хранения. PDF/A‑1b использует PDF 1.4 и преобразует все цвета в зависимости от выбранного стандарта либо в CMYK, либо в RGB. Такие файлы PDF можно открыть в Acrobat и Acrobat Reader 10x или более поздних версиях.

PDF/X‑1a (2001 and 2003) (Acrobat Pro)

Для формата PDF/X-1a необходимо, чтобы все шрифты были встроены, чтобы были определены соответствующие ограничительные рамки PDF, а цвета были представлены в формате CMYK, в формате плашечных цветов или в обоих форматах сразу. Соответствующие этому стандарту файлы должны содержать описание условий печати, для которых такие файлы были созданы. Файлы PDF, соответствующие стандарту PDF/X‑1a, можно открыть в Acrobat 10x и Acrobat Reader 10x или более поздних версиях.

В PDF/X‑1a используется версия PDF 1.3, и разрешение цветных изображений и изображений в градациях серого уменьшено до 300 пикс/дюйм, а монохромных изображений — до 1200 пикс/дюйм. В этой версии предусмотрено встраивание подмножеств всех шрифтов, создание неразмеченных файлов PDF и распределение прозрачности с помощью настройки Высокое разрешение .

Примечание.

При установке стили PDF/X1‑a:2003 и PDF/X‑3 (2003) сохраняются на компьютере. Однако они становятся доступны только после их перемещения из папки «Вспомогательные элементы» в папку «Настройки».

Создает файлы PDF для высококачественной полиграфии (например, для цифровой печати цветоделения в компьютерном фотонаборном устройстве). При этом он не создает файлы, совместимые со стандартом PDF/X. В подобных случаях качество содержимого очень важно. Целью является сохранение в файле PDF всей информации, которая потребуется для его качественного воспроизведения в типографии или бюро фотовывода. Этот набор параметров использует PDF 1.4, преобразует цвета в палитру CMYK, уменьшает разрешение цветных изображений и изображений в градациях серого уменьшено до 300 пикс/дюйм, а монохромных изображений — до 1200 пикс/дюйм. Он встраивает подмножества всех шрифтов и сохраняет прозрачность (для типов файлов, предусматривающих изменение прозрачности).

Такие файлы можно открыть в Acrobat 10x и Acrobat Reader 10x или более поздних версиях.

Примечание. Прежде чем создавать файл PDF для отправки в печатное бюро или типографию, следует уточнить у поставщика услуг разрешение выводящего устройства и прочие необходимые параметры. либо запросить файл *.joboptions, содержащий все необходимые данные. По результатам может потребоваться изменить набор параметров создания файлов PDF в соответствии с требованиями типографии, после чего создать собственный файл *.joboptions.

Информативное содержимое PDF (Acrobat Pro)

Способствует созданию документов PDF с расширенным доступом, которые содержат разметку, гиперссылки, закладки, а также интерактивные элементы. Этим набором параметров предусмотрено использование формата PDF 1.6 и встраивание всех шрифтов в виде подмножеств символов. Файл при его использовании также будет оптимизирован для «порционного обслуживания». Такие документы PDF могут быть открыты программами Acrobat или Reader версии 7.0 или их более поздними версиями (Стиль Информативный PDF — Rich Content PDF — находится в папке Extras).

Примечание.

В ранних версиях некоторых приложений пакета этот стиль назывался eBook.

Наименьший размер файла

Набор предназначен для создания файлов PDF, которые предполагается просматривать внутри глобальной или корпоративной сети, а также рассылать по электронной почте. Такой набор предусматривает сжатие и понижение разрешения изображений до относительно невысокого. Все цвета преобразуются в sRGB, а шрифты (если файл создается с помощью программы Adobe Acrobat Distiller ) не встраиваются. Файл при его использовании также будет оптимизирован для «порционного обслуживания».

Такие файлы PDF могут быть открыты программами Acrobat и Reader 6.0, а также их более поздними версиями.

Набор предназначен для создания файлов PDF , которые будут распечатаны на принтере или копировальном устройстве, записаны на компакт-диски или направлены клиенту как пробный оттиск. В этом наборе параметров для уменьшения размера файла используется сжатие и понижение разрешения изображений. Однако при этом также встраиваются подмножества из всех (разрешенных) шрифтов, используемых в файле, все цвета преобразуются в sRGB и печать выполняется при среднем разрешении. Подмножества символов шрифтов из набора, входящего в состав Windows, не встраиваются. Файлы PDF, созданные с такими параметрами, могут быть открыты программами Acrobat и Reader 6.0, а также их более поздними версиями.

О стандартах PDF/X, PDF/E и PDF/A

Стандарты PDF/X, PDF/E и PDF/А утверждены Международной организацией по стандартизации (ISO). Они применяются к обмену графическими данными. Стандарты PDF/E применяются к процессам интерактивного обмена техническими документами; стандарты PDF/A определяют нормы процессов кнопку долгосрочного архивирования электронных документов. При преобразовании файла PDF осуществляется его проверка на соответствие заданному стандарту. Если документ PDF не соответствует требованиям выбранного стандарта ISO, система предложит отменить преобразование или создать файл, не отвечающий этим требованиям.

Самое широкое распространение в издательском и печатном деле получили несколько форматов PDF/X: PDF/X-1a, PDF/X-3 и PDF/X-4 (в 2008 г.). Самое широкое распространение при создании архивов из файлов PDF получили стандарты PDF/A-1a и PDF/A-1b (в случае менее строгих требований). В настоящее время применяется только версия PDF/E-1.

Дополнительная информация о стандартах PDF/X, PDF/E и PDF/A приведена на веб-сайтах ISO и AIIM.

Дополнительные сведения о создании файлов PDF/A и работе с ними представлены на странице www.adobe.com/go/learn_acr_pdfa_en

Настройка параметров файла PDF

Для определенных заданий или устройств вывода можно задать пользовательские настройки преобразования. Выбранные настройки определяют, будут ли встраиваться шрифты в документы и будет ли сокращаться их знаковый состав до 100%. Выбранные настройки определяют способ сжатия векторных объектов и изображения и способ создания их образцов. Выбранные настройки также определяют, будут ли включаться в файл PDF данные для высококачественной печати, например OPI-комментарии. Файлы настроек по умолчанию изменить нельзя, но их можно скопировать и создать новые файлы настроек.

Примечание.

Если файл PDF предназначен для профессиональной печати, попросите в типографии файл настроек .joboptions с рекомендуемым выходным разрешением и другими параметрами. Таким образом, созданный вами файл PDF будет оптимизирован в соответствии с технологическим процессом типографии.

Искаженный или отсутствующий текст при преобразовании или объединении документов PDF в Acrobat 9

Текст выводится на печать или отображается некорректно

Текст должным образом не отображается или не выводится на печать после преобразования или объединения документов PDF в Acrobat 9.

  • Текст выглядит размытым, или буквы и символы накладываются друг на друга.
  • Текст зашифрован, искажен или отображается как набор нечитаемых символов.
  • Текст в некоторых местах отображается с нижним индексом.
  • Текст не печатается должным образом.

Решение. Встройте шрифты, чтобы избежать подстановки

Встраивание делает ненужной подстановку шрифта при просмотре или печати файла, поэтому пользователь видит текст, отображаемый в первоначальном шрифте.

Следующие шаги объясняют, как встроить шрифты.

Встраивание шрифтов в Acrobat 9 при помощи Distiller:

[Acr DC] Исправление «битой» кодировки в pdf-файлах в Adobe Acrobat

Вот к чему приводит неумение и нежелание пользоваться поиском по форуму.
Поищите «обязательный экземпляр» — огромный топик даже имеющий собственный FAQ
В двух словах: проблема сложна однокликового решения нет

Развернуть подпись

Acrobatist
Участник

Топикстартер
Сообщения 47 Реакции 0

Вот к чему приводит неумение и нежелание пользоваться поиском по форуму.
Поищите «обязательный экземпляр» — огромный топик даже имеющий собственный FAQ
В двух словах: проблема сложна однокликового решения нет

Видимо, действительно не умею пользоваться поиском, т.к. причем тут «обязательный экземпляр» не понимаю. Искал по слову «кодировка».

AM Labs Solutions
Enfocus | Tilia Labs | ColorLogic | Callas

Сообщения 365 Реакции 178
Не увидел проблемы. @Acrobatist, проверяйте.
Развернуть подпись
arsen@amlabs.solutions
WhatApp | Telegram | Viber
+7.925.518.50.90 | +386.69.819.313

Acrobatist
Участник

Топикстартер
Сообщения 47 Реакции 0
Не увидел проблемы. @Acrobatist, проверяйте.
Слева — источник, справа — результат копирования из него.

Вложения

Безымянный.png
262.8 КБ · Просм.: 1 502

AM Labs Solutions
Enfocus | Tilia Labs | ColorLogic | Callas

Сообщения 365 Реакции 178

Тогда вам стоит уточнить что такое «делаю электронные издания». Я понял это как создание файла совместимого со стандартом PDF/A для электронной версии РГБ или РКП.

Развернуть подпись
arsen@amlabs.solutions
WhatApp | Telegram | Viber
+7.925.518.50.90 | +386.69.819.313

_MBK_
Пикирующий бомбардировщик

15 лет на форуме
Сообщения 32 916 Реакции 10 747

Видимо, действительно не умею пользоваться поиском, т.к. причем тут «обязательный экземпляр» не понимаю. Искал по слову «кодировка».

Это как я понимаю риторический вопрос не ко мне а к руководству РГБ?
Вы и вправду странно ищете большая часть выдачи по запросу кодировка ведет сюда

Обязательный электронный экземпляр и преобразование PDF в PDF/A для РГБ

. сабсеты с убитой кодировкой и скурвленные тексты. Первое должно решаться переходом на 2u/3u, снова призываю всех заинтересованных к тестированию! Курвы на обложках, в рекламе и т.п. — административный подход 😉

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *