Michał Danek

Michał Danek projektant graficzny

Temat: Tekst z PDF-a do INDD

Witam,

Mam problem z przeniesieniem tekstu z PDF-a do INDD w taki sposób, aby nie zniekształcało się formatowanie tekstu. Konwersja PDF-a na .DOC z poziomu Acrobata powoduje, że do tekstu dodawane są dywizy z miejsc gdzie w pliku PDF przenoszone były wyrazy. Przez co mam w INDD wyrazy podzielone dywizem w środku wiersza.

Natomiast zwykłe kopiowanie powoduje dodanie znaku końca akapitu przy każdym końcu wiersza z PDF-a. Zero płynności tekstu.

Jest może taki sposób na skopiowanie tekstu tak, aby formatowanie było poprawne?

P.S. Tak wiem, że najlepiej by było mieć poprawny tekst w Wordzie, ale być może takiego się nie doproszę, a jedyne co mam na ten moment to tekst w PDF-ie, a jest tego za dużo, żeby się bawić ręcznie w korektę.

konto usunięte

Temat: Tekst z PDF-a do INDD

W jednym i drugim przypadku da się to błyskawicznie poprawić za pomocą GREP.
Marcin D.

Marcin D. Sales Manager,
Studio

Temat: Tekst z PDF-a do INDD

kopiujesz tekst do Word'a, robisz znajdź "dywiz" zastąp "spacją". Masz gotowy tekst do edycji INDD
Szymon Pipień

Szymon Pipień DTP operator,
Graphic Designer

Temat: Tekst z PDF-a do INDD

Marcin D.:
kopiujesz tekst do Word'a, robisz znajdź "dywiz" zastąp "spacją". Masz gotowy tekst do edycji INDD

No to akurat trochę słaby pomysł, bo każdy podzielony wyraz będzie miał w środku zamiast dywizu spację, poza tym można nieopatrznie usunąć dywizy, które nie są dzieleniem wyrazów i które powinny w tekście zostać...
Andy L.

Andy L. ITM, VUB

Temat: Tekst z PDF-a do INDD

zapisz .pdf jako .rtf
otwórz w WordPadzie
Replace:
Find what:
- (dywiz+spacja) po prostu skopiuj z tekstu pierwsze wystąpienie
Replace with:
[zostaw puste]
Replace all

działaj na kopii a nie na oryginale

dywiz + spacja - tak się odwzorowuje tekst z pdf-a w wordpadzie (przynajmniej u mnie)
lub ID użyć grep-a (ja używam regex):
Find: (?<=[[:lower:]])– (?=[[:lower:]]) [przerób sobie indizajnowego grep-a]
Replace with: [zostawić puste]
zgodnie z regułą, że dywiz nigdy nie powinien być otoczony spacjami, regex nie powinien ci ruszyć prawidłowych dywizów.

EDIT:
I sprawdź, czy ten "dywiz" to rzeczywiście dywiz, czy też znak minus zwany myślnikiem lub półpauza :) dywiz, pauza i półpauzaTen post został edytowany przez Autora dnia 04.03.16 o godzinie 14:01

konto usunięte

Temat: Tekst z PDF-a do INDD

Najnowszy Word prawie perfekcyjnie radzi sobie z konwertowaniem z .pdf do .docx z nieźle zachowanym formatowaniem (w tym ostylowaniem) i pozbawionego już dzielenia wyrazów.

Następna dyskusja:

INDD - PDF interaktywny CS6...




Wyślij zaproszenie do