konto usunięte

Temat: Otwieranie plikow wordowskich

Moze ktos z Was juz kiedys cos takiego robil potrzebuje otowrzyc plik .doc i wyciagnac z niego informacje. Znalazlem biblioteke ktora to umozliwia ale serwer musi byc postawiony na winodwsach i miec zainstalowanego worda, takze moze ktos z WAS mi cos podpowie...
Karol Traczykowski

Karol Traczykowski Head of New Ventures
@ ZnanyLekarz.pl

Temat: Otwieranie plikow wordowskich

Mialem kiedys podobny problem. Niestety znalazlem te same biblioteki, tzn. z tymi samymi wymaganiami.

Im nowsze pliki worda, tym bardziej zorganizowana i ustandaryzowana ich struktura, wiec mozesz sprobwac troche powalczyc. Ja niestety poleglem:/
Slyszalem od znajomego, ze ktos z jego znajomych :) pisal taki parser na systemy unixowe, ale niestety nie udalo mi sie dotrzec do tych ludzi.

pozdrawiam i zycze powodzeniaKarol Traczykowski edytował(a) ten post dnia 23.05.07 o godzinie 08:38
Łukasz A.

Łukasz A. Webdeveloper (php)

Temat: Otwieranie plikow wordowskich

ciężko chłopaki, ciężko.
Word zmienia sobie specyfikacje w detalach renderowania z wersji na wersje.
Taki parser pewnie poradziłby sobie tylko z jakimś konkretnym zakresem wersji, i to też nie byłoby pełne wsparcie (embeddowane prezentacje albo inne obiekty ? wątpie żeby przeszły, już z tabelkami będzie ciężko).
Chyba mimo wszystko najpewniejszym sposobem byłoby postawienie serwera na windzie z wordem i dobranie się do tego przez COM'a.
Osobiście postawiłbym sobie jakiejąś okrojoną winde pod WMVare i tam serwis soapowego (albo nawet jeszcze prostszy) do przerabiania tych dokumentów.
Jeżeli chcecie pisać parser binarek worda, to ciśnie mi się na usta że gra nie jest warta świeczki.
Marcin Stanisławski

Marcin Stanisławski Hermem właściciel

Temat: Otwieranie plikow wordowskich

Hmm teraz jest juz OpenXML jako format danych dla Worda (i nie tylko bo dla calego Office) jako wiodący i bedzie dalej on rozwijany... Więc nie wiem czy warto sie cofać do DOC... Jak to juz prawie przeszłość... Z XMLem raczej w PHP nie ma problemu... Tylko sciagnać z Microsoft schematy i wszystko gra....
Tomir Kozakiewicz

Tomir Kozakiewicz Własna Działalność
Gospodarcza

Temat: Otwieranie plikow wordowskich

Terefere... jaki %% z istniejacych w biurach dokumentow jest w formacie XML?? Ilu urzednikow i zwyklych uzytkownikow w biurach bedzie zapisywalo w tym formacie w ciagu najblizszych trzech lat? Problem zapewne dotyczy obecnych wersji plikow.
Łukasz A.

Łukasz A. Webdeveloper (php)

Temat: Otwieranie plikow wordowskich

a słyszał kto o skandalu specyfikacji openXML ?
ponoć 3000 stron, upstrzonych referencjami z rodzaju:

przy wartości 16, linia renderowana jak w wordzie 5.0.1.2223...

ludzie z ISO nadal nie chcą go przepuścić AFAIK.
nie polegałbym na tym formacie.

konto usunięte

Temat: Otwieranie plikow wordowskich

Łukasz A.:
a słyszał kto o skandalu specyfikacji openXML ?
ponoć 3000 stron, upstrzonych referencjami z rodzaju:

przy wartości 16, linia renderowana jak w wordzie 5.0.1.2223...

ludzie z ISO nadal nie chcą go przepuścić AFAIK.
nie polegałbym na tym formacie.

Najlepszą specyfikacją będzie plik xsd opisujący dane xml'owe dla standardu openXML. Wszelakie dokumentacje opisowe zawsze zawierają wiele niepotrzebnych rzeczy.

Swoją drogą Word od wersji 2000 miał możliwość zapisania dokumentu jako strony HTML. A w wersji XP dorzucono zapis w postaci jednego pliku. To również plik XML, tyle że z danymi binarnymi dla elementów multimedialnychMarcin Molak edytował(a) ten post dnia 23.05.07 o godzinie 20:14
Tomir Kozakiewicz

Tomir Kozakiewicz Własna Działalność
Gospodarcza

Temat: Otwieranie plikow wordowskich

No to optymisci - polecam do zapoznania sie :]

Otwarte konwertery dla Office:
http://dobreprogramy.pl/index.php?dz=15&n=6621

Microsoft Office bez OpenDocument:
http://dobreprogramy.pl/index.php?dz=15&n=6615
Piotr Maliński

Piotr Maliński Programista
Python/Django

Temat: Otwieranie plikow wordowskich

1. konwersja do OpenDocument ODT i konwersja do XHTML za pomocą XSLT :) http://www.phpclasses.org/browse/package/3071.html (hehe)

2. jeżeli PHP stoi pod windą to: http://www.phpclasses.org/browse/package/3553.html
Tomir Kozakiewicz

Tomir Kozakiewicz Własna Działalność
Gospodarcza

Temat: Otwieranie plikow wordowskich

Nie tak hop! Najpierw jeszcze konwersja DOC->ODT :P czyli instalacja OpenOffice i "reczne robotki" :D. Ale kto ma ODT, to mu sie przyda.

Następna dyskusja:

pobieranie plikow




Wyślij zaproszenie do