konto usunięte
Karol
Traczykowski
Head of New Ventures
@ ZnanyLekarz.pl
Temat: Otwieranie plikow wordowskich
Mialem kiedys podobny problem. Niestety znalazlem te same biblioteki, tzn. z tymi samymi wymaganiami.Im nowsze pliki worda, tym bardziej zorganizowana i ustandaryzowana ich struktura, wiec mozesz sprobwac troche powalczyc. Ja niestety poleglem:/
Slyszalem od znajomego, ze ktos z jego znajomych :) pisal taki parser na systemy unixowe, ale niestety nie udalo mi sie dotrzec do tych ludzi.
pozdrawiam i zycze powodzeniaKarol Traczykowski edytował(a) ten post dnia 23.05.07 o godzinie 08:38
Łukasz A. Webdeveloper (php)
Temat: Otwieranie plikow wordowskich
ciężko chłopaki, ciężko.Word zmienia sobie specyfikacje w detalach renderowania z wersji na wersje.
Taki parser pewnie poradziłby sobie tylko z jakimś konkretnym zakresem wersji, i to też nie byłoby pełne wsparcie (embeddowane prezentacje albo inne obiekty ? wątpie żeby przeszły, już z tabelkami będzie ciężko).
Chyba mimo wszystko najpewniejszym sposobem byłoby postawienie serwera na windzie z wordem i dobranie się do tego przez COM'a.
Osobiście postawiłbym sobie jakiejąś okrojoną winde pod WMVare i tam serwis soapowego (albo nawet jeszcze prostszy) do przerabiania tych dokumentów.
Jeżeli chcecie pisać parser binarek worda, to ciśnie mi się na usta że gra nie jest warta świeczki.
Marcin Stanisławski Hermem właściciel
Temat: Otwieranie plikow wordowskich
Hmm teraz jest juz OpenXML jako format danych dla Worda (i nie tylko bo dla calego Office) jako wiodący i bedzie dalej on rozwijany... Więc nie wiem czy warto sie cofać do DOC... Jak to juz prawie przeszłość... Z XMLem raczej w PHP nie ma problemu... Tylko sciagnać z Microsoft schematy i wszystko gra....
Tomir
Kozakiewicz
Własna Działalność
Gospodarcza
Temat: Otwieranie plikow wordowskich
Terefere... jaki %% z istniejacych w biurach dokumentow jest w formacie XML?? Ilu urzednikow i zwyklych uzytkownikow w biurach bedzie zapisywalo w tym formacie w ciagu najblizszych trzech lat? Problem zapewne dotyczy obecnych wersji plikow.Łukasz A. Webdeveloper (php)
Temat: Otwieranie plikow wordowskich
a słyszał kto o skandalu specyfikacji openXML ?ponoć 3000 stron, upstrzonych referencjami z rodzaju:
przy wartości 16, linia renderowana jak w wordzie 5.0.1.2223...
ludzie z ISO nadal nie chcą go przepuścić AFAIK.
nie polegałbym na tym formacie.
konto usunięte
Temat: Otwieranie plikow wordowskich
Łukasz A.:
a słyszał kto o skandalu specyfikacji openXML ?
ponoć 3000 stron, upstrzonych referencjami z rodzaju:
przy wartości 16, linia renderowana jak w wordzie 5.0.1.2223...
ludzie z ISO nadal nie chcą go przepuścić AFAIK.
nie polegałbym na tym formacie.
Najlepszą specyfikacją będzie plik xsd opisujący dane xml'owe dla standardu openXML. Wszelakie dokumentacje opisowe zawsze zawierają wiele niepotrzebnych rzeczy.
Swoją drogą Word od wersji 2000 miał możliwość zapisania dokumentu jako strony HTML. A w wersji XP dorzucono zapis w postaci jednego pliku. To również plik XML, tyle że z danymi binarnymi dla elementów multimedialnychMarcin Molak edytował(a) ten post dnia 23.05.07 o godzinie 20:14
Tomir
Kozakiewicz
Własna Działalność
Gospodarcza
Temat: Otwieranie plikow wordowskich
No to optymisci - polecam do zapoznania sie :]Otwarte konwertery dla Office:
http://dobreprogramy.pl/index.php?dz=15&n=6621
Microsoft Office bez OpenDocument:
http://dobreprogramy.pl/index.php?dz=15&n=6615
Piotr
Maliński
Programista
Python/Django
Temat: Otwieranie plikow wordowskich
1. konwersja do OpenDocument ODT i konwersja do XHTML za pomocą XSLT :) http://www.phpclasses.org/browse/package/3071.html (hehe)2. jeżeli PHP stoi pod windą to: http://www.phpclasses.org/browse/package/3553.html
Tomir
Kozakiewicz
Własna Działalność
Gospodarcza
Temat: Otwieranie plikow wordowskich
Nie tak hop! Najpierw jeszcze konwersja DOC->ODT :P czyli instalacja OpenOffice i "reczne robotki" :D. Ale kto ma ODT, to mu sie przyda.Podobne tematy
Następna dyskusja: