konto usunięte

Temat: [trivia..?] jak sprawdzić które znaki nie pasuja do latin-2?

witam,

mam do przeparsowania pare WIELKICH niepoprawnych xmli, z czego znaczna czesc z nich ma jakies dziwne znaki, ktore nie naleza do charsetu iso-8859-2. caly iksemel jest co prawda w utf-8, ale na wyjsciu ma byc polskie iso.

jak wklejam plik tekstowy do jakiegos w miare normalnego edytora tekstowego (notepad2 albo cos kolo tego) to czasem mi zakrzyczy, ze sa niepoprawne znaki i pozamienia je na "?", wiec wtedy latwo wyszukac je i usunac, ale niestety nie zawsze ta metoda dziala...

jakis pomysl, ktorej funkcji uzyc?

Pozdrawiam!

Temat: [trivia..?] jak sprawdzić które znaki nie pasuja do latin-2?

Stworzyc tablice ze znakami iso i te ktore sie nie znajda w tej tablicy wywalic
Wojciech K.

Wojciech K. realizator pomysłów
własnych

Temat: [trivia..?] jak sprawdzić które znaki nie pasuja do latin-2?

Wojciech Zbigniew Piotrowicz:
mam do przeparsowania pare WIELKICH niepoprawnych xmli, z czego > znaczna czesc z nich ma jakies dziwne znaki, ktore nie naleza do > charsetu iso-8859-2. caly iksemel jest co prawda w utf-8, ale na > wyjsciu ma byc polskie iso.

kojarzy mi się to z danymi zgromadzonymi w CMSach do których userzy przez WYSIWYGa wklejają teksty prosto z Worda...

kiedyś widziałem taki gotowy piękny skrypt, w którym było uwzględnione kilkanaście typowych Wordowskich "krzaków" i ich zamienniki (cudzysłowy, myślniki...) - myślę, że w google, po słowach: ms word php replace - coś się da znaleźć.

konto usunięte

Temat: [trivia..?] jak sprawdzić które znaki nie pasuja do latin-2?

Wojciech K.:
Wojciech Zbigniew Piotrowicz:
mam do przeparsowania pare WIELKICH niepoprawnych xmli, z czego > znaczna czesc z nich ma jakies dziwne znaki, ktore > > nie naleza do > charsetu iso-8859-2. caly iksemel jest co
prawda w utf-8, ale na > wyjsciu ma byc polskie iso.
kojarzy mi się to z danymi zgromadzonymi w CMSach do których userzy przez WYSIWYGa wklejają teksty prosto z Worda...
"mniej wiecej" o to chodzi, tyle ze akurat w moim przypadku jest to OpenOffice.. ALE.. na tyle co ja widzialem juz rozne przypadki to calosc pisza w MSWordzie, a potem przeklejaja to do OO.
myślę, że w google, po
słowach: ms word php replace - coś się da znaleźć.
ano, da sie. wydaje sie nawet, ze zabangla.

dzieki!



Wyślij zaproszenie do