Changes between Initial Version and Version 1 of Ticket #54
- Timestamp:
- May 29, 2014, 2:33:28 PM (10 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
Ticket #54 – Description
initial v1 1 1 Es gibt noch zahlreiche Alt-Dateien, die mit falschem Zeichensatz (Latin1) versehen sind. Dabei handelt es sich größtenteils um `HEADER`-Dateien. 2 3 Dateien finden, die noch in ISO-Zeichensatz statt UTF-8 geschrieben sind 4 5 {{{ 6 find | xargs file | grep ISO 7 }}} 8 9 Dateien nach Dateinamen automatisch konvertieren (hier im Beispiel alle Dateien wo `HEADER` im Dateinamen steht) 10 11 {{{ 12 find | grep HEADER | xargs recode ISO-8859-1..UTF-8 13 }}} 14 15 Dateien mit noch falschem `<meta>`-Tag finden (noch kein utf-Metatag) 16 17 {{{ 18 find | grep shtm | xargs grep -L utf 19 }}} 20 21 Dateien mit Sonderzeichen finden (also alle üöäÜÖÄß und so auflisten) 22 23 {{{ 24 find | grep shtm | xargs grep --color='auto' -P -n "[\x80-\xFF]" 25 }}} 26 27 Dateien mit noch kaputten Zeichen (etwa nach mehrfacher Konvertierung) finden 28 29 {{{ 30 find | grep shtm | xargs grep --color='auto' -P -n "[\x80-\xFF]" | grep -v "[üöäÜÖÄß]" | grep --color='auto' -P -n "[\x80-\xFF]" 31 }}} 32 33