Changes between Initial Version and Version 1 of Ticket #54


Ignore:
Timestamp:
May 29, 2014, 2:33:28 PM (5 years ago)
Author:
sven
Comment:

Legend:

Unmodified
Added
Removed
Modified
  • Ticket #54 – Description

    initial v1  
    11Es gibt noch zahlreiche Alt-Dateien, die mit falschem Zeichensatz (Latin1) versehen sind. Dabei handelt es sich größtenteils um `HEADER`-Dateien.
     2
     3Dateien finden, die noch in ISO-Zeichensatz statt UTF-8 geschrieben sind
     4
     5{{{
     6find | xargs file | grep ISO
     7}}}
     8
     9Dateien nach Dateinamen automatisch konvertieren (hier im Beispiel alle Dateien wo `HEADER` im Dateinamen steht)
     10
     11{{{
     12find | grep HEADER | xargs recode ISO-8859-1..UTF-8
     13}}}
     14
     15Dateien mit noch falschem `<meta>`-Tag finden (noch kein utf-Metatag)
     16
     17{{{
     18find | grep shtm | xargs grep -L utf
     19}}}
     20
     21Dateien mit Sonderzeichen finden (also alle üöäÜÖÄß und so auflisten)
     22
     23{{{
     24find | grep shtm | xargs grep --color='auto' -P -n "[\x80-\xFF]"
     25}}}
     26
     27Dateien mit noch kaputten Zeichen (etwa nach mehrfacher Konvertierung) finden
     28
     29{{{
     30find | grep shtm | xargs grep --color='auto' -P -n "[\x80-\xFF]" | grep -v "[üöäÜÖÄß]" |  grep --color='auto' -P -n "[\x80-\xFF]"
     31}}}
     32
     33
© 2008 - 2013 technikum29 • Sven Köppel • Some rights reserved
Powered by Trac
Expect where otherwise noted, content on this site is licensed under a Creative Commons 3.0 License