Opened 10 years ago

Closed 10 years ago

#54 closed Aufgabe (fixed)

Alte ISO-8859-1-Dateien fixen

Reported by: sven Owned by:
Priority: major Milestone:
Component: t29-Website Severity: unbekannt
Keywords: Cc:

Description (last modified by sven)

Es gibt noch zahlreiche Alt-Dateien, die mit falschem Zeichensatz (Latin1) versehen sind. Dabei handelt es sich größtenteils um HEADER-Dateien.

Dateien finden, die noch in ISO-Zeichensatz statt UTF-8 geschrieben sind

find | xargs file | grep ISO 

Dateien nach Dateinamen automatisch konvertieren (hier im Beispiel alle Dateien wo HEADER im Dateinamen steht)

find | grep HEADER | xargs recode ISO-8859-1..UTF-8

Dateien mit noch falschem <meta>-Tag finden (noch kein utf-Metatag)

find | grep shtm | xargs grep -L utf

Dateien mit Sonderzeichen finden (also alle üöäÜÖÄß und so auflisten)

find | grep shtm | xargs grep --color='auto' -P -n "[\x80-\xFF]"

Dateien mit noch kaputten Zeichen (etwa nach mehrfacher Konvertierung) finden

find | grep shtm | xargs grep --color='auto' -P -n "[\x80-\xFF]" | grep -v "[üöäÜÖÄß]" |  grep --color='auto' -P -n "[\x80-\xFF]"

Siehe auch

Change History (2)

comment:1 Changed 10 years ago by sven

  • Description modified (diff)

comment:2 Changed 10 years ago by sven

  • Description modified (diff)
  • Resolution set to fixed
  • Status changed from new to closed

Mit aktuellem Commit 559 gefixt.

Note: See TracTickets for help on using tickets.
© 2008 - 2013 technikum29 • Sven Köppel • Some rights reserved
Powered by Trac
Expect where otherwise noted, content on this site is licensed under a Creative Commons 3.0 License