{"id":133,"date":"2006-11-29T23:53:24","date_gmt":"2006-11-29T22:53:24","guid":{"rendered":"http:\/\/www.instruyete.org\/?p=8"},"modified":"2006-11-29T23:53:24","modified_gmt":"2006-11-29T22:53:24","slug":"dateinamen-in-utf-8","status":"publish","type":"post","link":"https:\/\/www.instruyete.org\/?p=133","title":{"rendered":"Dateinamen in UTF-8"},"content":{"rendered":"<p>Auf UNIX Filesystemen werden die Dateinamen schon seit l\u00e4ngerer Zeit mit der Zeichenkodierung UTF-8 gespeichert. Da auch NFS seit langem UTF-8 unterst\u00fctzt k\u00f6nnte man meinen, man sei im UNIX-Paradies des heterogenen Dateiaustausches.<\/p>\n<p>Leider nicht, denn einer macht&#8217;s immer anders. Mac OS X hat sich f\u00fcr eine spezielle Variante entschieden, bekannt unter <strong>Form D<\/strong><\/p>\n<p><strong>Form D<\/strong> kennt kein &#8222;precomposing&#8220; &#8211; ein zusammengesetzes Zeichen, bpsw. deutsche Umlaute, wird getrennt als Buchstabe und die dar\u00fcberliegenden P\u00fcnktchen kodiert. Dieses Vorgehen hat Vorteile bei der Suche.<\/p>\n<p>Der Nachteil ist dass alle anderen, Linux &#8211; Windows &#8211; kommerzielle UNIX&#8217;es &#8211; W3C das &#8222;precomposing&#8220;, bekannt als <strong>Form C<\/strong> verwenden. Dort wird ein Umlaut als ein Zeichen (mit 2 Bytes) kodiert.<\/p>\n<p>Lediglich die Zeichen des ASCII Codecs sind immer gleich. Falls man Dateinamen mit Zeichen ausserhalb des ASCII Bereiches verwendet, wird man Probleme bekommen. Tatsache ist:<\/p>\n<p>Form C Dateinamen aus der Linux\/UNIX Welt kann der Finder in Mac OS X darstellen, aber einige Programme aus dem Hause Apple nicht \u00f6ffnen (bspw. iPhoto)<\/p>\n<p>Form D Dateinamen aus der Mac OS X Welt k\u00f6nnen zumindest unter Linux problemlos verarbeitet werden. Zudem stellen konsole\/xterm die Dateinamen einwandfrei dar &#8211; konqueror sieht man das decomposing an &#8211; Mar\u00eda wird mit einem i-Punkt und einem Akzent dargestellt &#8211; das ist verkraftbar&#8230;<\/p>\n<p>Hier ist Linux flexibler und muss als Kl\u00fcgerer nachgeben &#8211; mit folgendem Befehl werden alle Dateinamen in den home Verzeichnisse von Form C auf Form D konvertiert.<strong> <\/strong><\/p>\n<p><strong> convmv -r -f utf8 -t utf8 &#8211;nfd &#8211;notest \/home<\/strong><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Auf UNIX Filesystemen werden die Dateinamen schon seit l\u00e4ngerer Zeit mit der Zeichenkodierung UTF-8 gespeichert. Da auch NFS seit langem UTF-8 unterst\u00fctzt k\u00f6nnte man meinen, man sei im UNIX-Paradies des heterogenen Dateiaustausches. Leider nicht, denn einer macht&#8217;s immer anders. Mac OS X hat sich f\u00fcr eine spezielle Variante entschieden, bekannt unter Form D Form D &hellip; <a href=\"https:\/\/www.instruyete.org\/?p=133\" class=\"more-link\"><span class=\"screen-reader-text\">Dateinamen in UTF-8<\/span> weiterlesen<\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[10,7],"tags":[],"class_list":["post-133","post","type-post","status-publish","format-standard","hentry","category-macos","category-unix"],"_links":{"self":[{"href":"https:\/\/www.instruyete.org\/index.php?rest_route=\/wp\/v2\/posts\/133","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.instruyete.org\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.instruyete.org\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.instruyete.org\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.instruyete.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=133"}],"version-history":[{"count":0,"href":"https:\/\/www.instruyete.org\/index.php?rest_route=\/wp\/v2\/posts\/133\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.instruyete.org\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=133"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.instruyete.org\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=133"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.instruyete.org\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=133"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}