Wikipedia:UTF8-Problemer

Op dëser Säit si Problemer opgezielt, déi am Zesummenhang mat UTF-8 optriede kënnen.

Windows änneren

Wisou gesinn ech amplaz vu Sonnerzeechen nëmme Rechtecker a Fragezeechen ? änneren

Problem: Verschidde Sprooche kënnen net duergestallt ginn (z. B. Chineesesch, Arabesch). Amplaz weist de Browser kleng Rechtecker oder Fragezeechen, □□ oder ?? amplaz 北京. Hei feelen d'Schrëftarten, fir déi Sproochen unzeweisen.

Léisung: Bei der Windows-Installatioun gi standardméisseg net all Schrëften (Fonts) installéiert, fir Späicherplaz ze spueren. Déi meescht Schrëfte loossen sech awer nodréiglech installéieren. Allerdéngs feele Windows verschidde Schrëften, sou zum Beispill fir Malayalam. Kuckt z. B.: ml:വിക്കിപീഡിയ:സ്വാഗതം(Welcome).

Hëllefräich ass et, d'Schrëft Arial Unicode MS z'installéieren; déi ass zum Beispill beim Microsoft Office 2000, Microsoft FrontPage 2000 a méi neie Versiounen dobäi. Den Numm ass ARIALUNI.TTF, an d'Datei ass 22 MB grouss. Wie kee vun dëse Programmer doheem huet, kann och (deelweis kascht ët eppes) Schrëftarten eroflueden: MS Mincho, Gentium (Download), Bitstream Cyberbit fir Windows (Download) (ca. 6 MB), Linux Libertine oder d'DejaVu-Schrëften (http://dejavu.sourceforge.net/wiki/index.php/Main_Page).

Zwou zimmlech komplett Unicode-Fonts sinn Titus Cyberbit Basic a Code2000. Weider IPA-fäeg Schrëftarten um Spaweck: http://www.phon.ucl.ac.uk/home/wells/ipa-unicode.htm, méi dozou op Wikipedia:Lautschrëft.

Hei d'Instruktioun. wéi een an de verschiddene Windowsversioune Schrëften nodréiglech installéiert:

  • Ënner Windows 98:
  1. Am beschten eng vun den uewe genannte Schrëftarten eroflueden an installéieren, bzw. d'TTF-Datei an de Folder Fonts (an der Reegel C:\Windows\Fonts) erakopéieren.
  2. Ënner "Start -> Control Panel" fënnt een e Symbol "Software". Uewen op "Windows Setup" klicken an d' "Sproochënnerstëtzung" mat "Details..." erweideren.
  3. Office-CD an de Computer leeën a bei enger "Benotzerdefinéierter Installatioun" d'Schrëftarten auswielen.
  4. Windows-Internetupdate starten an d'Sproochënnerstëtzungen a Schrëften aus der Rubrik vun den Updates déi net dringend sinn, uwielen an installéieren (nëmme beim Internet Explorer)
  • Ënner Windows 2000:
An der Systemsteierung gëtt et e Symbol fir d' Lännerastellungen. Am Feld Allgemeng gëtt ët eng Lëscht vu Sproochastellunge fir de System, hei mussen all d'Sproochfamillen ugewielt ginn, déi Dir wëllt uweise loossen.
  • Ënner Windows XP:
An der Systemsteierung fannt Dir e Symbol Regiouns- a Sproochoptiounen. Am Feld Sproochen musst Dir déi Sproochen an Dateien uwielen, déi Iech feelen.

Op wat muss ech oppassen, wann ech d'Schrëften net installéieren ? änneren

Well vum Duerstellungsproblem jo nëmmen exotesch Sonnerzeeche betraff sinn, déi ech an der Reegel souwisou net verstinn, hunn ech mir bis elo d'Méi net gemaach, fir zousätzlech Zeechen z'installéieren. Mat wéienge Komplikatioune muss ech rechnen?

  • Beim Liesen op der Wikipedia ass näischt weideres ze beuechten. Fir Zeechen, déi net installéiert sinn, ginn einfach déi uewe genannten Zeechen (□, ¤ oder ?) ugewisen.
  • Beim Ännere vum Artikelen duerfen dës komesch Zeechen net geännert ginn, fir datt déi aner Benotzer nach ëmmer hir Sonnerzeeche gesinn. Och wann de Browser en Zeechen net duerstelle kann, sou weess en awer, wéieen Zeechen do stoë misst. (D. h. och wann z. B. amplaz vum Katakana-Zeeche Wi (ヰ) eppes wéi □ oder ? do steet, sou behandelt de Browser et awer wéi d'Katakana-Zeeche Wi, a Benotzer, déi japanesch Schrëften installéiert hunn, kréien et och weider korrekt ugewisen. Alternativ kënnt dir opmannst eng sougenannte Fallback Font installéieren, deen Iech kloer uweist, datt et onbekannten Zeeche ginn.

Wisou weist mäin Textbrowser amplaz vu Sonnerzeechen nëmme komesch Zeechen un ? änneren

Problem: Amplaz vun de Sonnerzeeche ginn Zeecheketten ugewisen, déi een net liese kann, z. B. ð£ð¥Ðüð║ð▓ð░ amplaz vu Москва oder ├ñ amplaz vun ä. Dobäi handelt ët sech ëm Unicode-Zeechen, déi z. B. vum Browser oder sm Textmodus ënner DOS net sou interpretéiert goufen, mee als Windows Codepage 850 oder Codepage 437. D'Sonnerzeeche ginn zwar beim Späicheren net zerstéiert, mee et ass net einfach den Text ze liesen oder ze beschaffen.

Léisung: Am Moment keng. D'Sonnerzeeche kënnen noutfalls als HTML-Entitéite geschriwwe ginn, z. B. ä fir en ä, Ö fir en Ö oder ß fir en ß. Op Kee Fall soll d'"Bustawenzopp", och wann se nach sou komesch ass, geännert ginn!

Wisou gi verschidden Zeechen net ugewisen? änneren

Wann Zeechen net ugewise ginn, an amplaz z. B. ? ugewise gëtt, läit et warscheinlech dodrunner, datt de Browser keng Schrëfttype fir d'Zeeche fënnt. Ët gëtt vill fräi Font-Packagen, déi vill vun dëse Schrëften ëmfaassen.

Allerdéngs musst Dir d'Fonts nëmmen installéieren, wann Iech d'Schrëften och interesséieren (da meeschtens einfach an den Ordner /usr/X11R6/lib/X11/fonts/truetype kopéieren). Dir kënnt awer och ouni dës Schrëften Artikel an der Wikipedia veränneren.

Ënner Debian GNU/Linux kann een de Package "ttf-malayalam-fonts" fir ml:Main_Page an "ttf-kochi-mincho" bzw. "ttf-sazanami-mincho" fir ja:Main_Page benotzen. D'-gothic-Packagen sollten och funktionéieren. Fir th:Main_Page benotzt am Beschten "xfonts-thai". "ttf-kacst" erméiglecht datt ar:Main_Page richteg ugewise gëtt.

Wisou gesinn ech a mengem Textbrowser amplaz vu Sonnerzeechen eng Bustawenzopp? änneren

Problem: Wenn den Terminal, op deem den Textbrowser (z. B. Lynx, w3m) leeft, eng aner Zeechecodéierung benotzt, ginn amplaz vu Sonnerzeeche ganz komesch Zeecheketten ugewisen, déi een net liese kann, z. B. Ð?оÑ?ква amplaz Москва oder ä amplaz ä. Dobäi handelt ët sech ëm UTF-8-codéiert Zeechen, déi vun der Console net sou interpretéiert ginn, mee als Latin-1. D'Sonnerzeeche ginn zwar beim Späicheren net zerstéiert, mee et ass schwéier den Text ze liesen oder ze änneren.

Léisung:

  • Op der Linux-Console: op der Console gëtt et de Skript unicode_start, deen d'Console an den UTF-8-Modus setzt. Domat léisst sech da scho mat Lynx op der Wikipedia schaffen, och wa verschidden Zeechen eventuell nach ëmmer net ugewise ginn, dofir kann een dann d'Console-Schrëften installéieren, oder och dynafont benotzen. [1]
  • An der Terminal-Fënster: Verschidden Terminals (z. B. de gnome-terminal) loossen sech mat echo -e '\e%G' an den UTF-8-Modus ëmschalten, wann Dir eng UTF-8-Locale benotzt, ass dat normalerweis net noutwänneg. Xterm sollt Dir mam Skript uxterm opruffen.[2]

Wisou zerstéiert den IE ënner Mac OS beim Späicheren d'Sonnerzeechen? änneren

Problem: Beim Späichere vun Artikele gi verschidde Sonnerzeechen, z. B. japanescher oder griichescher, duerch Fragezeechen ersat, an domat gëtt d'Säit zerstéiert.

Léisung: Am Moment keng. Den Internet Explorer fir Mac OS gëtt vu Microsoft net weiderentwéckelt. Mat dem Internet Explorer ënner Mac OS kann op der Wikipedia net geschafft ginn!


Alternativ soll e Browser benotzt ginn, dee funktionéiert, zum Beispill de Safari, deen e Bestanddeel vum Mac OS X 10.3 ass a fir Mac OS X 10.2.8 (awer net fir eeler X-Versiounen oder Mac OS 9.x bzw. fréier) gratis bei Apple kann erofgeluede ginn, oder de Mozilla Firefox, deen et och hei fir Mac OS X gratis gëtt.
Eng Lëscht vun 100 Browsere fir all Mac Betribssystemer.

Fir Mac OS7.6 a méi nei kann een och iCab benotzen.

Mäin IE weist all Sonnerzeeche falsch unn änneren

Problem: Wann Dir den Downloadmanager Reget installéiert hutt, zerstéiert seng Integratioun d'automatesch Erkennung vum Zeechesaz. Doduerch ginn UTF8-Säiten als latin1 ugewisen, an d'Resultat ass eng Bustawenzopp.

Léisung: Déi eenzeg Méiglechkeet, dëse Feeler ze behiewen, ass d'Integratioun vu Reget ze deaktivéieren. De Feeler ass bei den Hiersteller vu Reget bekannt, mee d'Ursaach schéngt beim IE ze leien, an am Moment gouf näischt an d'Richtung ënnerholl, dëse Problem ze behiewen.

OS-onofhängeg änneren

Lynx änneren

Problem: Sonnerzeeche ginn automatesch an eng laténgesch Schrëft ëmgewandelt. Sou gëtt aus dem kyrilleschen Text Архангельск automatesch Arhangel'sk. Beim Späichere gëtt dës Ëmwandlung net réckgängeg gemaach, sou datt déi kyrillesch Zeeche verluer sinn, an d'Säit zerstéiert gëtt.

Léisung: An den Optiounen (déi dir mat der Tast O erreeche kënnt) fannt Dir eng Optioun Display character set. Hei muss UNICODE (UTF-8) agestallt ginn. Duerno bleiwen d'Sonnerzeeche beim Späicheren erhalen. Dat muss onbedingt gemaach ginn, fir op der Wikipedia mat Lynx ze schaffen! Beim Ännere vun den Optioune muss drop opgepasst ginn, datt d'Checkbox Optioune permanent späicheren aktivéiert ass, fir datt d'Astellungen och beim nächste Start vum Programm erhale bleiwen.

Ausserdem muss d'Console kapabel sinn, Unicode-Zeechen unzeweisen.

W3M änneren

Problem: Verschidden Accentë gi falsch ugewisen, z. B. Espan~ol amplaz Español. Aner Sonnerzeechen (z. B. chineesesch) ginn duerch Fragezeechen ersat. Beim Späichere ginn dës Sonnerzeeche komplett geläscht an d'Säit gëtt domat zerstéiert.

Léisung: An den Optioune muss an der Kategorie Charset Settings d'Optioun Display Charset op Unicode (UTF-8) gestallt ginn. Dat muss onbedingt gemaach ginn, fir op der Wikipedia mat W3M ze schaffen!

Ausserdem muss d'Console kapabel sinn, Unicode-Zeechen unzeweisen.

Netscape Navigator 4 änneren

Netscape Navigator an der Versioun 4.x duerf op kee Fall benotzt ginn, fir op der Wikipedia matzeschaffen, well ët Sonnerzeechen zerstéiert. Mee och fir ze Liesen ass den Navigator 4.x praktesch net ze benotzen, well hie vill Techniken, déi op der Wikipedia benotzt ginn (wéi z. B. CSS) net genuch ënnerstëtzt.

Dofir rode mir Iech, op e méi moderne Browser ëmzesteigen, wéi zum Beispill de Mozilla Firefox, deen een hei gratis erofluede kann, oder d'Internetsuite Netscape 7, déi een hei fanne kann.

Privoxy änneren

Am Reklammeblocker Privoxy gëtt et an der Versioun 3.0.2 e Programmfeeler am sou genannten Demoronizer, duerch deen Ëmlauter an aner Net-ASCII-Zeeche beim Beschaffen zerstéiert ginn [3]. An der Versioun 3.0.3 gouf dëst verbessert. Ët duerfen op kee Fall Wikipedia-Säite verännert ginn, wann den Demoronizer unn ass, oder Privoxy nach net aktualiséiert gouf!

Kuckt och änneren