ACE Evaluation version 0.0.2 (written 2001-Aug-07-Tue, minor edits on 2003-Aug-03-Sun) http://www.nicemice.net/idn/ Adam M. Costello http://www.nicemice.net/amc/ Abstract IDNA [IDNA] [IDN] calls for an ASCII-Compatible Encoding (ACE) of Unicode [UNICODE] domain labels. This document compares eleven ACEs: RACE [RACE03], BRACE [BRACE], LACE [LACE01], DUDE [DUDE02], AMC-ACE-M [AMCACEM], AMC-ACE-O [AMCACEO], AMC-ACE-R [AMCACER], AMC-ACE-V [AMCACEV], AMC-ACE-W [AMCACEW], AMC-ACE-Z [AMCACEZ], and MACE [MACE01]. Some other ACEs not included: SACE [SACE] appears obviously too complex, UTF-5 [UTF5] appears obviously too inefficient, UTF-6 [UTF6] can never be more efficient than its similarly simple successor DUDE, and as of this writing there were no known C implementations of ACE37 [ACE37] and FACE [FACE]. Contents Complexity Mixed-case support Efficiency Conclusions Example strings Author Complexity Complexity is hard to measure. This author would subjectively rank the complexity of the algorithms (in decreasing order) as: BRACE AMC-ACE-M AMC-ACE-O AMC-ACE-V, MACE AMC-ACE-W AMC-ACE-R, RACE AMC-ACE-Z LACE DUDE All the ACEs support multiple code lengths. In addition, BRACE and AMC-ACE-M use a full arsenal of techniques: pre-scanning the input to select optimal parameters (which must then be encoded at the beginning of the encoded string), mode switching between literal and binary, and multiple styles of binary. AMC-ACE-O simplifies this by having just one binary style, and reusing procedures for encoding both the parameters and the code points. AMC-ACE-V has two binary styles, and instead simplifies by adapting the parameters during encoding/decoding rather than optimizing and declaring them at the start. MACE takes a similar approach. AMC-ACE-W simplifies the adaptation heuristic, while AMC-ACE-R keeps a more sophisticated heuristic but uses a single binary style. RACE and LACE have more than one binary style but no literal mode, and very simple parameter selection/encoding/adaptation mechanisms. AMC-ACE-Z has a literal "mode" but does no mode switching because the literal characters are all at the beginning, and has only one "binary" style (which is not actually base-2) with an adaptive parameter. DUDE has only one binary style, no literal mode (just a trivial exception for hyphen-minus), and very simple parameter adaptation. Implementations can be long and straightforward, or short and subtle, but for whatever it's worth, here are the code sizes of four of the algorithms that were implemented by this author in similar styles: AMC-ACE-O: 214 lines @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-V: 176 lines @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-W: 156 lines @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-R: 150 lines @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-Z: 124 lines @@@@@@@@@@@@@@@@@@@@@@@@@ DUDE: 114 lines @@@@@@@@@@@@@@@@@@@@@@@ (Not counted in the code sizes are blank lines, lines containing only comments or only a single brace, and wrapper code for testing. BRACE was implemented by this author, but it was a less general implementation, with bounded input and output sizes. AMC-ACE-M was implemented by this author, but in a less compact style.) If a different implementation style were to alter the code sizes additively, or multiplicatively, or a combination thereof, the size differences would retain the same proportions. Mixed-case support DUDE, AMC-ACE-M,O,R,V,W,Z, MACE: all characters BRACE: only the letters A-Z, a-z RACE, LACE: none RACE, BRACE, and LACE transform the Unicode string to an intermediate bit string, then into an LDH string (letters, digits, and hyphens), so there is no particular alignment between the LDH characters and the Unicode characters. DUDE, AMC-ACE-M,O,R,V,W,Z, and MACE do not have this intermediate stage, and enforce alignment between the LDH characters and the Unicode characters, which facilitates the mixed-case annotation. Efficiency The relative efficiency of the various algorithms is suggested by the sizes of the encodings in section "Example strings". The lengths of examples A-K (which are the same sentence translated into a languages from a variety of language families using a variety of scripts) are shown graphically below for each ACE, scaled down by a factor of two so they fit on one line, and sorted so they look like a cummulative distribution. The fictional "Super-ACE" encodes its input using whichever of the other seven ACEs is shortest for that input. RACE: A Arabic 29 @@@@@@@@@@@@@@@ B Chinese 31 @@@@@@@@@@@@@@@@ J Taiwanese 31 @@@@@@@@@@@@@@@@ D Hebrew 37 @@@@@@@@@@@@@@@@@@@ H Russian 47 @@@@@@@@@@@@@@@@@@@@@@@@ E Hindi 50 @@@@@@@@@@@@@@@@@@@@@@@@@ F Japanese 60 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ I Spanish 66 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ C Czech 68 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ G Korean 79 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ K Vietnamese 92 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ LACE: B Chinese 28 @@@@@@@@@@@@@@ A Arabic 31 @@@@@@@@@@@@@@@@ J Taiwanese 31 @@@@@@@@@@@@@@@@ D Hebrew 39 @@@@@@@@@@@@@@@@@@@@ H Russian 48 @@@@@@@@@@@@@@@@@@@@@@@@ E Hindi 52 @@@@@@@@@@@@@@@@@@@@@@@@@@ F Japanese 52 @@@@@@@@@@@@@@@@@@@@@@@@@@ C Czech 58 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@ I Spanish 68 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ G Korean 79 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ K Vietnamese 92 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ DUDE: A Arabic 25 @@@@@@@@@@@@@ B Chinese 26 @@@@@@@@@@@@@ D Hebrew 33 @@@@@@@@@@@@@@@@@ J Taiwanese 36 @@@@@@@@@@@@@@@@@@ H Russian 38 @@@@@@@@@@@@@@@@@@@ C Czech 43 @@@@@@@@@@@@@@@@@@@@@@ F Japanese 49 @@@@@@@@@@@@@@@@@@@@@@@@@ E Hindi 58 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@ I Spanish 59 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ K Vietnamese 80 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ G Korean 89 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-R: B Chinese 24 @@@@@@@@@@@@ A Arabic 28 @@@@@@@@@@@@@@ J Taiwanese 30 @@@@@@@@@@@@@@@ D Hebrew 32 @@@@@@@@@@@@@@@@ C Czech 33 @@@@@@@@@@@@@@@@@ H Russian 40 @@@@@@@@@@@@@@@@@@@@ F Japanese 42 @@@@@@@@@@@@@@@@@@@@@ I Spanish 46 @@@@@@@@@@@@@@@@@@@@@@@ E Hindi 55 @@@@@@@@@@@@@@@@@@@@@@@@@@@@ K Vietnamese 60 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ G Korean 89 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-O: B Chinese 24 @@@@@@@@@@@@ A Arabic 28 @@@@@@@@@@@@@@ J Taiwanese 30 @@@@@@@@@@@@@@@ D Hebrew 31 @@@@@@@@@@@@@@@@ C Czech 34 @@@@@@@@@@@@@@@@@ H Russian 40 @@@@@@@@@@@@@@@@@@@@ F Japanese 41 @@@@@@@@@@@@@@@@@@@@@ I Spanish 49 @@@@@@@@@@@@@@@@@@@@@@@@@ E Hindi 54 @@@@@@@@@@@@@@@@@@@@@@@@@@@ K Vietnamese 58 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@ G Korean 80 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ MACE: B Chinese 25 @@@@@@@@@@@@@ A Arabic 26 @@@@@@@@@@@@@ J Taiwanese 28 @@@@@@@@@@@@@@ C Czech 34 @@@@@@@@@@@@@@@@@ D Hebrew 34 @@@@@@@@@@@@@@@@@ H Russian 39 @@@@@@@@@@@@@@@@@@@@ F Japanese 47 @@@@@@@@@@@@@@@@@@@@@@@@ I Spanish 48 @@@@@@@@@@@@@@@@@@@@@@@@ E Hindi 59 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ K Vietnamese 64 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ G Korean 72 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-W: B Chinese 24 @@@@@@@@@@@@ A Arabic 25 @@@@@@@@@@@@@ J Taiwanese 29 @@@@@@@@@@@@@@@ C Czech 33 @@@@@@@@@@@@@@@@@ D Hebrew 33 @@@@@@@@@@@@@@@@@ H Russian 38 @@@@@@@@@@@@@@@@@@@ I Spanish 46 @@@@@@@@@@@@@@@@@@@@@@@ F Japanese 47 @@@@@@@@@@@@@@@@@@@@@@@@ E Hindi 58 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@ K Vietnamese 64 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ G Korean 73 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ BRACE: B Chinese 22 @@@@@@@@@@@ A Arabic 26 @@@@@@@@@@@@@ J Taiwanese 27 @@@@@@@@@@@@@@ D Hebrew 33 @@@@@@@@@@@@@@@@@ C Czech 36 @@@@@@@@@@@@@@@@@@ F Japanese 40 @@@@@@@@@@@@@@@@@@@@ H Russian 42 @@@@@@@@@@@@@@@@@@@@@ E Hindi 45 @@@@@@@@@@@@@@@@@@@@@@@ I Spanish 48 @@@@@@@@@@@@@@@@@@@@@@@@ K Vietnamese 59 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ G Korean 78 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-V: B Chinese 22 @@@@@@@@@@@ A Arabic 27 @@@@@@@@@@@@@@ J Taiwanese 28 @@@@@@@@@@@@@@ D Hebrew 31 @@@@@@@@@@@@@@@@ C Czech 33 @@@@@@@@@@@@@@@@@ H Russian 39 @@@@@@@@@@@@@@@@@@@@ F Japanese 42 @@@@@@@@@@@@@@@@@@@@@ I Spanish 45 @@@@@@@@@@@@@@@@@@@@@@@ E Hindi 57 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@ K Vietnamese 62 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ G Korean 72 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-M: B Chinese 23 @@@@@@@@@@@@ J Taiwanese 26 @@@@@@@@@@@@@ A Arabic 28 @@@@@@@@@@@@@@ D Hebrew 31 @@@@@@@@@@@@@@@@ C Czech 34 @@@@@@@@@@@@@@@@@ H Russian 38 @@@@@@@@@@@@@@@@@@@ F Japanese 42 @@@@@@@@@@@@@@@@@@@@@ I Spanish 48 @@@@@@@@@@@@@@@@@@@@@@@@ E Hindi 54 @@@@@@@@@@@@@@@@@@@@@@@@@@@ K Vietnamese 59 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ G Korean 71 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-Z: A Arabic 22 @@@@@@@@@@@ B Chinese 24 @@@@@@@@@@@@ J Taiwanese 27 @@@@@@@@@@@@@@ D Hebrew 28 @@@@@@@@@@@@@@ C Czech 30 @@@@@@@@@@@@@@@ H Russian 32 @@@@@@@@@@@@@@@@ F Japanese 38 @@@@@@@@@@@@@@@@@@@ E Hindi 44 @@@@@@@@@@@@@@@@@@@@@@ K Vietnamese 44 @@@@@@@@@@@@@@@@@@@@@@ I Spanish 45 @@@@@@@@@@@@@@@@@@@@@@@ G Korean 69 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ Super-ACE: A Arabic 22 @@@@@@@@@@@ B Chinese 22 @@@@@@@@@@@ J Taiwanese 26 @@@@@@@@@@@@@ D Hebrew 28 @@@@@@@@@@@@@@ C Czech 30 @@@@@@@@@@@@@@@ H Russian 32 @@@@@@@@@@@@@@@@ F Japanese 38 @@@@@@@@@@@@@@@@@@@ E Hindi 44 @@@@@@@@@@@@@@@@@@@@@@ K Vietnamese 44 @@@@@@@@@@@@@@@@@@@@@@ I Spanish 45 @@@@@@@@@@@@@@@@@@@@@@@ G Korean 69 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ totals: RACE: 590 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ LACE: 578 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ DUDE: 536 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-R: 479 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ MACE: 476 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-W: 470 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-O: 469 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-V: 458 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ BRACE: 456 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-M: 454 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-Z: 403 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ Super-ACE: 400 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ worst cases: RACE: 92 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ LACE: 92 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ DUDE: 89 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-R: 89 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-O: 80 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ BRACE: 78 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-W: 73 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ MACE: 72 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-V: 72 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-M: 71 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-Z: 69 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ Super-ACE: 69 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ The totals and worst cases above give more weight to languages that produce longer encodings, which arguably yields a good metric (because being efficient for easy languages is arguably less important than being efficient for difficult languages). We can alternatively give each language equal weight by dividing each output length by the corresponding Super-ACE output length. This method yields: totals (normalized): RACE: 16.4 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ LACE: 16.0 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ DUDE: 14.5 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-R: 13.0 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-W: 12.9 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-O: 12.9 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-V: 12.6 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ BRACE: 12.5 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-M: 12.5 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-Z: 11.1 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ Super-ACE: 11.0 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ worst cases (normalized): RACE: 2.27 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ LACE: 2.09 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ DUDE: 1.82 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-W: 1.45 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-V: 1.41 @@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-R: 1.36 @@@@@@@@@@@@@@@@@@@@@@@@@@@ BRACE: 1.34 @@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-M: 1.34 @@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-O: 1.32 @@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-Z: 1.09 @@@@@@@@@@@@@@@@@@@@@@ Super-ACE: 1.00 @@@@@@@@@@@@@@@@@@@@ Conclusions The results suggest the following conclusion: AMC-ACE-Z is both simpler and more efficient than everything except DUDE and LACE, and it has full mixed-case support; therefore everything except AMC-ACE-Z, DUDE, and LACE can be eliminated. DUDE is both simpler and more efficient than LACE and has full mixed-case support (unlike LACE); therefore LACE can be eliminated. That leaves DUDE and AMC-ACE-Z as the only contenders. The choice depends on how much efficiency is required and how much complexity is acceptable. Here are the graphs again, this time showing only these two ACEs: AMC-ACE-Z: 124 lines @@@@@@@@@@@@@@@@@@@@@@@@@ DUDE: 114 lines @@@@@@@@@@@@@@@@@@@@@@@ DUDE: A Arabic 25 @@@@@@@@@@@@@ B Chinese 26 @@@@@@@@@@@@@ D Hebrew 33 @@@@@@@@@@@@@@@@@ J Taiwanese 36 @@@@@@@@@@@@@@@@@@ H Russian 38 @@@@@@@@@@@@@@@@@@@ C Czech 43 @@@@@@@@@@@@@@@@@@@@@@ F Japanese 49 @@@@@@@@@@@@@@@@@@@@@@@@@ E Hindi 58 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@ I Spanish 59 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ K Vietnamese 80 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ G Korean 89 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-Z: A Arabic 22 @@@@@@@@@@@ B Chinese 24 @@@@@@@@@@@@ J Taiwanese 27 @@@@@@@@@@@@@@ D Hebrew 28 @@@@@@@@@@@@@@ C Czech 30 @@@@@@@@@@@@@@@ H Russian 32 @@@@@@@@@@@@@@@@ F Japanese 38 @@@@@@@@@@@@@@@@@@@ E Hindi 44 @@@@@@@@@@@@@@@@@@@@@@ K Vietnamese 44 @@@@@@@@@@@@@@@@@@@@@@ I Spanish 45 @@@@@@@@@@@@@@@@@@@@@@@ G Korean 69 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ totals: DUDE: 536 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-Z: 403 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ worst cases: DUDE: 89 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-Z: 69 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ totals (normalized): DUDE: 14.5 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-Z: 11.1 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ worst cases (normalized): DUDE: 1.82 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ AMC-ACE-Z: 1.09 @@@@@@@@@@@@@@@@@@@@@@ DUDE strings are about 30% longer than AMC-ACE-Z. In this author's opinion, the added complexity of AMC-ACE-Z is moderate and well worth such a large gain in efficiency. Example strings In the ACE encodings below, signatures (like "bq--" for RACE) are not shown. The Unicode code points shown are the ones input to BRACE, AMC-ACE-M,O,R,V,W,Z, and MACE. The input to RACE, LACE, and DUDE is slightly different: A-Z are first forced to lowercase (which is not necessary for ACEs that encode them literally). UTF-8 and UTF-16 are included for length comparisons, with non-ASCII bytes shown as "?". AMC-ACE-* is abbreviated AMC-*. Backslashes show where line breaks have been inserted in strings too long for one line. The RACE and LACE encodings are courtesy of Mark Davis's online UTF converter [UTFCONV] (slightly modified to remove the length restrictions), and the MACE encodings were made using the sample implementation from [MACE]. The first several examples are all translations of the sentence "Why can't they just speak in ?" (courtesy of Michael Kaplan's "provincial" page [PROVINCIAL]). Word breaks and punctuation have been removed, as is often done in domain names. (A) Arabic (Egyptian): u+0644 u+064A u+0647 u+0645 u+0627 u+0628 u+062A u+0643 u+0644 u+0645 u+0648 u+0634 u+0639 u+0631 u+0628 u+064A u+061F AMC-Z: egbpdaj6bu4bxfgehfvwxn DUDE: yueqpcycrcyjhbpznpitjycxf AMC-W: ywekhfuhikwdefivejbuiwktr MACE: 1i4zed2j2f2j971djsd8gpj2il BRACE: 28akcjwcmp3ciwb4t3ngd4nbaz AMC-V: ywekhfuhuiukdefivevjvbuiktr AMC-R: ywekhfuhuikwdwefivevjbuiwktr AMC-O: ageekhfuhuiukdefivevjvbuiktr AMC-M: agiekhfuhuiukdefivevjvbuiktr RACE: azceur2fe4ucuq2eivediojrfbfb6 LACE: cedeisshiutsqksdircuqnbzgeueuhy UTF-16: ?????????????????????????????????? UTF-8: ?????????????????????????????????? (B) Chinese (simplified): u+4ED6 u+4EEC u+4E3A u+4EC0 u+4E48 u+4E0D u+8BF4 u+4E2D u+6587 UTF-16: ?????????????????? AMC-V: w87g8nvk6awispmrwupb6h BRACE: kgcqqsgp26i5h4zn7req5i AMC-M: uqj7g8nvk6awispn9wupdnh AMC-Z: ihqwcrb4cv8a8dqg056pqjye AMC-R: w87g8nvk6awisp259eupyx2h AMC-W: w87g8nvk6awisp259esupb6h AMC-O: eqpg8nvk6awisp259eupyx2h MACE: xbmmzhqmmnqk8i5xqvkbhdhc7 DUDE: w85gvk7g9k2iwf6x9j6x7ju54k UTF-8: ??????????????????????????? LACE: azhnn3b2ybea2aml6qau4libmwdq RACE: 3bhnmtxmjy5e5qcojbha3c7ujywwlby (C) Czech: Proprostnemluvesky U+0050 u+0072 u+006F u+010D u+0070 u+0072 u+006F u+0073 u+0074 u+011B u+006E u+0065 u+006D u+006C u+0075 u+0076 u+00ED u+010D u+0065 u+0073 u+006B u+0079 UTF-8: Pro??prost??nemluv????esky AMC-Z: Proprostnemluvesky-uyb24dma41a AMC-R: -Pro-yp-prost-tm-nemluv-s8pp-esky AMC-W: -Pro-yp-prost-zm-nemluv-wpyp-esky AMC-V: -Pro-yp-prost-zm-nemluv-wpyp-esky MACE: -Pro-zod-prost-gm-nemluv-vmv0-esky AMC-O: piq-Pro-p-prost-9m-nemluv-6pp-esky AMC-M: g26-Pro-p-prost-9m-nemluv-6pp-esky BRACE: i32-Pro-u-prost-8y-nemluv-29f3n-esky DUDE: tActptyctzpctptnhtyrtzfmibtjd3mt8atyitgtitc UTF-16: ???????????????????????????????????????????? LACE: amaha4tpaeaq2biaobzg643uaearwbyanzsw23dvo3wqcainaqagk43\ lpe RACE: ah7xb73s75xq373q75zp6377op7xig77n37wl73n75wp65p7o3762dp\ 7mx7xh73l754q (D) Hebrew: u+05DC u+05DE u+05D4 u+05D4 u+05DD u+05E4 u+05E9 u+05D5 u+05D8 u+05DC u+05D0 u+05DE u+05D3 u+05D1 u+05E8 u+05D9 u+05DD u+05E2 u+05D1 u+05E8 u+05D9 u+05EA AMC-Z: 4dbcagdahymbxekheh6e0a7fei0b AMC-V: x7ng7eep8e8jfinaqdb8ijp8cb8ij8k AMC-O: afpnqeep8e8jfinaqdb8ijp8cb8ij8k AMC-M: af4nqeep8e8jfinaqdb8ijp8cb8ij8k AMC-R: x7nqeep8e8j7f7inaqdb8ijp8cb8ij8k DUDE: x5nckajvjpvnpenqpcvjvbevrvdvjvbvd AMC-W: x7nqeep8ej7finaqdb8i7jp8c7b8i7j8k BRACE: 27vkyp7bgwmbpfjgc4ynx5nd8xsp5nd9c MACE: 1esz2a09hpdhsd4ced2hphh4hvhjhphhhj RACE: axon5vgu3xsotvoy3tin5u6r5dm53ywr5dm6u LACE: cyc5zxwu2to6j2ov3donbxwt2huntxpc2hunt2q UTF-16: ???????????????????????????????????????????? UTF-8: ???????????????????????????????????????????? (E) Hindi (Devanagari): u+092F u+0939 u+0932 u+094B u+0917 u+0939 u+093F u+0928 u+094D u+0926 u+0940 u+0915 u+094D u+092F u+094B u+0902 u+0928 u+0939 u+0940 u+0902 u+092C u+094B u+0932 u+0938 u+0915 u+0924 u+0947 u+0939 u+0948 u+0902 AMC-Z: i1baa7eci9glrd9b2ae1bj0hfcgg6iyaf8o0a1dig0cd BRACE: 2b7xtenqdr7zc6uma2pmcz7ibage237kdemicnk9gei32 RACE: bextsmslc44t6kcnezabktjpjmbcqokaaiwewmrycuseookiai LACE: dyes6ojsjmltspzijuteafknf5fqekbziabcyszshaksirzzjaba AMC-O: ajeurvjvcmthvjvruipugatfpurmscuivjascunmvcvitfuehvjisc AMC-M: ajhurbvcwmthbhuiwpugitfwpurwmscuibiscunwmvcatfuerbwisc AMC-R: 3urvjvcwmthjruiwpugwatfwpurmscuivjascunmvcvitfuewhjwisc AMC-V: 3urvjvcwmthjruiwpugwatfwpurwmscuivjiscunwmkvitfuewhvjwi\ sc DUDE: 3wrtgmzjxnuqgthyfymygxfxiycyewjuktbzjwcuqyhzjkupvbydzqz\ bwk AMC-W: 3urvjcwmthvjruiwpugwatfwpurwmscuivjwascunwmvcitfuewhvjw\ isc MACE: 29fzgmbjpishe6gnj5jbj6ilioj2j4i9haghjpi2hej7jpahdhhj3ju\ jhia UTF-16: ???????????????????????????????????????????????????????\ ????? UTF-8: ???????????????????????????????????????????????????????\ ??????????????????????????????????? (F) Japanese (kanji and hiragana): u+306A u+305C u+307F u+3093 u+306A u+65E5 u+672C u+8A9E u+3092 u+8A71 u+3057 u+3066 u+304F u+308C u+306A u+3044 u+306E u+304B UTF-16: ???????????????????????????????????? AMC-Z: n8jok5ay5dzabd5bym9f0cm5685rrjetr6pdxa BRACE: ji8nr5zj8uqth7v97mjchakwcg7dqemw88nj5gbe AMC-O: gvagkxnzr3dkx8fzun243q3c24zbxhgwr2nkweqwm AMC-R: vsykxnzr3dkyx8fyzun243q3c24zbxhgwr2nkweqwm AMC-V: vsykxnzr3dykb9fcjnme83cmdtxhygwr2nykweyqwm AMC-M: bsnkxnzr3dkyx8fyzun243q3c24zbxhgwr2nkweqwm AMC-W: vsykxnzr3dykyx8fcjnme8vs3cmdtvsxhygwr2nykweyqwm MACE: x43azhmh3ncnpxhf5hpcqku44iqjh42nzhhh9m3n6hehah5 DUDE: vsskvgud8n9jxx2ru6j875c54sn548d54ugvbuj6d8guqukuf LACE: auyguxd7snvaczpfaftsyamktyatbeqbrjyqqmcxmzhyy2senzfq UTF-8: ?????????????????????????????????????????????????????? RACE: 3aygumc4gb7tbezqnjs6kzzmrkpdbeukoeyfomdggbhtbdbqniyeimd\ ogbfq (G) Korean (Hangul syllables): u+C138 u+ACC4 u+C758 u+BAA8 u+B4E0 u+C0AC u+B78C u+B4E4 u+C774 u+D55C u+AD6D u+C5B4 u+B97C u+C774 u+D574 u+D55C u+B2E4 u+BA74 u+C5BC u+B9C8 u+B098 u+C88B u+C744 u+AE4C UTF-16: ???????????????????????????????????????????????? AMC-Z: 989aomsvi5e83db1d2a355cv1e0vak1dwrv93d5xbh15a0dt30a5jps\ d879ccm6fea98c AMC-M: yhxcj2w6exiaxi68acfn92n68ezehk6xypdpwam6zehmwhk648eavwd\ p6aqi23ieemweywn UTF-8: ???????????????????????????????????????????????????????\ ????????????????? AMC-V: 6tvifgem42ixihhakfnh6nhhem5wrk6fmpmpwim6zermwrk6gzeivwm\ p6iqige2nemm4efun MACE: g9ob64hqoel8d70g5cdscd74hrklasbbdhdkebshrklbklascn4ejkh\ dsee8c4oi4bhq4bic AMC-W: 6tvifgem42ixihhakfnh6nhhem5wrk6fmpmpwim6m5wrmwxn5u8eivw\ mp6iqige2nemm4efun BRACE: y394qebjusrcndbs82pkvstf96sxufcr7ffr4vbgdwsxufcx8pdktgb\ gmnsqydmk7im56arju6pt82 LACE: 77atrlgey5mlvkfu4dakzn4mwtsmo5gvlsww3rnuxf6mo5gvotkvzmx\ exj2mlpfzzcyjrsely5ck4ta RACE: 3datrlgey5mlvkfu4dakzn4mwtsmo5gvlsww3rnuxf6mo5gvotkvzmx\ exj2mlpfzzcyjrsely5ck4ta AMC-O: m6hwq6tvi466exi44ia6s4nz2neze7xxn47yp6x5e3znze7xze7xxnu\ 8e4ze6x5n36is3i622mwe48wn DUDE: 6txiy79ny53nz79a8wizwwnzzuavyizv3atuuiz2vby27jz66iz8sit\ usauiyz5i23az96iz6ze3xaz2td96ry3si AMC-R: 6tvi466ezxi544i5w8a6s4nz2nw8e6zze7xxn47yp6x5e53znze7xze\ 7xxn5u8e54ze6x5n36is3i622m6zwe48wn (H) Russian (Cyrillic): U+043F u+043E u+0447 u+0435 u+043C u+0443 u+0436 u+0435 u+043E u+043D u+0438 u+043D u+0435 u+0433 u+043E u+0432 u+043E u+0440 u+044F u+0442 u+043F u+043E u+0440 u+0443 u+0441 u+0441 u+043A u+0438 AMC-Z: b1abfaaepdrnnbgefbaDotcwatmq2g4l DUDE: wxRbzjzcjzrzfdmdffigpnnzqrpzpbzqdcazmc AMC-W: wvRqwhvfnwdvgfqpipfdqcqwarcvrqwadbbvki AMC-M: aehHgrvfemvgvfgfafvfvdgvcgiwrkhgimjjca AMC-V: wvRgrvfnmvgfqpipfdqcqwawrwcrqwawdwbwbka MACE: 11vz1jpji9jvjl3b35586dccjufdjt1ju320jr2 AMC-R: wvRqwhfnwdgfqpipfdqcqwawrcvrvqwawdbbvkvi AMC-O: aedRqwhfnwdgfqpipfdqcqwawrwcrqwawdwbwbki BRACE: 269xyjvcyafqfdwyr3xfd8z8byi6z39xyi692s7ug2 RACE: aq7t4rzvhrbtmnj6hu4d2njthyzd4qcpii7t4qcdifatuoa LACE: dqcd6pshgu6egnrvhy6tqpjvgm7depsaj5bd6psainaucory UTF-16: ???????????????????????????????????????????????????????\ ??? UTF-8: ??????????????????????????????????????????????????????? ??? (I) Spanish: PorqunopuedensimplementehablarenEspaol U+0050 u+006F u+0072 u+0071 u+0075 u+00E9 u+006E u+006F u+0070 u+0075 u+0065 u+0064 u+0065 u+006E u+0073 u+0069 u+006D u+0070 u+006C u+0065 u+006D u+0065 u+006E u+0074 u+0065 u+0068 u+0061 u+0062 u+006C u+0061 u+0072 u+0065 u+006E U+0045 u+0073 u+0070 u+0061 u+00F1 u+006F u+006C UTF-8: Porqu??nopuedensimplementehablarenEspa??ol AMC-Z: PorqunopuedensimplementehablarenEspaol-fmd56a AMC-V: -Porqu-j-nopuedensimplementehablarenEspa-j-ol AMC-R: -Porqu-j-nopuedensimplementehablarenEspa-9b-ol AMC-W: -Porqu-j-nopuedensimplementehablarenEspa-xb-ol MACE: -Porqu-zn9-nopuedensimplementehablarenEspa-go-ol AMC-M: aa7-Porqu-b-nopuedensimplementehablarenEspa-j-ol BRACE: 22x-Porqu-9-nopuedensimplementehablarenEspa-j-ol AMC-O: aaq-Porqu-j-nopuedensimplementehablarenEspa-9b-ol DUDE: tAtrtpde3n2hbtrftabbmtptketptnjiimtktbpjdqptdthmMtgdtb3\ a3qd RACE: abyg64troxuw433qovswizloonuw24dmmvwwk3tumvugcytmmfzgk3t\ fonygd4lpnq LACE: faaha33sof26s3tpob2wkzdfnzzws3lqnrsw2zloorswqylcnrqxezl\ omvzxayprn5wa UTF-16: ???????????????????????????????????????????????????????\ ????????????????????????? (J) Taiwanese: u+4ED6 u+5011 u+7232 u+4EC0 u+9EBD u+4E0D u+8AAA u+4E2D u+6587 UTF-16: ?????????????????? AMC-M: uqk7gstbetu6arx7spkxkupbnh UTF-8: ??????????????????????????? AMC-Z: ihqwctvzc91f659drss3x8bo0yb BRACE: kgcqui49gatc2wyrn8y7cndgte9 AMC-V: w87gutbfbus6a385psspmfkupb6h MACE: xbmmc0hkhibm0vltbgdqlabhdhc7 AMC-W: w87gutbfbus6a385psspmfksupb6h AMC-R: w87gxstbzuvc6a385psp244kupyx2h AMC-O: eqpgxstbzuvc6a385psp244kupyx2h LACE: 75hnmuaroize5qe6xvha3cvkjywwlby RACE: 3bhnmuaroize5qe6xvha3cvkjywwlby DUDE: w85gt86huuudv69c7szp7s5a6w4h6w2hu54k (K) Vietnamese: Tisaohkhngthch\ nitingVit U+0054 u+1EA1 u+0069 u+0073 u+0061 u+006F u+0068 u+1ECD u+006B u+0068 u+00F4 u+006E u+0067 u+0074 u+0068 u+1EC3 u+0063 u+0068 u+1EC9 u+006E u+00F3 u+0069 u+0074 u+0069 u+1EBF u+006E u+0067 U+0056 u+0069 u+1EC7 u+0074 AMC-Z: TisaohkhngthchnitingVit-kjcr8268qyxafd2f1b9g UTF-8: T???isaoh???kh??ngth???ch???n??iti???ngVi???t AMC-O: atqn-T-4b-isaoh-p-kh-s9e-ngth-d-ch-j-n-s9d-iti-5r-ngVi-\ h-t AMC-M: a82-T-4b-isaoh-p-kh-ss9e-ngth-d-ch-j-n-ss9d-iti-5r-ngVi\ -h-t BRACE: IYK-t-4-isaoh-MG-kh-29N-ngth-AF-ch-6W-n-2H8-iti-HU-ngvi\ -9-t AMC-R: -T-t84b-isaoh-6p-kh-ss9e-ngth-6d-ch-j-n-ss9d-iti-5r-ngV\ i-h-t UTF-16: ???????????????????????????????????????????????????????\ ??????? AMC-V: -T-t84b-isaoh-6p-kh-ss9e-ngth-dyd-ch-6j-n-s9d-iti-5r-ng\ Vi-6h-t AMC-W: -T-t84b-isaoh-6p-kh-ss9e-ngth-dyd-ch-6j-n-s9d-iti-t85r-\ ngVi-6h-t MACE: -T-7l1-isaoh-7md-kh-07k-ngth-7m3-ch-za-n-w07j-iti-7lv-n\ gVi-7m7-t DUDE: tEt87ft86itktcqht84ft84gd3n3kjtdtnt84mt84amt84bt84h3p3k\ tptpt87gt87bjtBtrt84qt85d LACE: aeahiai6uecqa2ltmfxwqai6zudqa23i6rxgo5diaepmgaqamnuachw\ jauag543joruqchv7aqag4z3wnear5rybab2a RACE: d37xjip7nh7xh73b75x762gn75v762h76t7w573h752p62gd75r762g\ j75xp7477nh7xj73jx77w573h753p62oh752a The next several examples are all names of Japanese music artists, song titles, and TV programs, just because the author happens to have them handy (but Japanese is useful for providing examples of single-row text, two-row text, ideographic text, and various mixtures thereof). (L) 3B u+0033 u+5E74 U+0042 u+7D44 u+91D1 u+516B u+5148 u+751F UTF-16: ???????????????? UTF-8: 3???B??????????????? AMC-Z: 3B-ww4c5e180e575a65lsy2b AMC-V: -3-x8ze-B-h4en8tvymwif29 AMC-W: -3-x8ze-B-h4en8tvymwizxtr MACE: -3-xfjk-B-na4sehcbbca8l8v AMC-M: utk-3-8ze-B-hkenqtymwifi9 BRACE: u-3-ygj-b-ynb6gjc7pp4k5p5w AMC-O: fb8h-3-e-B-z7we3t7bymwizxtr DUDE: xdx8whx8tGz7ug863f6s5kuduwxh RACE: 3aadgxtuabrh2rer2fiwwukioupq LACE: 74adgxtuabrh2rer2fiwwukioupq AMC-R: -3-x8ze-B-z7we3t7btymtwizxtr (M) -with-SUPER-MONKEYS u+5B89 u+5BA4 u+5948 u+7F8E u+6075 u+002D u+0077 u+0069 u+0074 u+0068 u+002D U+0053 U+0055 U+0050 U+0045 U+0052 u+002D U+004D U+004F U+004E U+004B U+0045 U+0059 U+0053 UTF-8: ??????????????????-with-SUPER-MONKEYS AMC-V: x52j4e5wiinqavx---with--SUPER--MONKEYS AMC-W: x52j4e5wiz92qavx---with--SUPER--MONKEYS MACE: xes9et4ea8nseg3l---with--SUPER--MONKEYS AMC-M: u5m2j4etwif6q2zf---with--SUPER--MONKEYS AMC-Z: -with-SUPER-MONKEYS-pc58ag80a8qai00g7n9n AMC-R: x52j4e3wiz92qyszf---with--SUPER--MONKEYS AMC-O: fmij4e3wiz92qyszf---with--SUPER--MONKEYS BRACE: uvj7fuaqcahy982xa---with--SUPER--MONKEYS DUDE: x58jupu8nuy6gt99m-yssctqtptn-tMGFtFtH-tRCBFQtNK UTF-16: ???????????????????????????????????????????????? LACE: ajnytjablfeac74oafqhkeyafv3ws5difvzxk4dfoiww233onnsxs4y RACE: 3bnysw5elfeh7dtaouac2adxabuqa5aanaac2adtab2qa4aamuaheab\ nabwqa3yanyagwadfab4qa4y (N) Hello-Another-Way- U+0048 u+0065 u+006C u+006C u+006F u+002D U+0041 u+006E u+006F u+0074 u+0068 u+0065 u+0072 u+002D U+0057 u+0061 u+0079 u+002D u+305D u+308C u+305E u+308C u+306E u+5834 u+6240 UTF-8: Hello-Another-Way-????????????????????? AMC-Z: Hello-Another-Way--fc4qua05auwb3674vfr0b AMC-V: -Hello--Another--Way---vsxp2nxq2nyq4vebca BRACE: ji7-Hello--Another--Way---v3jhaefvd2ufj62 AMC-R: -Hello--Another--Way---vsxp2nq2nyqx2veyuwa AMC-W: -Hello--Another--Way---vsxp2nxq2nyq4veyuwa AMC-O: daf-Hello--Another--Way---p2nq2nyqx2veyuwa AMC-M: bsk-Hello--Another--Way---p2nq2nyqx2veyuwa DUDE: Ipjad-Qrbtmtnpth-Ftgti-vsue7b7c7c8cy2xkv4ze MACE: -Hello--Another--Way---x42tzmhmimin2xe1kgi0 UTF-16: ?????????????????????????????????????????????????? LACE: ciagqzlmnrxs2ylon52gqzlsfv3wc6jnauyf3dc6rrxacwbuafrea RACE: 3aagqadfabwaa3aan4ac2adbabxaa3yaoqagqadfabzaaliao4agcad\ zaawtaxjqrqyf4memgbxfqndcia (O) 2 u+3072 u+3068 u+3064 u+5C4B u+6839 u+306E u+4E0B u+0032 UTF-16: ???????????????? AMC-Z: 2-u9tlzr9756bt3uc0v AMC-V: vszcyiye8wmct3yqssm-2 UTF-8: ?????????????????????2 AMC-O: dagzciex6wmy2vjqw8sm-2 AMC-M: bsnzciex6wmy2vjqw8sm-2 BRACE: ji96u56uwbhf2wqxnw4s-2 AMC-R: vszcyiyex6wmy2vjqw8sm-2 AMC-W: vszcyie8wmy2vjvsyqssm-2 MACE: x43izgqcxf2bi1p43ebgb-2 DUDE: vstctkny6urvwzcx2xhz8yfw8vj RACE: 3ayhemdigbsfys3iheyg4tqlaaza LACE: 74yhemdigbsfys3iheyg4tqlaaza (P) MajiKoi5 U+004D u+0061 u+006A u+0069 u+3067 U+004B u+006F u+0069 u+3059 u+308B u+0035 u+79D2 u+524D UTF-8: Maji???Koi??????5?????? UTF-16: ?????????????????????????? AMC-Z: MajiKoi5-783gue6qz075azm5e AMC-V: -Maji-vsyh-Koi-xj2m-5-g8uwwp AMC-W: -Maji-vsyh-Koi-xj2m-5-z37cwwp AMC-M: bsm-Maji-r-Koi-b2m-5-z37cxuwp BRACE: ji8-Maji-g-Koi-qe7x-5-wx7p6ma AMC-R: -Maji-vsyh-Koi-xj2m-5-z37cxuwp MACE: -Maji-x437-Koi-zhumi-5-xmeicid AMC-O: dag-Maji-h-Koi-xj2m-5-z37cxuwp DUDE: PnmdvssqvssNegvsva7cvs5qz38hu53r RACE: 3aag2adbabvaa2jqm4agwadpabutawjqrmadk6oskjgq LACE: 74ag2adbabvaa2jqm4agwadpabutawjqrmadk6oskjgq (Q) de u+30D1 u+30D5 u+30A3 u+30FC u+0064 u+0065 u+30EB u+30F3 u+30D0 UTF-16: ?????????????? BRACE: 3iu8pazt-de-pygi AMC-Z: de-jg4avhby1noc0d AMC-O: dapbf4d9n-de-8m9da AMC-M: bs3jp4d9n-de-8m9di AMC-R: vs7bf4d9n-de-8m9d7a AMC-W: vs7b7f4d9n-de-8m9d7a RACE: gdi5li7475sp6zpl6pia MACE: x46hz4jmiv-de-gngoh3 AMC-V: vs7b7f4d9n-de-8m9d7a DUDE: vs5bezgxrvs3ibvs2qtiud UTF-8: ????????????de????????? LACE: aqyndvnd7qbaazdfamyox46q (R) u+305D u+306E u+30B9 u+30D4 u+30FC u+30C9 u+3067 RACE: gbow5oou7tewo UTF-16: ?????????????? BRACE: bidprdmp9wt7mi LACE: a4yf23vz2t6mszy AMC-Z: d9juau41awczczp AMC-O: dagxpq5j7e9n6jh AMC-M: bsmfyq5j7e9n6jr DUDE: vsvpvd7hypuivf4q AMC-R: vsxpyq5j7e9n6jyh AMC-W: vsxpyq5j7e9n6jyh AMC-V: vsxpyq5j7e9n6jyh MACE: x42tzhjmnjdh8hlle UTF-8: ????????????????????? The last example is an ASCII string that breaks not only the existing rules for host name labels but also the rules proposed in [NAMEPREP03] for internationalized domain names. (S) -> $1.00 <- u+002D u+003E u+0020 u+0024 u+0031 u+002E u+0030 u+0030 u+0020 u+003C u+002D UTF-8: -> $1.00 <- AMC-Z: -> $1.00 <-- DUDE: -xqtqetftrtqatatn- RACE: aawt4ibegexdambahqwq LACE: bmac2praeqys4mbqea6c2 AMC-W: --svquae-1-q-00-avn-- AMC-V: --svquae-1-q-00-avn-- MACE: --zhugu4-1-a-00-egs-- UTF-16: ?????????????????????? AMC-R: --svquaue-1-q-00-avn-- AMC-O: aac--vqae-1-q-00-avn-- AMC-M: aae--vqae-1-q-00-avn-- BRACE: 229--t2b4-1-w-00-i9i-- References [ACE37] Edmon Chung, David Leung, "ACE Utilizing All 37 Alphanumeric Characters (ACE37)", 2001-Jun, draft-chung-idn-ace37-00. [AMCACEM] Adam Costello, "AMC-ACE-M version 0.1.4", 2001-Apr-01, update of draft-ietf-idn-amc-ace-m-00, latest version at http://www.nicemice.net/idn/. [AMCACEO] Adam Costello, "AMC-ACE-O version 0.0.5", 2001-May-27, update of draft-ietf-idn-amc-ace-o-00, latest version at http://www.nicemice.net/idn/. [AMCACER] Adam Costello, "AMC-ACE-R version 0.2.1", 2001-May-31, draft-ietf-idn-amc-ace-r-01, latest version at http://www.nicemice.net/idn/. [AMCACEV] Adam Costello, "AMC-ACE-V version 0.1.0", 2001-May-31, draft-ietf-idn-amc-ace-v-00, latest version at http://www.nicemice.net/idn/. [AMCACEW] Adam Costello, "AMC-ACE-W version 0.1.0", 2001-May-31, draft-ietf-idn-amc-ace-v-00, latest version at http://www.nicemice.net/idn/. [AMCACEZ] Adam Costello, "AMC-ACE-Z version 0.3.0", 2001-Aug-07, update of draft-costello-idn-amc-ace-z-00, latest version at http://www.nicemice.net/idn/. [BRACE] Adam Costello, "BRACE: Bi-mode Row-based ASCII-Compatible Encoding for IDN version 0.1.2", 2000-Sep-19, draft-ietf-idn-brace-00, latest version at http://www.nicemice.net/idn/. [DUDE02] Mark Welter, Brian Spolarich, Adam Costello, "Differential Unicode Domain Encoding (DUDE)", 2001-Jun-07, draft-ietf-idn-dude-02. [FACE] Adam Costello, "Friendly ASCII-Compatible Encoding (FACE) version 0.2.1", 2000-Sep-04, latest version at http://www.nicemice.net/idn/. [IDN] Internationalized Domain Names (IETF working group), http://www.i-d-n.net/, idn@ops.ietf.org. [IDNA] Patrik Faltstrom, Paul Hoffman, "Internationalizing Host Names In Applications (IDNA)", 2001-Jun-16, draft-ietf-idn-idna-02. [LACE01] Mark Davis, Paul Hoffman, "LACE: Length-based ASCII Compatible Encoding for IDN", 2001-Jan-05, draft-ietf-idn-lace-01. [MACE] Makoto Ishisone, Yoshiro Yoneya, "MACE: Modal ASCII Compatible Encoding for IDN", 2001-Jun-28, draft-ietf-idn-mace-01. [PROVINCIAL] Michael Kaplan, "The 'anyone can be provincial!' page", http://www.trigeminal.com/samples/provincial.html. [RACE03] Paul Hoffman, "RACE: Row-based ASCII Compatible Encoding for IDN", 2000-Nov-28, draft-ietf-idn-race-03. [UNICODE] The Unicode Consortium, "The Unicode Standard", http://www.unicode.org/unicode/standard/standard.html. [UTF5] James Seng, Martin Duerst, Tin Wee Tan, "UTF-5, a Transformation Format of Unicode and ISO 10646", draft-jseng-utf5-*. [UTFCONV] Mark Davis, "UTF Converter", http://www.macchiato.com/unicode/convert.html. [UTS6] Misha Wolf, Ken Whistler, Charles Wicksteed, Mark Davis, Asmus Freytag, "Unicode Technical Standard #6: A Standard Compression Scheme for Unicode", http://www.unicode.org/unicode/reports/tr6/.