¿Subconjunto visual y audiblemente no ambiguo del alfabeto latino?

12

Imagina que le das a alguien una tarjeta con el código "5SBDO0".

En algunas fuentes, la letra "S" es difícil de distinguir visualmente del número cinco, (como con el número cero y la letra "O").

Al leer el código en voz alta, puede ser difícil distinguir "B" de "D", por lo que es necesario decir "B como en el niño", "D como en el perro" o usar una " alfabeto fonético " en su lugar.

¿Cuál es el mayor subconjunto de letras y números que, en la mayoría de los casos, ambos se verán sin ambigüedades visualmente y sonarán inequívocos cuando se lean en voz alta?

Fondo:

Queremos generar una cadena corta que pueda codificar tantos valores como sea posible sin dejar de ser fácil de comunicar.

Imagina que tienes una cadena de 6 caracteres, "123456". En la base 10 esto puede codificar 10 ^ 6 valores.

En el hex "1B23DF" puede codificar 16 ^ 6 valores en el mismo número de caracteres, pero esto puede sonar ambiguo cuando se lee en voz alta. ("B" contra "D")

Del mismo modo, para cualquier cadena de N caracteres, obtienes (tamaño del alfabeto) ^ N valores.

La cadena está limitada a una longitud de unos seis caracteres, debido a que se desea que se ajuste fácilmente dentro de la capacidad de capacidad de memoria de trabajo humana .

Por lo tanto, para encontrar el número máximo de valores que podemos codificar, necesitamos encontrar el mayor conjunto de letras / números no ambiguos. No hay ninguna razón por la que no podamos considerar las letras GZ, y algunos signos de puntuación comunes, pero no quiero tener que ir manualmente en pares comparativos "¿suena G como A?", "¿G suena como B?", "Si G suena como C "yo mismo. Como sabemos, esto sería O (n ^ 2) trabajo lingüístico por hacer =) ...

    
pregunta elliot42 25.03.2012 - 22:44

4 respuestas

15

Debe dividir el conjunto de caracteres alfanuméricos en grupos por similitud visual, y elegir un representante "más icónico" de cada grupo. Esto es algo subjetivo, aunque podría ejecutar pruebas de usuario en él. Las elecciones que realice también dependerán de si las figuras serán impresas o escritas a mano. Por ejemplo:

  • { O , 0 , Q , D }

  • { I , L , 1 }

  • { B , 8 }

  • { Z , 2 }

  • { S , 5 }

  • { 7 , T }

  • { U , V , Y }

Del mismo modo, divide los caracteres por la similitud fonética de las pronunciaciones de sus nombres:

  • { A [ʔeɪ], 8 [ʔeɪ (ʔ / t)]}
    = comienza con [ʔeɪ]

  • { P [pi:], B [bi:], V [vi:], D [di:], T [ti:], E [ʔi:]}
    = detener / fricativo + [i:]

  • { G [ʤi:], C [si:], Z [zi:], 3 [θɹi:]}
    = fricativa / affricate (cluster) + [i:]

  • { M [ɛm], N [ɛn]}
    = [ɛ] + nasal

  • { S [ɛs], F [ɛf], X [ɛks]}
    = [ɛ] + fricativa / affricate

  • { I [ʔaɪ], Y [waɪ], 5 [faɪv], 9 [naɪn]}
    = consonante + [aɪ] + (consonante)

  • { Q [kjʉ:], U [jʉ:], 2 [t (j):]}
    = consonante + [(j) ʉ:]

Estas son, por supuesto, no las únicas particiones posibles, solo lo que viene a la mente en este momento. En cualquier caso, deberían ser suficientes para que comiences a realizar más pruebas. Además, estas fuentes no están respaldadas por ninguna fuente profesional, solo cito mis antecedentes de aficionado en tipografía y fonética.

    
respondido por el Jon Purdy 25.03.2012 - 23:14
3

Puede usar Turk turco para que las personas reales califiquen los 26 ^ 2 pares de letras en cuanto a similitud auditiva y visual. La ventaja es que incluso podría obtener datos para varios idiomas nativos de esta manera.

    
respondido por el Michael Borgwardt 26.03.2012 - 09:52
1

Para inglés, soundex y Metaphone codifican los sonidos que son ambiguos. Soundex es probablemente demasiado simple, pero Metaphone incorpora algunos puntos buenos. ¿Quieres la secuencia "OU"? Eso podría ser pronunciado de muchas maneras, como lo demuestra esta oración;)

    
respondido por el MSalters 27.03.2012 - 00:09
0

La respuesta anterior de Jon Purdy parece la más correcta. Por motivos prácticos, estoy probando z-base-32 , una codificación base32 no estándar diseñada teniendo en cuenta la capacidad de comunicación. Parece funcional, aunque no ideal, por ejemplo. no se enfocaron explícitamente en la desambiguación hablada.

enlace

enlace

    
respondido por el elliot42 27.03.2012 - 07:50

Lea otras preguntas en las etiquetas