Editar: La pregunta ahora dice "millones de nuevos personajes". Esto facilita la respuesta:
No . Utf-8 es una codificación Unicode. Unicode tiene un espacio de código que permite 1,114,112 puntos de código distintos , y menos de un millón está actualmente sin asignar. Por lo tanto, no es posible admitir millones de nuevos caracteres en Unicode. Por definición, ninguna codificación Unicode puede admitir más caracteres de los que define Unicode. (Por supuesto, puedes hacer trampa codificando un nivel aún más: después de todo, cualquier tipo de información puede representarse con solo dos caracteres).
Para responder a la pregunta original:
Unicode no admite idiomas como tales, admite caracteres, símbolos utilizados para representar idiomas en forma escrita.
No todos los idiomas humanos tienen una representación escrita, por lo que no todos los idiomas humanos pueden ser admitidos por Unicode. Además muchos animales se comunican pero no tienen un lenguaje escrito. Las ballenas, por ejemplo, tienen una forma de comunicación que es lo suficientemente compleja como para llamar a un idioma, pero no tiene ninguna forma escrita (y tampoco puede ser capturada por la notación fonética existente). Así que ni siquiera todos los idiomas del mundo pueden ser soportados por Unicode.
Peor aún es algo como el lenguaje de las abejas. No solo no tiene una forma escrita, sino que no puede representarse de manera significativa en forma escrita. El lenguaje es un tipo de danza que básicamente apunta en una dirección pero depende de la posición actual del sol. Por lo tanto, la danza solo tiene valor informativo en el lugar y la hora en que se realiza. Una representación simbólica o textual tendría que incluir información (ubicación, posición del sol) que el lenguaje de las abejas actualmente no puede expresar.
Incluso una forma de comunicación escrita o simbólica podría no ser posible representar en Unicode. Por ejemplo, Unicode no puede admitir ilustraciones o cómics sin palabras ya que el conjunto de glifos no es finito. Notará mucha comunicación pictórica en entornos internacionales como un aeropuerto, por lo que no es inconcebible que una raza de extraterrestres haya evolucionado para usar un lenguaje pictórico.
Incluso si una raza alienígena tuviera un lenguaje con un sistema de escritura con un conjunto finito de símbolos, este sistema podría no ser compatible con Unicode. Unicode espera que la escritura sea una secuencia lineal de símbolos. La notación musical es un ejemplo de un sistema de escritura que no se puede representar completamente en Unicode, porque el significado está codificado tanto en la selección de símbolos como en la ubicación vertical y horizontal. (Unicode admite símbolos musicales individuales, pero no puede codificar una partitura). Una raza alienígena que se comunicó utilizando música polifónica (no infrecuente) o un canal de comunicación de complejidad similar, podría muy bien tener un sistema de escritura que se parezca a una partitura orquestal, y Unicode no puede soportar esto.
Pero, por el bien del argumento, supongamos que todos los idiomas, incluso los idiomas extraños, se pueden expresar como una secuencia lineal de símbolos seleccionados de un conjunto finito. ¿Es Unicode lo suficientemente grande para una invasión alienígena? Unicode tiene actualmente menos de un millón de puntos de código sin asignar. El idioma chino contiene cientos de miles de caracteres de acuerdo con el diccionario chino más completo (no todos ellos son compatibles actualmente con Unicode como caracteres distintos). Así que solo diez idiomas con la complejidad del chino usarían todo Unicode. En la tierra tenemos cientos de sistemas de escritura distintos, pero afortunadamente la mayoría son alfabéticos en vez de ideográficos y, por lo tanto, contienen un pequeño número de caracteres. Si todos los idiomas escritos usaran ideogramas como el chino, Unicode ni siquiera sería lo suficientemente grande para la Tierra. El uso de alfabetos se deriva del habla que solo usa un número limitado de fonemas, pero eso es particular para la fisiología humana. Así que incluso un solo planeta alienígena con solo una docena de sistemas de escritura ideográfica podría superar lo que Unicode puede soportar. Ahora considere si este alienígena ya ha invadido otros planetas antes de la Tierra e incluyó sus sistemas de escritura en el conjunto de caracteres que deben ser compatibles.
La expansión o modificación de las codificaciones actuales, o la introducción de nuevas codificaciones no resolverán esto, ya que la limitación está en el número de puntos de código admitidos por Unicode.
Entonces la respuesta es probablemente no.