Los archivos generalmente indican su codificación con un encabezado de archivo. Hay muchos ejemplos aquí . Sin embargo, incluso leyendo el encabezado nunca puede estar seguro de qué es lo que realmente utiliza la codificación de un archivo .
Por ejemplo, un archivo con los tres primeros bytes 0xEF,0xBB,0xBF
es probablemente un archivo codificado en UTF-8. Sin embargo, podría ser un archivo ISO-8859-1 que comienza con los caracteres 
. O podría ser un tipo de archivo completamente diferente.
Notepad ++ hace todo lo posible para adivinar qué codificación está utilizando un archivo, y la mayoría de las veces lo hace correctamente. Aunque a veces se equivoca, es por eso que el menú 'Codificación' está ahí, por lo que puede anular su mejor estimación.
Para las dos codificaciones que mencionas:
- Los archivos "UCS-2 Little Endian" son archivos UTF-16 (según lo que entiendo de la información aquí ) así que probablemente comience con
0xFF,0xFE
como los primeros 2 bytes. Por lo que puedo decir, Notepad ++ los describe como "UCS-2" ya que no admite ciertas facetas de UTF-16.
- Los archivos "UTF-8 sin BOM" no tienen bytes de encabezado. Eso es lo que significa el bit "sin BOM".