Un compilador es un programa que traduce el código fuente de otro programa de un lenguaje de programación a un código ejecutable.
El código fuente suele estar en un lenguaje de programación de alto nivel (por ejemplo, Pascal, C, C ++, Java, Perl, C #, etc.). El código ejecutable puede ser una secuencia de instrucciones de la máquina que puede ser ejecutada directamente por la CPU, o puede ser una representación intermedia interpretada por una máquina virtual (por ejemplo, el código de bytes de Java).
En resumen, un compilador convierte un programa de un formato legible por humanos a un formato legible por máquina.
En cuanto a cómo funciona un compilador, eso es realmente complicado. Hay libros y cursos universitarios sobre el tema. Intentaré resumir brevemente las etapas principales del proceso, pero este será un resumen muy breve.
- Lexing: divida el texto del programa en "tokens". Los tokens son las "palabras" del lenguaje de programación, como identificadores (palabras clave, nombres de variables, nombres de funciones, etc.) u operadores (=, *, & amp ;, etc.).
- Análisis: convierte la secuencia de tokens en un árbol de análisis, que es una estructura de datos que representa varias construcciones de lenguaje: declaraciones de tipo, declaraciones de variables, definiciones de funciones, bucles, condicionales, expresiones, etc.
- Optimización: evalúe expresiones constantes, optimice las variables no utilizadas o el código inalcanzable, desenrolle los bucles si es posible, etc.
- Convierta el árbol de análisis en instrucciones de la máquina (o código de byte JVM).
Una vez más, recalco que esta es una descripción muy breve. Los compiladores modernos son muy inteligentes y, en consecuencia, muy complicados.