Lema es la forma de una palabra que encabeza una entrada en un diccionario; se la considera la forma canónica o de cita de un grupo de formas relacionadas. Todas las palabras que encabezan un diccionario son lemas: por convención se elige una forma concreta para representar el conjunto de formas flexionadas que comparten un mismo significado básico.

Técnicamente, un lema agrupa una palabra base y sus inflexiones: por ejemplo, en español el lema de un verbo suele ser el infinitivo (amar), y el lema de un sustantivo o adjetivo suele ser la forma singular masculina (árbol, bonito). Así, las formas amo, amas, amaba pertenecen al mismo lema amar, y árboles pertenece al lema árbol.

En cambio, un lexema es una unidad abstracta de significado que agrupa todas las formas relacionadas desde el punto de vista morfológico y semántico. El lexema puede abarcar formas flexionadas (inflectivas) e incluso unidades compuestas o pluriverbales: por ejemplo, los verbos frasales en inglés (give up) funcionan como lexemas multipalabra. El lexema es la unidad de significado, mientras que el lema es la forma concreta elegida para representarlo en la lista de entradas.

En inglés, por ejemplo, run, runs y running son formas del mismo lexema, pero run es el lema (la forma de cita). De manera análoga en español, las formas como, comí, comeremos pertenecen al lexema representado por el lema comer. Conviene distinguir además la flexión (variaciones gramaticales: tiempo, número, persona, género) de la derivación: palabras derivadas (por ejemplo, run vs. runner) suelen pertenecer a lexemas distintos porque implican un cambio léxico y, frecuentemente, semántico.

Algunas precisiones prácticas:

  • Forma de cita: la elección del lema varía según la lengua y la práctica lexicográfica (infinitivo para verbos en español, forma base para verbos en inglés, singular para sustantivos, etc.).
  • Variantes ortográficas: variantes como color / colour pueden tratarse como el mismo lexema con lemas distintos en distintas variantes del idioma o como lemas vinculados mediante referencias.
  • Lexemas multipalabra: expresiones fijas o locuciones (aire acondicionado, give up) pueden considerarse lexemas y, por tanto, tienen su propio lema si aparecen en el diccionario como entrada.
  • Homógrafos y polisemia: un lema ortográfico único puede corresponder a varios lexemas distintos si hay distintos significados (por ejemplo, banco como entidad financiera y banco como asiento); los diccionarios los separan por acepciones.
  • Tecnologías del lenguaje: en procesamiento del lenguaje natural, la lematización es el proceso de reducir formas flexionadas a su lema; se diferencia del stemming porque la lematización produce formas léxicamente válidas y tiene en cuenta la categoría gramatical.

En resumen: el lexema es la unidad abstracta de significado que incluye todas las formas relacionadas, y el lema es la forma concreta y convencional que se elige para representar ese lexema en el diccionario o en procesos lingüísticos y computacionales.