Lema (lingüística): qué es, definición y diferencia con lexema
Descubre qué es un lema en lingüística, su definición y cómo se diferencia del lexema: ejemplos claros y explicación sencilla para entender formas y significados.
Lema es la forma de una palabra que encabeza una entrada en un diccionario; se la considera la forma canónica o de cita de un grupo de formas relacionadas. Todas las palabras que encabezan un diccionario son lemas: por convención se elige una forma concreta para representar el conjunto de formas flexionadas que comparten un mismo significado básico.
Técnicamente, un lema agrupa una palabra base y sus inflexiones: por ejemplo, en español el lema de un verbo suele ser el infinitivo (amar), y el lema de un sustantivo o adjetivo suele ser la forma singular masculina (árbol, bonito). Así, las formas amo, amas, amaba pertenecen al mismo lema amar, y árboles pertenece al lema árbol.
En cambio, un lexema es una unidad abstracta de significado que agrupa todas las formas relacionadas desde el punto de vista morfológico y semántico. El lexema puede abarcar formas flexionadas (inflectivas) e incluso unidades compuestas o pluriverbales: por ejemplo, los verbos frasales en inglés (give up) funcionan como lexemas multipalabra. El lexema es la unidad de significado, mientras que el lema es la forma concreta elegida para representarlo en la lista de entradas.
En inglés, por ejemplo, run, runs y running son formas del mismo lexema, pero run es el lema (la forma de cita). De manera análoga en español, las formas como, comí, comeremos pertenecen al lexema representado por el lema comer. Conviene distinguir además la flexión (variaciones gramaticales: tiempo, número, persona, género) de la derivación: palabras derivadas (por ejemplo, run vs. runner) suelen pertenecer a lexemas distintos porque implican un cambio léxico y, frecuentemente, semántico.
Algunas precisiones prácticas:
- Forma de cita: la elección del lema varía según la lengua y la práctica lexicográfica (infinitivo para verbos en español, forma base para verbos en inglés, singular para sustantivos, etc.).
- Variantes ortográficas: variantes como color / colour pueden tratarse como el mismo lexema con lemas distintos en distintas variantes del idioma o como lemas vinculados mediante referencias.
- Lexemas multipalabra: expresiones fijas o locuciones (aire acondicionado, give up) pueden considerarse lexemas y, por tanto, tienen su propio lema si aparecen en el diccionario como entrada.
- Homógrafos y polisemia: un lema ortográfico único puede corresponder a varios lexemas distintos si hay distintos significados (por ejemplo, banco como entidad financiera y banco como asiento); los diccionarios los separan por acepciones.
- Tecnologías del lenguaje: en procesamiento del lenguaje natural, la lematización es el proceso de reducir formas flexionadas a su lema; se diferencia del stemming porque la lematización produce formas léxicamente válidas y tiene en cuenta la categoría gramatical.
En resumen: el lexema es la unidad abstracta de significado que incluye todas las formas relacionadas, y el lema es la forma concreta y convencional que se elige para representar ese lexema en el diccionario o en procesos lingüísticos y computacionales.
Morfología
En inglés, el lema de un sustantivo es el singular: por ejemplo, mouse en lugar de mice. En las lenguas con género, la palabra principal de los adjetivos y sustantivos regulares suele ser el masculino singular. Si la lengua también tiene casos, el lema suele ser el nominativo masculino singular.
En muchos idiomas, la forma de citación de un verbo es el infinitivo: El francés aller, el alemán gehen, el español ir. En inglés suele ser el infinitivo completo (to go) aunque alfabetizado sin 'to' (go).
Diferencia entre tallo y lema
En lingüística computacional, una raíz es la parte de la palabra que nunca cambia aunque se utilicen diferentes formas de la palabra. Un lema es la forma base del verbo. Por ejemplo, de "producido", el lema es "producir", pero la raíz es "produc-". Esto se debe a que existen palabras como producción. Cuando se tiene en cuenta el sonido (fonología), la definición de la parte inmutable de la palabra no es tan útil. Fíjate en el sonido de las palabras del ejemplo: "producido" /prəˈdjuːst/ frente a "producción" /prəˈdʌkʃən/.
Algunos lexemas tienen varias raíces pero un solo lema. Por ejemplo, "to go" (el lema) tiene las raíces "go" y "went". Aquí, el tiempo pasado se basa en un verbo diferente, "to wend". El sufijo "-t" equivale a "-ed".
Buscar dentro de la enciclopedia