23.1. Conceptos básicos
El genoma humano es el conjunto completo del ADN de la célula humana. Incluye tanto los genes como otras secuencias no codificantes que participan en la organización, regulación y estabilidad del material genético.
Su estudio en medicina permite entender cómo se almacena, se transmite y se expresa la información biológica y cómo las alteraciones genéticas pueden relacionarse con la enfermedad.
Conviene diferenciar tres conceptos que a veces se confunden: el genoma, el genotipo y el fenotipo.
- genes;
- regiones reguladoras;
- secuencias repetidas;
- ADN no codificante.
En la especie humana, el genoma nuclear se organiza en 23 pares de cromosomas en las células somáticas.
Genotipo: conjunto de variantes genéticas que posee un individuo.
Fenotipo: manifestación observable del genotipo, modulada además por el ambiente.
Dicho de forma sencilla: el genoma es el total, el genotipo es la dotación concreta de una persona y el fenotipo es el resultado visible o funcional.
| Concepto | Qué significa | No lo confundas con |
|---|---|---|
| Genoma | Conjunto completo del ADN de una célula | Genotipo |
| Genotipo | Conjunto de variantes genéticas que posee un individuo | Genoma |
| Fenotipo | Manifestación observable del genotipo, modulada por el ambiente | Genotipo |
| Gen | Unidad funcional de información genética | Genoma completo |
| Transcriptoma | Conjunto de ARN producidos en una célula | Proteoma |
| Proteoma | Conjunto de proteínas expresadas por una célula | Transcriptoma |
Para examen
El genoma humano no es solo una lista de genes. Es un sistema complejo de ADN codificante y no codificante, organizado de forma precisa y sometido a múltiples mecanismos de regulación. Entender su estructura y su organización es el primer paso para comprender la genética humana y su aplicación en medicina.
23.2. El ADN como material genético
Para que una molécula pueda considerarse material genético debe ser capaz de:
- Almacenar información,
- copiarse con fidelidad y
- transmitirse a las células hijas y a la descendencia.
El ADN cumple estas condiciones, por eso constituye el soporte de la información hereditaria.
Este concepto se consolidó a partir de varios hitos históricos. Mendel describió la herencia de los caracteres. Griffith demostró la existencia de un “factor transformante”. Avery y sus colaboradores identificaron ese factor como ADN. Más adelante, Watson y Crick propusieron el modelo de doble hélice, que explicaba cómo podía conservarse y replicarse esta información.
Estos experimentos permitieron pasar de una genética “de caracteres” a la genética molecular.
23.3. Estructura general del ADN
El ADN está formado por nucleótidos que contienen cuatro bases nitrogenadas: adenina, timina, guanina y citosina.
Su estructura más característica es la doble hélice, en la que dos cadenas complementarias se disponen de forma antiparalela. Esta organización explica dos propiedades esenciales: la estabilidad de la información genética y la posibilidad de replicación.
Además, el ADN puede sufrir cambios conformacionales locales, asociarse a proteínas reguladoras y experimentar modificaciones químicas, como la metilación, que influyen en la expresión de los genes.
23.4. El producto génico
La información genética sigue, de forma general, este flujo:
El ADN constituye el genoma.
Los ARN transcritos a partir de él forman el transcriptoma.
Las proteínas resultantes constituyen el proteoma.
Este esquema sigue siendo útil, pero no debe simplificarse. No todo el ARN se traduce a proteína, y no toda la función del genoma depende solo de secuencias codificantes.
Por eso, cuando hablamos de genoma humano, hablamos de algo más amplio que una simple colección de genes “que fabrican proteínas”.
23.5. Organización general del genoma humano
El genoma humano contiene algo más de 3.000 millones de pares de bases y se organiza en 23 pares de cromosomas en las células somáticas.
Los genes no ocupan todo el genoma. De hecho, solo una pequeña parte corresponde a secuencias codificantes de proteínas. El resto incluye intrones, regiones reguladoras, secuencias repetidas y muchas otras zonas no codificantes.
Tampoco los genes están repartidos de manera uniforme. Hay regiones relativamente ricas en genes y otras mucho más pobres. Esta organización no es aleatoria y tiene implicaciones estructurales y funcionales.
El Proyecto Genoma Humano, completado en 2003 mediante la colaboración del Consorcio Público Internacional y la empresa Celera Genomics, permitió secuenciar por primera vez la práctica totalidad del genoma humano. Sus resultados sorprendieron: frente a las estimaciones iniciales de 80.000–140.000 genes, el número de genes codificantes de proteínas resultó ser mucho menor. Las anotaciones actuales —según GENCODE— lo sitúan en torno a 19.000–20.000.
Este hallazgo puso de manifiesto algo que hoy se conoce como la paradoja del valor C: no existe una correlación directa entre la cantidad de ADN de un organismo y su complejidad biológica. Organismos con genomas más grandes que el humano pueden tener menos genes funcionales; la diferencia reside en la proporción de ADN repetitivo, no codificante y de función reguladora. La complejidad no depende solo del número de genes, sino de cómo se organizan, regulan y combinan sus productos.
23.6. Tipos de secuencias en el genoma humano
El genoma humano contiene distintos tipos de secuencias, que pueden clasificarse según su función y según su grado de repetición.
Según su función:
- Secuencias codificantes, que participan en la síntesis de productos funcionales —proteínas o ARN funcionales.
- Secuencias no codificantes, que no producen proteínas pero desempeñan funciones reguladoras, estructurales o de control de la expresión génica.
Según su organización (grado de repetición):
- Secuencias únicas.
- Secuencias repetidas, entre las que destacan:
- Regiones de centrómeros y telómeros.
- Elementos dispersos derivados de retrotransposición: LINEs (Long Interspersed Nuclear Elements, como L1) y SINEs (Short Interspersed Nuclear Elements, como Alu).
- Retrovirus endógenos: secuencias de origen vírico integradas en el genoma de células germinales a lo largo de la evolución. No codifican proteínas víricas funcionales, pero persisten en el genoma y en algunos casos influyen en la regulación génica.
- Secuencias repetidas en tándem: microsatélites y minisatélites.
| Tipo de secuencia | Categoría | Ejemplos | Relevancia biomédica |
|---|---|---|---|
| Codificante | Según función | Genes que originan proteínas; genes de ARNr y ARNt | Síntesis de productos funcionales |
| No codificante | Según función | Intrones, regiones reguladoras, secuencias estructurales | Regulación y organización del genoma |
| Única | Según repetición | Genes de copia única | Información genética específica |
| Telómeros | Repetida localizada | Repetición TTAGGG | Protección de extremos cromosómicos |
| Centrómeros | Repetida localizada | ADN satélite α | Segregación cromosómica |
| LINEs | Repetida dispersa | L1 (~500.000 copias) | Retrotransposición; mutagénesis |
| SINEs | Repetida dispersa | Alu (~1 millón de copias) | Elemento más abundante del genoma |
| Retrovirus endógenos | Repetida dispersa | HERVs | Regulación génica; relictos evolutivos |
| Microsatélites | Repetida en tándem | Repeticiones de 2–5 pb | Genética forense; marcadores de enfermedad |
| Minisatélites | Repetida en tándem | Repeticiones de ~10–60 pb | Variabilidad genética individual |
23.7. Concepto molecular de gen
El concepto actual de gen es más amplio que la idea clásica de “fragmento de ADN que codifica una proteína”.
En eucariotas, un gen incluye la región transcrita y también secuencias necesarias para regular su expresión. Dentro de esa región transcrita distinguimos:
- exones, que permanecen en el ARN maduro;
- intrones, que se eliminan durante su procesamiento.
Además, el gen se asocia a una región promotora y a otras secuencias reguladoras que controlan cuándo, dónde y en qué cantidad se expresa.
Por otro lado, en muchos genes el procesamiento del ARN primario no sigue siempre el mismo patrón: distintas combinaciones de exones pueden generar ARN maduros diferentes a partir de un mismo gen. Este fenómeno se denomina splicing alternativo y explica que ~19.000 genes puedan dar lugar a un proteoma bastante más amplio. Es también una de las razones por las que la idea de «un gen, una proteína» resulta insuficiente para describir la biología real del genoma humano.
Por tanto, un gen debe entenderse como una unidad funcional de información genética, no solo como una secuencia lineal simple.
| Elemento | Qué es | Qué debes recordar |
|---|---|---|
| Promotor | Región donde se inicia el control de la transcripción | Regula el inicio |
| Exón | Secuencia que permanece en el ARN maduro | No siempre equivale a proteína completa |
| Intrón | Secuencia transcrita que se elimina durante el procesamiento | No permanece en el ARN maduro |
| Región reguladora | Secuencia que modula cuándo, dónde y cuánto se expresa un gen | Control de la expresión génica |