Nuestros datos: eDNA de peces del Golfo de California
Los datos que usaremos durante el curso provienen de un estudio de ADN ambiental (eDNA) diseñado para evaluar la biodiversidad de peces en el Golfo de California mediante metabarcoding.
El estudio fue publicado en:
Valdivia-Carrillo T, Rocha-Olivares A, Reyes-Bonilla H, Domínguez-Contreras JF, Munguia-Vega A. (2021). Integrating eDNA metabarcoding and simultaneous underwater visual surveys to describe complex fish communities in a marine biodiversity hotspot. Molecular Ecology Resources, 21(5), 1558–1574. DOI: 10.1111/1755-0998.13375
Contexto del estudio
La biodiversidad marina puede evaluarse mediante censos visuales subacuáticos (UVC) y, más recientemente, con metabarcoding de eDNA. Aunque el eDNA es una herramienta prometedora, su escala de detección y el número de especies identificadas pueden variar con respecto a otros métodos de muestreo. Además, la precisión de la asignación taxonómica depende de contar con bases de datos de referencia completas.
En este estudio se compararon los resultados de censos visuales subacuáticos y muestreos simultáneos de eDNA para evaluar comunidades de peces, analizando las especies observadas y la composición de comunidades con ambos métodos.
Diseño de muestreo

- Región: Golfo de California, México
- Sitios de muestreo: 24 localidades distribuidas a lo largo del Golfo, cubriendo las regiones Norte, Central y Sur
- Tipo de muestra: agua de mar (ADN ambiental)
- Marcador molecular: 12S rRNA (código de barras para peces)
- Longitud del amplicón: ~65 bp (sin primers)
- Plataforma de secuenciación: Illumina MiSeq (lecturas paired-end 2×150 bp)
Lecturas paired-end
En secuenciación Illumina paired-end, cada fragmento de ADN se lee desde ambos extremos, generando dos archivos por muestra:
_R1_001.fastq— lectura forward (de 5’ a 3’)_R2_001.fastq— lectura reverse (de 3’ a 5’)
├──── R1 (forward) ────→
5' ─────┤ ├───── 3'
│ ◄── solapamiento ──► │
3' ─────┤ ├───── 5'
←──── R2 (reverse) ────┤
Las dos lecturas se solapan en la región central del amplicón. En nuestro caso, con un amplicón de ~65 bp y lecturas de 150 bp, cada lectura cubre el amplicón completo — el solapamiento es total. Más adelante en el pipeline, DADA2 las une (merge) para reconstruir la secuencia completa.
Principales hallazgos
- Se detectaron más especies con eDNA que con censos visuales subacuáticos
- Cada método detectó conjuntos diferentes de especies — combinados, duplicaron el número de especies registradas
- Ambos métodos recuperaron un gradiente de biodiversidad conocido y una ruptura biogeográfica en el Golfo
- El eDNA capturó diversidad en una escala geográfica y batimétrica más amplia
- El uso de una base de datos de referencia personalizada incrementó significativamente la asignación taxonómica
- Los modelos de ocupación revelaron que el eDNA proporcionó probabilidades de detección similares o superiores a los censos visuales
¿Qué vamos a analizar en el curso?
Trabajaremos con un subconjunto de los datos de este estudio: muestras de agua filtradas en campo, cuyo ADN fue extraído, amplificado con primers para el marcador 12S y secuenciado en Illumina MiSeq.
A lo largo del curso procesaremos estos datos desde los archivos FASTQ crudos hasta obtener una tabla de ASVs con asignación taxonómica y análisis de diversidad ecológica — replicando el flujo de trabajo bioinformático del estudio original.