Requisitos informáticos PromethION 2 Integrated


Requisitos informáticos PromethION 2 Integrated

Descripción general

El PromethION 2 Integrated (P2i) es un dispositivo de sobremesa para secuenciar por nanoporos, diseñado para procesar y analizar hasta 2 celdas de flujo. Es perfecto para laboratorios con múltiples proyectos que necesiten beneficiarse de las ventajas de este tipo de secuenciación, que ofrece:

• Preparación sencilla de bibliotecas • Análisis en tiempo real • Comprensión biológica a partir de lecturas largas

Además, el P2i permite a los usuarios certificados, ofrecer la secuenciación por nanoporos como servicio.

El dispositivo se caracteriza por tener un ordenador integrado, que permite gestionar el dispositivo, facilita la adquisición y transmisión de los datos e identifica las bases en tiempo real, todo ello sin suponer un peso adicional en la infraestructura informática existente. También realiza análisis de datos tras la secuenciación, con ayuda de los flujos de trabajo de EPI2ME.

Un programa personalizado preinstalado, creado por Oxford Nanopore Technologies, lleva a cabo la gestión del dispositivo, la adquisición de datos y la identificación de bases. A continuación se muestra el flujo de trabajo bioinformático predeterminado al utilizar el P2i:

P2i data flow Imagen 1: Flujo de trabajo bioinformático predeterminado en el dispositivo PromethION 2 Integrated

Características técnicas

El P2i está diseñado en torno a una interfaz de usuario sencilla, sobre una electrónica personalizada de vanguardia, que proporciona soluciones de análisis en tiempo real. Dispone de una pantalla táctil integrada que permite iniciar y supervisar experimentos de secuenciación. También es posible utilizar un monitor externo y utilizar el ordenador integrado para el análisis posterior, como por ejemplo EPI2ME.

Elemento Características técnicas
Tamaño y peso 180 mm (alto) x 225 mm (ancho) x 430 mm (largo); 10.6 kg
Condiciones ambientales Diseñado para secuenciar a entre 18 °C y 25 °C
(límites de funcionamiento de los componentes electrónicos: de 5 °C a 40 °C)
Información de pantalla 1 puerto HDMI 2.0 (de hasta 4K de resolución a 60 Hz)
1 puerto DisplayPort
Puertos USB 4 puertos USB-A 3.0 (de hasta 10 Gb/s)
Red 1 cable Ethernet de 2,5 Gb/s (conector RJ45)
Pantalla táctil integrada Pantalla táctil AMOLED de 14 cm
Sonido 1 salida de audio de 3,5 mm (superior)
Potencia Fuente de alimentación de 750 W
Almacenamiento 15 TB SSD
Memoria 64 GB DDR4
CPU/GPU 1 Intel Core i7 (12 núcleos/20 hilos)
1 GPU NVIDIA, Serie Ampere
Sistema operativo Ubuntu 20.04 LTS
Programas instalados MinKNOW
Información de telemetría HTTPS/puerto 443 a 52.17.110.146, 52.31.111.95, 79.125.100.3 (acceso solo de salida)

o regla DNS aplicada a ping.oxfordnanoportal.com
Análisis en EPI2ME Ethernet: HTTPS/puerto 443:
Acceso TCP a los rangos de IP de AWS eu-west-1: http://docs.aws.amazon.com/general/latest/gr/aws-ip-ranges.html
Actualizaciones de programa HTTPS/puerto 443 a 178.79.175.200 y 96.126.99.215 (acceso solo de salida

o una regla DNS aplicada a cdn.oxfordnanoportal.com

Telemetría

MinKNOW recoge información de telemetría durante los experimentos de secuenciación, de acuerdo con los Términos y condiciones estipulados, que permiten supervisar el rendimiento de un dispositivo y facilitan la resolución de problemas a distancia. Algunos de estos datos provienen de campos de texto libre, así que no deberían incluir datos de identificación personal. Nosotros no recogemos ningún dato de secuenciación.

La plataforma EPI2ME está alojada en AWS (Amazon Web Services) y proporciona herramientas de análisis en la nube para múltiples aplicaciones. Los usuarios cargan datos de secuenciación en formato FASTQ a través del Agente EPI2ME, que procesa los datos mediante flujos bioinformáticos definidos en el Portal EPI2ME. Las descargas desde EPI2ME se realizan en formato de Datos + Telemetría o solo Telemetría. El portal EPI2ME utiliza información de telemetría para rellenar informes.

Actualizaciones del programa

La dirección IP desde la que se recibirán actualizaciones dependerá de la ubicación geográfica del usuario. Es posible actualizar desde la interfaz del programa o, en ordenadores Linux, desde la herramienta avanzada de empaquetado (apt), que viene instalada en el P2i y está disponible a través del Terminal. Para actualizar el programa a través de la apt, se requiere acceso solo de salida. Cuando hay actualizaciones disponibles, lo notificamos a través de la comunidad Nanopore y proporcionamos instrucciones en cada nota de lanzamiento.

Almacenamiento

Tipos de archivos

El programa de secuenciación por nanoporos, MinKNOW, es capaz de generar datos de secuenciación en tres tipos de archivos: POD5, FASTQ y BAM. La información general de bases identificadas se almacena en un archivo de tipo sequencing_summary.txt:

  • POD5 es un formato de archivo desarrollado por Oxford Nanopore, que almacena datos de nanoporos de forma accesible y sustituye al formato, ya obsoleto, .fast5. Esta opción lee y escribe datos más rápido, utiliza menos recursos informáticos y tiene un tamaño de archivo de datos sin procesar más pequeño que .fast5. Los archivos POD5 se generan por grupos cada 10 minutos. Los archivos pueden dividirse por código de barras, si se utilizan, pero la división por código de barras está desactivada por defecto.
  • .fast5 es un formato de archivo obsoleto, basado en el archivo .hdf5, que contiene toda la información necesaria para analizar datos de secuenciación por nanoporos y rastrearlos hasta su origen. Un archivo .fast5 contiene datos de múltiples lecturas (4000 lecturas como mínimo) y tiene varios cientos Mb de tamaño.
  • FASTQ es un formato de almacenamiento de secuencias basado en texto, que contiene tanto la secuencia de ADN/ARN como sus índices de calidad. Los archivos FASTQ se general por grupos durante un periodo de tiempo, con una frecuencia de archivo generado por defecto de 10 min, una hora o un archivo generado al final de la ejecución. También puede general lecturas por lotes, en función del número de lecturas por archivo.
  • Los archivos BAM proporcionan resultados si se realizan alineaciones o identificación de bases modificadas en el conjunto de datos de bases identificadas. Las opciones a la hora de generar archivos BAM son las mismas que para los archivos FASTQ. Los archivos BAM están desactivados por defecto y se activan automáticamente si se utiliza la alineación o identificación de bases modificadas.
  • Los archivos sequencing_summary.txt contienen metadatos de todas las lecturas de bases identificadas de un experimento individual. La información incluye un identificador de lecturas, longitud de secuencias, puntuación Q-score por lectura, duración, etc. El tamaño del archivo resumen de las secuencias dependerá del número de lecturas secuenciadas.

Los tamaños de archivo de ejemplo representados en la tabla siguiente están basados en diferentes rendimientos de una sola celda de flujo, con una ejecución que guarda archivos POD5, FASTQ y BAM, con un N50 de lectura de 23 kb. RMT= Rendimiento máximo teórico.

Rendimiento celdas de flujo (Gigabases) Almacenamiento POD5 (Gigabytes) Almacenamiento FASTQ.gz (Gigabytes) BAM sin alinear con modificaciones (Gigabytes)
100 700 65 60
200 1 400 130 120
290 (TMO) 2 030 188,5 174

A medida que avance el experimento, se generarán archivos POD5 de manera automática de todas las lecturas. Si decide identificar bases con sus datos, el programa MinKNOW utilizará archivos POD5 para generar datos de secuenciación, que luego se almacenarán en archivos FASTQ o BAM.

Transferencia de datos y almacenamiento a largo plazo

El P2i tiene suficiente espacio SSD, para realizar múltiples experimentos de secuenciación y almacenar datos en formato POD5, FASTQ y BAM. Sin embargo, es esencial limpiar regularmente la memoria de datos, a fin de prevenir que futuros experimentos se paren debido a falta de espacio de almacenamiento. Para ello, la ubicación debe proporcionar almacenamiento externo para transferir datos fuera del dispositivo.

El P2i funciona con Ubuntu y es capaz de montar múltiples tipos de sistemas de archivos. Recomendamos el almacenamiento en NFS o CIFS. La forma y el volumen de datos que se almacenen dependerá de los requisitos del usuario:

  • Es posible almacenar archivos POD5 con datos de lecturas sin procesar o eliminarlos. Si desea identificar las bases de sus datos en una fecha futura, en MinKNOW existe la opción de guardar archivos POD5 sin procesar.
  • Conservar solo los archivos FASTQ/BAM permitirá utilizar herramientas estándar de análisis con secuencias de ADN o ARN.

Registro de cambios

Fecha Versión Cambios realizados
31 jul 2024 V4 En la sección “Tipos de archivos”, se ha actualizado la información sobre generación de datos en archivos POD5, FASTQ y BAM.
24 abr 2024 V3 Se han realizado algunas correcciones en los datos de la sección "Características técnicas".
8 abr 2024 V2 Se han corregido las condiciones ambientales, que ahora dicen "Diseñado para secuenciar a entre 18 °C y 25 °C".
10 oct 2023 V1 Primera versión del documento

Last updated: 2/27/2025

Document options

Language: