Requisitos informáticos GridION Mk1


Requisitos informáticos GridION Mk1

Lista de comprobación

Esta lista recoge los requisitos mínimos para instalar el GridION en su institución. Encontrará una información más completa de los mismos a lo largo del documento.

Elemento/configuración necesaria Motivo ¿Proporcionado?
1 puerto RJ45 de 1 Gb/s con servicio DHCP en funcionamiento Conexión a una infraestructura informática y a internet
1 cable Ethernet de 1 Gbp/s Conexión a una infraestructura informática y a internet
HTTPS/puerto 443 a 52.17.110.146, 52.31.111.95, 79.125.100.3 (acceso solo de salida)

o regla DNS aplicada a ping.oxfordnanoportal.com
Información de telemetría
Ethernet: HTTPS/puerto 443:

Acceso TCP a los rangos de IP de AWS eu-west-1: http://docs.aws.amazon.com/general/latest/gr/aws-ip-ranges.html
Análisis en EPI2ME
HTTPS/puerto 443 a 178.79.175.200 y 96.126.99.215 (acceso solo de salida)

o una regla DNS aplicada a cdn.oxfordnanoportal.com
Actualizaciones de programa
Ratón USB Gestión del dispositivo
Teclado USB Gestión del dispositivo
Monitor compatible con HDMI o DisplayPort Gestión del dispositivo
Fuente de alimentación capaz de suministrar 650 W Potencia del GridION
Almacenamiento: infraestructura suficiente para el almacenamiento requerido* Almacenamiento de datos a largo plazo
*_El tamaño del almacenamiento requerido dependerá de cada caso. Siga leyendo para conocer las directrices en esta materia.

Dispositivo GridION Mk1

Descripción general

El GridION es un dispositivo de sobremesa para secuenciar por nanoporos, diseñado para realizar y analizar hasta cinco celdas de flujo MinION o Flongle o una combinación de ellas. Es perfecto para laboratorios que realicen múltiples proyectos y necesiten beneficiarse de las ventajas de la secuenciación por nanoporos:

  • Preparación sencilla de bibliotecas
  • Análisis en tiempo real
  • Comprensión biológica a partir de lecturas largas

Además, el GridION permite a los usuarios certificados ofrecer la secuenciación por nanoporos como servicio.

El GridION tiene la ventaja de incluir un ordenador integrado, que facilita la adquisición de datos, el análisis y la retroalimentación, la identificación de bases, transferencia de datos y gestión del dispositivo, todo ello sin suponer un peso adicional en la infraestructura informática existente.

Un programa personalizado preinstalado, creado por Oxford Nanopore Technologies, lleva a cabo la gestión del dispositivo, la identificación de bases y el análisis y orquestación en el GridION. A continuación se muestra el flujo de trabajo del análisis de datos predeterminado cuando se empieza a utilizar el GridION Mk1:

ES-GridION data flow Flujo de trabajo del análisis de datos predeterminado en el dispositivo GridION

Características técnicas

El GridION Mk1 está diseñado en torno a una interfaz de usuario sencilla, sobre una electrónica personalizada de vanguardia, que proporciona soluciones de análisis en tiempo real:

Elemento Características técnicas
Sistema operativo Ubuntu 20.04, con CPU Intel

Aconsejamos mantenerse al día con todos los parches de programa y de seguridad
Almacenamiento 7 TB de SSD interno

(Los dispositivos GRD-MK1 con núm. de serie inferior a GXB05000 tienen 4 TB de almacenamiento SSD)
Tarjetas GPU 1 tarjeta gráfica Nvidia Quadro GV100
Memoria 64 GB de RAM
Tamaño y peso 220 (alto) x 365 (ancho) x 370 (largo) mm
Peso 14.4 kg
Intervalos ambientales Intervalo de funcionamiento del sistema: 5 °C a 40 °C
Diseñado para secuenciar de 18 °C a 25 °C

Requisitos de la ubicación

Instalar el GridION Mk1 en su institución es similar a instalar un ordenador nuevo. Los requisitos del dispositivo son los siguientes:

Elemento Requisitos
1 puerto RJ45 Dirección IP a través del servicio DHCP o asignado estáticamente

TCP que se ejecute en un puerto 443 HTTPS

Requiere permisos de cortafuegos perimetral:
- Para acceder a HTTPS/puerto 443 a 52.17.110.146, 52.31.111.95, 79.125.100.3 (acceso solo de salida) o una regla DNS aplicada a ping.oxfordnanoportal.com a fin de obtener información de telemetría
- HTTPS/puerto 443 y acceso de TCP a AWS en rangos IP eu-west-1: http://docs.aws.amazon.com/general/latest/gr/aws-ip-ranges.html para análisis en EPI2ME.
- HTTPS/puerto 443 a 178.79.175.200 y 96.126.99.215 (acceso solo de salida) o regla DNS aplicada a cdn.oxfordnanoportal.com para las actualizaciones de programa

Conectado a la infraestructura de almacenamiento local
1 fuente de alimentación 1 cable C13 específico para cada país incluido con el dispositivo
- Consumo máximo de energía 650 W
- Corriente máxima 6,5 A
- Tensión de alimentación 100-240 V CC (50/60 Hz)
1 monitor Compatible con conexiones HDMI o DisplayPort (con el GridION se incluye un adaptador de DisplayPort a HDMI)
1 teclado Compatible con USB
1 ratón Compatible con USB

Telemetría

MinKNOW recoge información de telemetría durante los experimentos de secuenciación, de acuerdo con los Términos y condiciones, que permiten supervisar el rendimiento de un dispositivo y la resolución de problemas a distancia. Algunos de estos datos provienen de campos de texto libre, así que no deberían incluir datos de identificación personal. No recogemos ningún dato de secuenciación.

La plataforma EPI2ME está alojada en AWS y proporciona soluciones de análisis basadas en la nube para múltiples aplicaciones. Los usuarios cargan datos de secuenciación en formato FASTQ a través del Agente de EPI2ME, que procesa los datos a través de flujos de análisis definidos dentro del Portal EPI2ME. Las descargas de EPI2ME se realizan en forma de Datos + Telemetría o solo Telemetría. El portal de EPI2ME usa información de telemetría para cumplimentar informes.

Actualizaciones del programa

La dirección IP desde la que se recibirán actualizaciones del programa dependerá de su ubicación geográfica. Es posible actualizar el dispositivo a través de la interfaz de usuario o mediante el comando apt del terminal, por lo que se requiere acceso solo de salida. Cuando haya actualizaciones disponibles, lo notificaremos a través de la comunidad Nanopore y proveeremos instrucciones detalladas en cada nota de lanzamiento.

Almacenamiento

Tipos de archivos

Los datos de secuenciación por nanoporos se almacenan en tres tipos de archivos: POD5, FASTQ y BAM. La información general de bases identificadas se almacena en un archivo de tipo sequencing_summary.txt:

  • POD5 es un formato de archivo desarrollado por Oxford Nanopore, que almacena datos de nanoporos de manera accesible y sustituye el formato .fast5, ya obsoleto. Esta opción lee y escribe datos más rápido, utiliza menos cómputo y tiene un tamaño de archivo de datos crudos más pequeño que .fast5. Los archivos POD5 se generan por lotes, cada 10 minutos. Si se utilizan códigos, los archivos pueden dividirse por códigos, pero esta función deberá activarse, ya que está desactivada por defecto.
  • .fast5 es un formato de archivo obsoleto basado en el archivo .hdf5, que contiene toda la información necesaria para analizar datos de secuenciación por nanoporos y rastrearlos hasta su origen. Un archivo .fast5 contiene datos de múltiples lecturas (4000 lecturas como mínimo) y tiene varios cientos Mb de tamaño.
  • FASTQ es un formato de almacenamiento de secuencias basado en texto, que contiene tanto la secuencia de ADN/ARN como sus índices de calidad. Los archivos FASTQ se generan por lotes regularmente. Por defecto, estos archivos se generan cada 10 minutos, sin embargo es posible configurar la frecuencia a una hora o hacer que se genere un archivo al final del experimento. También es posible procesar las lecturas por lotes, en función del número de lecturas por archivo.
  • Los archivos BAM proporcionan resultados si se realizan alineaciones o identificación de bases modificadas en el conjunto de datos de bases identificadas. Los archivos BAM están desactivados por defecto y se activan automáticamente si se utiliza el alineamiento o la identificación de bases modificadas.
  • Los archivos sequencing_summary.txt contienen metadatos sobre las lecturas de bases identificadas de un experimento individual. La información incluye el identificador de lecturas, la longitud de secuencias, el índice Qscore por lectura, la duración, etc. El tamaño del archivo resumen de las secuencias dependerá del número de lecturas secuenciadas.

Los tamaños de archivo de ejemplo representados en la tabla siguiente se basan en diferentes rendimientos de una celda de flujo individual, con una ejecución que guarda archivos POD5, FASTQ y BAM con un N50 de lectura de 23 kb.

Rendimiento celda de flujo (Giga bases) Almacenamiento POD5 (Gigabytes) Almacenamiento FASTQ.gz (Gigabytes) BAM sin alinear con modificaciones (Gigabytes)
10 70 6,5 6
15 105 9,75 9
30 210 19,5 18

A medida que avance el experimento, se producirán archivos POD5 de todas las lecturas. Si decide identificar las bases de sus datos, el programa MinKNOW utilizará esas lecturas para generar datos de secuenciación, que luego se almacenarán en archivos FASTQ o BAM.

Almacenamiento a largo plazo

El GridION tiene suficiente espacio en el disco SSD para realizar múltiples experimentos y almacena datos tanto en POD5 como FASTQ. Sin embargo, es imperativo que esta memoria de datos se limpie regularmente a fin de prevenir que futuros experimentos se paren debido a falta de espacio. Para ello, la institución debe proporcionar un espacio de almacenamiento al que transferir datos desde el dispositivo.

El GridION funciona con Ubuntu y es capaz de montar múltiples tipos de sistemas de archivos. Recomendamos el almacenamiento NFS o CIFS. La forma (y volumen) de datos que se almacenen dependerá de los requisitos del usuario:

  • Almacenar archivos .POD5 con datos de lecturas brutas permitirá volver a identificar las bases de esos datos cuando Oxford Nanopore Technologies lance nuevos algoritmos. En algunos casos, las nuevas versiones de identificador de bases han permitido mejorar significativamente la precisión en conjuntos de datos existentes gracias a la reidentificación de bases. Además, tanto las herramientas de terceros como las de Oxford Nanopore usan la información de la señal bruta, contenida en el .POD5, para extraer información adicional, por ejemplo la identificación de bases modificadas, la identificación de polimorfismos de un solo nucleótido guiados por la referencia o la limpieza de datos.
  • Conservar solo los archivos FASTQ permitirá utilizar las herramientas de análisis habituales, utilizando la secuencia de ADN/ARN, pero no se podrán generar más datos cuando aparezcan nuevas versiones de identificador de bases.

Preguntas frecuentes

¿Puedo utilizar un sistema de alimentación ininterrumpida (SAI) con el GridION?
Sí, es posible usar un sistema SAI, aunque no podemos recomendar ningún producto específico.

¿Tenéis alguna recomendación para transferir datos en tiempo real desde el GridION, durante un experimento de secuenciación?
En la actualidad, recomendamos transferir datos con rsync y ejecutarlo cada hora a través de crontab. Para más información, escriba a support@nanoporetech.com

Registro de cambios

Fecha Versión Cambios realizados
8 ene 2025 V14 En las “características técnicas”, se han hecho cambios en el almacenamiento: de 4 TB a 7 TB de almacenamiento SSD; además, se ha añadido una nota que dice que los dispositivos con núm. de serie inferior a GXB05000 tienen 4 TB.
10 dic 2024 V13 En “Requisitos de la ubicación”, en el apartado “1 fuente de alimentación”, la corriente máxima se ha cambiado por 6,5 A.
31 jul 2024 V12 En la sección “Tipos de archivos”, se ha actualizado la información sobre generación de datos en archivos POD5, FASTQ y BAM.
28 sep 2023 V11 - Se ha añadido una tabla con tamaños de archivos a la sección "Tipos de archivos".
- Se han realizado pequeñas correcciones y aclaraciones a lo largo del documento.
28 jun 2023 V10 - En la "Lista de comprobación", se han modificado las características técnicas de la información de telemetría, el análisis de EPI2ME y las actualizaciones del programa.
- Se ha eliminado la sección "Conexión a la red".
- En la sección "Tipos de archivos" se ha añadido información sobre los archivos POD5 y BAM. Se ha borrado temporalmente la tabla de comparación de tamaños de archivos.
- La sección "Programa incluido" se ha eliminado.
- Se han realizado pequeñas correcciones y aclaraciones a lo largo del documento.
10 mar 2023 V9 - La lista de comprobación y los Requisitos del emplazamiento se han actualizado para eliminar el requisito del puerto HTTP 80.
22 sep 2022 V8 - En la sección "Requisitos de la ubicación" se ha corregido la URL de los intervalos de IP de eu-west-1, de AWS.
19 ago 2022 V7 - En la sección "Características técnicas", el peso del dispositivo se ha actualizado a 14,4 kg y el intervalo de funcionamiento del sistema se ha actualizado a: 5 °C-40 °C.
- Se ha actualizado la tabla de tamaños de archivos .fast5/FASTQ.
21 abr 2022 V6 - En la lista de comprobación y en la sección de conexión a la red, se ha actualizado el enlace de mirror.oxfordnanoportal.com a cdn.oxfordnanoportal.com.
12 nov 2020 V5 - Se ha corregido la compatibilidad entre DisplayPort y HDMI.
14 sep 2020 V4 - Se han eliminado las referencias a la compatibilidad con DisplayPort, ya que el GridION ahora se envía con un adaptador de DisplayPort a HDMI.
29 abr 2020 V3 - Tras la introducción de la compresión de archivos, se han modificado los tamaños de los archivos de salida.
29 jul 2019 V2 - Se ha actualizado la información del GridION Mk1
9 jul 2018 V1 - Versión inicial del documento

Last updated: 2/27/2025

Document options

Language: