Groowe Groowe BETA / Newsroom
⏱ News is delayed by 15 minutes. Sign in for real-time access. Sign in

Basecamp Research lanza el Atlas de un billón de genes para impulsar terapias diseñadas con IA USA - español USA - English USA - English

prnewswire.com

AUSTIN, Texas y SAN JOSÉ, California, 18 de marzo de 2026 /PRNewswire/ -- Basecamp Research, un laboratorio de IA de vanguardia para el diseño biológico, anunció hoy el lanzamiento del Atlas de un billón de genes, una iniciativa científica trascendental para generar y modelar datos biológicos a escala de un billón de genes. Lanzado en colaboración con Anthropic, Ultima Genomics y PacBio, e impulsado por la infraestructura de IA de NVIDIA, el Atlas de un billón de genes tiene como objetivo multiplicar por cien la diversidad genética evolutiva conocida mediante la recopilación de datos genómicos de más de 100 millones de especies en miles de sitios de todo el mundo.

Esto es posible gracias a la creciente red de socios globales de biodiversidad de Basecamp Research. Su objetivo final es proporcionar los amplios y diversos datos de entrenamiento necesarios para que los sistemas de IA aprendan de la evolución y diseñen nuevos medicamentos a demanda.

"Los modelos de IA biológica actuales se entrenan con una muestra muy limitada de la vida en la Tierra", afirmó Glen Gowers, cofundador y consejero delegado de Basecamp Research, durante su intervención en SXSW de Austin. "El Atlas del billón de genes expande el universo genético conocido en órdenes de magnitud superiores a los de las bases de datos públicas. El entrenamiento de modelos a esta escala establece un nuevo paradigma para el diseño terapéutico programable".

Esta iniciativa, comparable al Proyecto Genoma Humano, se presentó durante la sección de Salud del SXSW y la conferencia NVIDIA GTC en San José.

Cómo superar el cuello de botella de los datos biológicos

Con el enorme aumento del tamaño de los modelos y la capacidad de procesamiento, la diversidad de datos es fundamental para el progreso en el desarrollo de fármacos basados en IA y para la evaluación comparativa en el mundo real. Todos los modelos base actuales basados en secuencias dependen de variantes de los mismos repositorios públicos, y el 80% de ellos se entrenan con una base de datos pública que contiene menos de 250 millones de secuencias.

Los modelos fundamentales EDEN de Basecamp Research, lanzados en enero, superan la "barrera de datos" evolutiva de la industria al entrenarse completamente con BaseData™, una base de datos genómica propia que actualmente es más de 10 veces mayor que todos los recursos públicos combinados. Al aprender de una cantidad sin precedentes de 10.000 millones de genes nuevos para la ciencia en 1 millón de especies recién descubiertas, EDEN desveló nuevas leyes de escala cruciales para la IA en biología.

Esta expansión masiva en la diversidad de conjuntos de datos llevó a EDEN más allá de la simple predicción, convirtiéndolo en el primer modelo capaz de diseñar terapias diversas directamente a partir de la descripción de una enfermedad. En la validación de laboratorio, EDEN demostró actividad sin necesidad de datos humanos ni clínicos en células T humanas primarias. El modelo ha generado resultados positivos en múltiples modalidades de vanguardia, destacando su papel pionero en la inserción de genes programables por IA (aiPGI) para insertar genes sanos y el diseño de péptidos antimicrobianos dirigidos con una tasa de éxito del 97% contra patógenos prioritarios.

El Atlas de un Billón de Genes se basa en este enfoque, ampliando considerablemente la amplitud y la profundidad contextual de los datos genómicos en la conocida "internet de la biología", apta para el entrenamiento de la IA.

"Los modelos más grandes por sí solos no son suficientes", añadió Phil Lorenz, director de tecnología de Basecamp Research. "EDEN demostró que el rendimiento de la IA biológica sigue trayectorias de escalado mucho más pronunciadas con datos de mayor calidad y completamente contextualizados. El Atlas de un Trillón de Genes extiende este principio cien veces".

Alianzas globales para la biodiversidad

En los últimos seis años, Basecamp Research ha creado una red de colaboradores científicos en 31 países, estableciendo una plataforma de genómica evolutiva escalable diseñada específicamente para el entrenamiento de la IA. Al ser pionera en una combinación de nuevos marcos regulatorios y económicos y tecnologías de secuenciación de ADN totalmente autónomas, la empresa recopila datos genómicos de alta calidad de ecosistemas que están fuera del alcance de los laboratorios tradicionales.

Estas alianzas se basan en el intercambio de conocimientos, el desarrollo de capacidades locales y acuerdos equitativos de acceso y distribución de beneficios, alineados con las nuevas regulaciones de información de secuencias digitales. Este marco permite la recopilación responsable, a gran escala y de alta calidad de datos genómicos, al tiempo que se invierte en infraestructura científica y capacitación en las regiones asociadas.

Como parte del lanzamiento del Atlas, Basecamp anuncia nuevas alianzas en Chile y Argentina, así como una colaboración ampliada en la Antártida, extendiendo aún más su red global de biodiversidad.

Generación de datos y computación a gran escala con Ultima Genomics, PacBio y NVIDIA

El Atlas de un billón de genes es posible gracias a los avances en la secuenciación de lecturas cortas y largas de ultra alto rendimiento y la computación acelerada. Basecamp se ha asociado con Ultima Genomics y PacBio para ofrecer secuenciación a escala industrial, incluyendo lecturas largas de alta precisión y gran cantidad de datos.

Ultima es desarrollador de sistemas de secuenciación de próxima generación (NGS) de ultra alto rendimiento. El último sistema de secuenciación de Ultima, la serie UG200, perfecciona la arquitectura de secuenciación basada en obleas exclusiva de la compañía para permitir la secuenciación de alto rendimiento, de genoma completo y multiómica a escala industrial y a un precio asequible, impulsando así iniciativas como el Atlas del Billón de Genes.

"La biología ha sufrido una escasez fundamental de datos en comparación con otros campos como el lenguaje o la visión artificial, ya que los investigadores carecían de las herramientas necesarias para generar datos a gran escala", comentó Gilad Almogy, fundador y consejero delegado de Ultima Genomics. "Creemos firmemente que la IA tendrá un impacto inmenso en nuestra comprensión de la biología y la salud humana, y la serie UG200 se diseñó desde cero para generar los conjuntos de datos masivos necesarios para que la BioIA cumpla esta promesa. Nos entusiasma que nuestra tecnología pueda ayudar a Basecamp a materializar su visión e impulsar iniciativas innovadoras como el Atlas del Billón de Genes".

"La secuenciación PacBio HiFi ofrece lecturas largas de alta precisión que preservan el contexto genómico completo y permiten la resolución a nivel de subespecie e incluso de cepa en muestras complejas", indicó Christian Henry, presidente y consejero delegado de PacBio. "Los datos HiFi proporcionan la base fiable y rica en información que los modelos de IA biológica necesitan para aprender de la naturaleza a gran escala e impulsar iniciativas como el Atlas del Billón de Genes".

El Atlas del Billón de Genes se impulsará mediante la infraestructura de computación acelerada de NVIDIA para procesar grandes cantidades de datos genéticos a escala de petabases. Como parte de este esfuerzo, Basecamp planea aprovechar NVIDIA Parabricks para acelerar significativamente el ensamblaje metagenómico. Esta colaboración se centra tanto en la ingeniería avanzada como en el desarrollo de nuevos métodos algorítmicos para optimizar la reconstrucción de muestras ambientales complejas. Gracias a esta aceleración, se espera que el procesamiento de cuatrillones de pares de bases de ADN, una tarea que antes habría llevado más de 20 años, se complete en menos de dos años.

Mediante el procesamiento paralelo de datos, la anotación automatizada y el entrenamiento de modelos a gran escala, los socios esperan reducir una tarea que antes requería más de 20 años de procesamiento a menos de dos años. Esta reducción de la secuenciación, el ensamblaje, la anotación y el entrenamiento de modelos busca ampliar el rendimiento y el alcance de los modelos biológicos fundamentales en el desarrollo terapéutico.

Creación de un flujo de trabajo integral para el diseño terapéutico con Anthropic

Anthropic se une como parte de su iniciativa para incorporar nuevas capacidades a las ciencias de la vida: conectar Claude con más plataformas científicas. En colaboración con el equipo de Claude para las Ciencias de la Vida, el objetivo es aprovechar el Atlas del Billón de Genes y EDEN para convertir a Claude en un socio de investigación aún más productivo para científicos y clínicos, y apoyar a las organizaciones que divulgan nuevos avances científicos al público.

Al combinar las capacidades de razonamiento avanzado de Claude, las capacidades de diseño terapéutico de EDEN y las bibliotecas CUDA-X de NVIDIA para procesar datos no estructurados, la iniciativa busca crear un flujo de trabajo integrado para interpretar datos clínicos complejos y traducirlos directamente en diseños terapéuticos.

El Atlas del Billón de Genes se basa en tres pilares: secuenciación de ADN a gran escala, alianzas globales para el suministro de datos y computación avanzada. Junto con sistemas de IA capaces de razonar sobre datos complejos, estos fundamentos pueden ayudar a transformar amplios conjuntos de datos en descubrimientos terapéuticos. Al multiplicar por cien los datos evolutivos disponibles para la IA, Basecamp Research busca agilizar y sistematizar el diseño de fármacos, extendiendo los avances previos de EDEN en campos como la terapia génica y la lucha contra las bacterias resistentes a los antibióticos.