Os engenheiros de aprendizado de máquina sobem enzimas Cas9 para edição de genes

Em um novo estudo publicado em Natureza intitulado, “Variantes personalizadas de PAM CRISPR-CAS9 via engenharia escalável e aprendizado de máquina”Pesquisadores do Massachusetts General Hospital (MGH) e da Harvard Medical School (HMS) desenvolveram um modelo de aprendizado de máquina que permite a previsão de proteínas CAS9 sob medida que são mais adequadas a alvos específicos e podem ser adaptados com as propriedades do designer ou a pesquisa que os autores de romance podem ser usados, os autores de romance.

“Estamos entusiasmados em compartilhar essas enzimas com a comunidade de edição do genoma e obter feedback sobre seu desempenho como nucleases, editores de base e outras modalidades de edição de genoma”, disse Benjamin Kleinstiver, doutorado, professor associado de patologia da HMS, em entrevista a uma entrevista a Gen.

Para corrigir as mutações com segurança e precisão que causam doenças genéticas, a tecnologia de edição de genoma deve ser programada para atingir sequências específicas do paciente, limitando os efeitos fora do alvo. As nucleases de CAS reconhecem alvos genômicos lendo motivos adjacentes do Protospacer (PAMs), que iniciam o emparelhamento de RNA de guia com o local de destino. No caso de comumente usadoTreptococcus pyogenes Cas9 (SPCAS9), o emparelhamento requer a sequência PAM padrão, 3’ngg, que inevitavelmente restringe o uso da enzima às sequências genômicas que codificam o codificação.

Para expandir o acesso ao genoma, uma estratégia de engenharia comum é o relaxamento do PAM para permitir a edição em novos sites, mantendo a atividade contra o NGG, criando assim enzimas generalistas para aplicações amplas. No entanto, permitir a edição eficiente no alvo, minimizando os efeitos fora do alvo das enzimas PAM relaxadas continua sendo um desafio.

No novo estudo, a equipe de Kleinstiver gerou perfis experimentais de PAM para centenas de enzimas SPCAS9 projetadas para treinar uma rede neural que relacionava a sequência de aminoácidos à especificidade do PAM. O algoritmo de aprendizado de máquina PAM resultante (Pammla) previu os PAMs de cerca de 64 milhões de enzimas SPCAS9. Em seguida, identificou enzimas eficazes e específicas que superaram os candidatos existentes baseados em evolução e projetados como nucleases e editores de base nas células humanas, reduzindo os efeitos fora do alvo.

Entre os exemplos de design da enzima Cas9 direcionada pelo usuário, o grupo MGH realizou direcionamento seletivo da mutação p23H da rodopsina em células humanas e camundongos. Esta mutação é uma causa comum de retinite autossômica dominante pigmentosa (ADRP), uma doença genética ocular que leva à perda de visão.

“We envision that the general framework of scalable engineering, deep characterization, and utilizing machine learning to predict a larger universe of proteins would be extensible to many exciting areas, including other properties of Cas9 enzymes, like target site specificity and on-target activity, to non-CRISPR enzymes entirely,” said Rachel Silverstein, first author of the study and a graduate student at HMS, in an interview with Gen.

As aplicações adicionais incluem estender esse fluxo de trabalho de engenharia para outros domínios de proteína em editores de próxima geração, como domínios desaminase para editores de base, domínios de transcriptase reversa para editores principais e polimerases de DNA para editores de cliques.

O aprendizado de máquina oferece vantagens importantes sobre as estratégias tradicionais de engenharia experimental, que geralmente lutam para prever o impacto funcional de múltiplas mutações simultâneas, além de enfrentar estratégias de seleção experimental trabalhosas e demoradas. Os autores afirmaram que as previsões computacionais podem rastrear um número maior de enzimas com combinações mais diversas de substituições de aminoácidos em comparação apenas com os métodos experimentais, aumentando assim a probabilidade de identificar enzimas ideais em um espaço mutacional mais profundo.

De acordo com Silverstein, uma chave para esse método é estabelecer um ensaio bioquímico fácil e escalável que pode produzir dados ricos sobre milhares de enzimas em paralelo, fornecendo os dados necessários para treinar modelos de aprendizado de máquina.

“A longo prazo, imaginamos que o uso do aprendizado de máquina pode ser amplamente aplicado para potencializar as atividades das tecnologias de edição de genoma que serão benéficas para criar uma caixa de ferramentas diversificada e completa de tecnologias”, disse Silverstein Gen.

Os autores disponibilizaram o Pammla Como uma ferramenta da web Para agilizar a personalização das enzimas SPCAS9 para pesquisa ou usos translacionais.



Comentários

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *