
Учёные инженерного факультета Гонконгского университета (The University of Hong Kong, HKU) разработали два инновационных алгоритма глубокого обучения — ClairS-TO и Clair3-RNA, которые существенно повышают точность выявления генетических мутаций в диагностике рака и исследованиях на основе РНК-секвенирования. Новые инструменты открывают дополнительные возможности для развития прецизионной медицины и ускоряют внедрение искусственного интеллекта в клиническую геномику.
Исследовательскую группу возглавил профессор Жуйбан Ло (Ruibang Luo) из Школы вычислительных и данных наук инженерного факультета HKU. Результаты работы опубликованы в престижном научном журнале Nature Communications.
Современные технологии длинного чтения (long-read sequencing) позволяют получать протяжённые непрерывные фрагменты ДНК и РНК, обеспечивая более полное представление о геноме. Однако интерпретация таких данных остаётся сложной задачей, особенно при поиске мутаций в образцах с высокой степенью «шума» и неоднородности. Новые алгоритмы направлены на преодоление этих ограничений и делают анализ генетической информации быстрее, точнее и доступнее.
Алгоритм ClairS-TO решает одну из ключевых проблем онкологической диагностики — необходимость наличия парного образца здоровой ткани для сравнения с опухолевой. Во многих клинических случаях такой контрольный образец отсутствует, что затрудняет выявление истинных мутаций. ClairS-TO использует двухсетевую архитектуру: одна нейросеть подтверждает подлинные мутации, а вторая отфильтровывает ошибки секвенирования. Благодаря этому становится возможным проводить надёжный анализ опухолевой ДНК даже при ограниченном количестве материала, снижая стоимость и повышая доступность диагностики.
Второй алгоритм, Clair3-RNA, стал первым в мире инструментом на базе глубокого обучения, специально разработанным для поиска малых вариантов в длинных РНК-последовательностях. РНК-редактирование и технические ошибки секвенирования часто маскируются под реальные мутации. Clair3-RNA способен точно отличать истинные генетические изменения от биологического «шума», позволяя одновременно анализировать экспрессию генов и мутационный профиль с высокой точностью.
Оба решения входят в серию Clair — семейство ИИ-алгоритмов для геномного анализа, разработанных командой профессора Ло. Инструменты этой серии, включая промышленный стандарт Clair3, уже получили более 400 тысяч загрузок по всему миру и широко используются ведущими научными центрами и компаниями в области секвенирования.
По словам профессора Руибан Ло, новые алгоритмы «создают прочную основу для открытия мутаций с помощью глубокого обучения и ускоряют внедрение прецизионной медицины и клинической геномики».
Разработка ClairS-TO и Clair3-RNA представляет собой важный шаг к более точной, быстрой и комплексной интерпретации генетических данных. Эти технологии способны улучшить раннюю диагностику рака, поддержать персонализированный подход к лечению и ускорить фундаментальные исследования, принося ощутимую пользу пациентам и научному сообществу по всему миру.