Translate

воскресенье, 22 декабря 2024 г.

Тайны природы: новые открытия благодаря искусственному интеллекту

 

Современные ученые активно используют новейшие компьютерные технологии для создания масштабных баз данных природных соединений, которые находят применение в разработке лекарственных препаратов и других областях.

Природа — неисчерпаемый источник молекул, обладающих уникальными свойствами, способных улучшать здоровье и качество жизни. Растения и грибы давно стали кладезем соединений, способных бороться с болезнетворными организмами и способствовать долголетию. Однако большая часть этого химического богатства остается неизведанной.

Исследователи подчеркивают, что изучение природных химических соединений имеет огромный потенциал. Тем не менее, традиционные методы поиска новых молекул зачастую оказываются медленными и не гарантируют успеха.

«Классический способ изучения природных соединений заключается в анализе экстрактов растений или других природных образцов в надежде найти вещества с нужной биологической активностью», — объясняют специалисты.

С внедрением искусственного интеллекта эти ограничения удалось преодолеть. Новые технологии позволяют не только искать молекулы с заданными свойствами, но и создавать их. Искусственный интеллект помогает генерировать структуры, напоминающие природные соединения, и одновременно предсказывать их активность.

В своем исследовании ученые применили архитектуру машинного обучения LSTM (long short-term memory) для создания базы данных натуральных соединений. Эта технология особенно эффективна при работе с последовательными данными, что позволяет моделировать сложные молекулярные структуры с высокой точностью. Создаваемые молекулы должны соответствовать строгим критериям — быть новыми, химически обоснованными, а также обладать большим разнообразием физических и химических свойств. Такие требования гарантируют качество и полезность базы данных.

Исследовательская группа обучила свою модель на базе данных COCONUT — открытой библиотеке известных природных соединений. В результате они создали новую базу данных, включающую более 67 миллионов структур, напоминающих натуральные молекулы. Это значительно превосходит число соединений в самой COCONUT, где содержится около 400 тысяч молекул. Новая база данных отличается не только своим масштабом, но и экономической эффективностью по сравнению с коммерческими библиотеками природных соединений.

Для проверки своей модели ученые провели сравнение новой базы данных с независимым набором данных из 81 384 записей из COCONUT, которые не использовались при обучении модели. Результаты показали, что новая библиотека успешно воспроизвела 37% известных природных соединений. Кроме того, анализ продемонстрировал, что созданные молекулы по своим характеристикам и путям биосинтеза практически идентичны тем, что содержатся в COCONUT.

Эти результаты подтверждают эффективность глубокого генеративного машинного обучения в открытии и создании природных соединений. Ученые уже строят планы по использованию этих технологий в разных отраслях.

Например, созданная библиотека может стать основой для разработки экологически чистых альтернатив химическим веществам, производимым из нефти. Исследователи уверены, что эти молекулы найдут применение в самых разных сферах — от создания новых терапевтических средств до разработки эффективных инсектицидов. Более того, новая база данных открывает возможности для точного анализа и дальнейших инноваций.

Комментариев нет:

Отправить комментарий

Соцсети

Telegram ВКонтакте (VK) Дзен Hubzilla Diaspora Twitter (X) Mastodon