Biała księga:
Uwolnienie chemii jutra dzięki wspomaganemu komputerowo planowaniu syntezy

Wywiad z profesorem Timem Cernakiem
Mieliśmy zaszczyt przeprowadzić wywiad z profesorem Timem Cernakiem, adiunktem chemii medycznej na Uniwersytecie Michigan, którego różnorodne zainteresowania badawcze obejmują syntezę chemiczną, automatyzację, naukę o danych i nie tylko. Dzięki ponad dziesięcioletniemu doświadczeniu profesor Cernak jest liderem w rewolucjonizowaniu tej dziedziny. W tym wywiadzie zagłębiamy się w świat wspomaganego komputerowo planowania syntezy (CASP), dziedziny, która wykorzystuje automatyzację, analizę obliczeniową i sztuczną inteligencję w celu usprawnienia syntez chemicznych. Prof. Cernak omówi kluczową rolę CASP, ewolucję od programów opartych na regułach do uczenia maszynowego oraz synergię między ludzką wiedzą a sztuczną inteligencją. Zbadamy, w jaki sposób sieci neuronowe i Reguły kodowane przez ekspertów zwiększają dokładność syntezy i omówimy ostatnie przełomy, takie jak zrównoważona synteza z odpadów przemysłowych. Ponadto odkryjemy potencjał syntezy organicznej opartej na sztucznej inteligencji i zbadamy perspektywy na przyszłość. Dołącz do nas w tej pouczającej rozmowie z prof. Timem Cernakiem, podczas której będziemy podróżować przez obszary CASP, automatyzacji laboratoriów i obiecującej przyszłości inteligentnej automatyzacji w chemii syntetycznej.

Prof. Timothy Cernak
Adiunkt w dziedzinie chemii medycznej i chemii
Tim Cernak urodził się w Montrealu w Kanadzie w 1980 roku. Uzyskał tytuł licencjata chemii na Uniwersytecie Kolumbii Brytyjskiej Okanagan i tam badał profil aromatyczny win Chardonnay. Po ukończeniu studiów doktoranckich w zakresie syntezy całkowitej u prof. Jima Gleasona na Uniwersytecie McGill, Tim był stypendystą podoktoranckim FQRNT u Tristana Lamberta na Uniwersytecie Columbia. W 2009 roku Tim dołączył do zespołu chemii medycznej w Merck Sharp & Dohme w Rahway, New Jersey. Opracował tam technologie zminiaturyzowanej syntezy i późnej funkcjonalizacji. W 2013 roku Tim przeniósł się do oddziału firmy Merck w Bostonie. W 2018 r. dr Cernak dołączył do Wydziału Chemii Medycznej na Uniwersytecie Michigan w Ann Arbor jako adiunkt. Laboratorium Cernaka bada połączenie syntezy chemicznej i nauki o danych. Tim jest współzałożycielem Entos, Inc.
Jaką rolę w dziedzinie wspomaganego komputerowo planowania syntezy odgrywa CASP w integracji ludzkiej intuicji i możliwości obliczeniowych?
Wspomagane komputerowo planowanie syntezy (CASP) to szybko rozwijająca się dziedzina o bogatej historii. Systemy CASP zostały zaprojektowane w celu wspomagania chemików w procesie podejmowania decyzji poprzez sugerowanie ścieżek syntezy spełniających określone kryteria, takie jak wydajność, koszt i bezpieczeństwo.
Być może bardziej niż jakakolwiek inna dziedzina nauki, synteza totalna obejmuje i celebruje sztukę i elegancję swojego procesu. Dziedzina ta destyluje lata rozwoju w zakresie planowania strategicznego, systemów opracowanej logiki oraz innowacyjnych i nowatorskich eksperymentalnych trybów reaktywności w szereg zaplanowanych etapów reakcji. Rosnący zbiór reakcji chemicznych oraz powiązanych z nimi reguł i mechanizmów nie może zostać zapamiętany przez człowieka. Co ciekawe, są one jednak zgodne ze wszystkimi zasadami gry i mogą zostać zakodowane w komputerze. Logika ta łączy ludzki proces decyzyjny, wiedzę ekspercką i intuicję chemiczną z mocą obliczeniową modeli i algorytmów uczenia maszynowego w celu generowania wydajnych tras syntezy.
Czy możesz podkreślić postęp od programów opartych na regułach do uczenia maszynowego w kontekście obliczeniowej analizy planowania syntetycznego?
Oczywiście, na początku programy oparte na regułach opierały się na ręcznie wyselekcjonowanych zestawach reakcji chemicznych i transformacji grup funkcjonalnych w celu wygenerowania tras syntezy. Podejścia te obejmują ręczną selekcję reguł reakcji, co nadaje kontekst na poziomie eksperckim, ale ogranicza liczbę reguł, które można wziąć pod uwagę, zwłaszcza w tempie, w jakim nowe reguły reakcji są zgłaszane w literaturze podstawowej. Niedawno metody uczenia maszynowego (ML) stały się potężnym narzędziem do planowania syntezy chemicznej, ponieważ mogą obejmować duże zbiory danych reakcji chemicznych.
Jakie są znaczące kamienie milowe i implikacje wykorzystania algorytmów sztucznej inteligencji do proponowania ścieżek syntezy w syntezie małych cząsteczek?
Nowoczesne algorytmy syntezy zaczynają wykraczać poza oczywiste i bardziej złożone wyzwania syntezy. Wcześniejsze generacje CASD mogły podążać za zasadami chemii organicznej, ale odpowiedzi nie były zbyt odległe od oczywistych odpowiedzi. Wraz ze wzrostem korpusu dostępnych reakcji do rozważenia, zaczynają pojawiać się bardziej nowatorskie sugestie. Eksperymentalna walidacja zaplanowanych komputerowo tras staje się w końcu coraz bardziej popularna, z kilkoma kluczowymi kamieniami milowymi, w tym w pełni zautomatyzowaną realizacją na platformach robotycznych, generowaniem złożonych produktów naturalnych za pomocą zaplanowanych komputerowo tras, które są nie do odróżnienia od tras zaplanowanych przez człowieka, oraz partnerstwami człowiek-komputer, które dotarły do wyjątkowo krótkich receptur syntezy w celu uzyskania dostępu do produktów naturalnych. Fuzja wysokoprzepustowych technik eksperymentalnych to nowy, ekscytujący obszar, który obiecuje dalsze przyspieszenie procesu odkrywania leków. W miarę jak coraz więcej systematycznie rejestrowanych i odczytywanych maszynowo danych dotyczących reakcji staje się dostępnych, przewidywania uczenia maszynowego będą się poprawiać. W przyszłości prawdopodobnie zobaczymy jeszcze więcej przewidywań opartych na fizyce zakodowanych w obliczeniach retrosyntezy.
Na czym polega synergia między podejściem eksperckim a uczeniem maszynowym w usprawnianiu planowania retrosyntetycznego?
W planowaniu retrosyntetycznym celem jest zidentyfikowanie optymalnych tras syntezy dla cząsteczki docelowej poprzez pracę wstecz od cząsteczki docelowej do prostszych materiałów wyjściowych. Podejścia eksperckie i uczenia maszynowego (ML) mogą być stosowane razem w celu poprawy skuteczności planowania retrosyntetycznego.
Podejścia eksperckie opierają się na wiedzy i doświadczeniu chemików w celu zidentyfikowania kluczowych etapów syntezy. Podejścia te często opierają się na zestawie ręcznie wyselekcjonowanych reguł chemicznych, które zostały opracowane przez lata badań. Chociaż te podejścia eksperckie są cenne, są one ograniczone zakresem i złożonością transformacji, które można opisać za pomocą ręcznie wyselekcjonowanych reguł.
Z drugiej strony, podejścia uczenia maszynowego mogą analizować duże zbiory danych znanych reakcji chemicznych i automatycznie uczyć się wzorców i transformacji, które są trudne lub niemożliwe do uchwycenia przy użyciu podejść eksperckich. Zdolność algorytmów uczenia maszynowego do identyfikowania tych nowych wzorców i przekształceń może uzupełniać wiedzę dziedzinową i intuicję ludzkich chemików.
Synergię między podejściem eksperckim i uczenia maszynowego w planowaniu retrosyntetycznym można zaobserwować w rozwoju algorytmów uczenia maszynowego sterowanych przez ekspertów. W tych podejściach wiedza ekspercka jest wykorzystywana do kierowania wyborem potencjalnych ścieżek syntezy generowanych przez model ML. Pozwala to na zwiększenie dokładności i specyficzności w wyborze tras syntetycznych, przy jednoczesnym wykorzystaniu wydajności i skali algorytmów ML.
Ogólnie rzecz biorąc, połączenie podejść eksperckich i uczenia maszynowego w planowaniu retrosyntetycznym może znacznie poprawić szybkość i skuteczność tego procesu, prowadząc do bardziej wydajnego odkrywania leków, a ostatecznie do opracowania nowych terapii dla pacjentów.
Czy mógłbyś wyjaśnić, w jaki sposób sieci neuronowe trenowane na Regułach kodowanych przez ekspertów przyczyniają się do osiągnięcia wyższej dokładności syntezy w planowaniu retrosyntetycznym?
Sieci neuronowe, które są trenowane w oparciu o Reguły kodowane przez ekspertów, mogą poprawić dokładność przewidywań syntetycznych w planowaniu retrosyntetycznym poprzez uwzględnienie szczegółowej wiedzy chemicznej, przy jednoczesnym zachowaniu wystarczającej elastyczności, aby uwzględnić niekompletne lub nowe reakcje.
Reguły kodowane przez ekspertów to zestaw wstępnie zdefiniowanych reguł chemicznych, które opisują znane transformacje chemiczne. Reguły te opierają się na wieloletnich badaniach i wiedzy dziedzinowej i mogą być wykorzystywane jako podstawa do szkolenia sieci neuronowych. Trenując sieci neuronowe na tych regułach, sieci mogą nauczyć się rozpoznawać wzorce reakcji i lepiej przewidywać wyniki transformacji chemicznych.
Wykorzystanie sieci neuronowych wytrenowanych na Regułach kodowanych przez ekspertów może również pomóc w rozwiązaniu problemu niekompletnych lub nowych reakcji. Na przykład, jeśli transformacja chemiczna została wcześniej zaobserwowana tylko w ograniczonym zestawie reakcji, sieć neuronowa może zostać przeszkolona do przewidywania wyniku tej transformacji na podstawie dostępnych danych i reguł eksperckich. Jest to szczególnie przydatne w kontekście odkrywania leków, gdzie wiele docelowych cząsteczek nigdy wcześniej nie zostało zsyntetyzowanych.
Dzięki uwzględnieniu szczegółowej wiedzy chemicznej w postaci reguł kodowanych przez ekspertów, sieci neuronowe szkolone na tych regułach mogą osiągnąć wyższą dokładność w planowaniu retrosyntetycznym. Pomaga to chemikom nie tylko dokładniej przewidywać wyniki reakcji chemicznych, ale także przyspiesza proces odkrywania leków, pomagając chemikom w identyfikacji optymalnych ścieżek syntezy nowych związków.
Jak wykorzystać bibliotekę reakcji chemicznych i metadanych do projektowania zrównoważonych syntez?
Jest to ważny aspekt przyszłych prac. Piękno obliczeniowej retrosyntezy polega na tym, że można odrzucić protokoły, które wykorzystują odczynniki niewrażliwe na środowisko, na przykład reakcje wymagające dichlorometanu jako rozpuszczalnika lub wytwarzające dużą ilość odpadów metalowych. W międzyczasie można nagradzać protokoły, które wykorzystują bardziej przyjazne dla środowiska opcje.
Jednym ze sposobów na to jest włączenie do biblioteki informacji o wpływie konkretnych reakcji chemicznych na środowisko. Można zakodować różne czynniki, takie jak ilość generowanych odpadów, wymagana energia i toksyczność odczynników. Umożliwia to chemikom identyfikację zrównoważonych tras syntezy dla docelowych cząsteczek, poprzez wybór reakcji z biblioteki, które spełniają wymagane kryteria zrównoważonego rozwoju.
Oprócz informacji na temat wpływu konkretnych reakcji chemicznych na środowisko, metadane dotyczące reakcji chemicznych mogą być również wykorzystywane do projektowania zrównoważonych syntez. Metadane te mogą zawierać informacje takie jak wydajność reakcji, użyte rozpuszczalniki i wymagania energetyczne. Analizując te metadane, chemicy mogą zidentyfikować bardziej wydajne i zrównoważone ścieżki syntezy.
Wykorzystując bibliotekę reakcji chemicznych i metadanych do projektowania zrównoważonych syntez, chemicy mogą zmniejszyć wpływ procesów syntetycznych na środowisko, prowadząc do bardziej zrównoważonego i mniej marnotrawnego przemysłu chemicznego. Co więcej, wybierając reakcje z biblioteki zrównoważonych reakcji, chemicy mogą również poprawić szybkość i opłacalność procesu odkrywania leków, prowadząc do bardziej dostępnych i przystępnych cenowo terapii dla pacjentów.
W jaki sposób można połączyć ze sobą algorytmy sztucznej inteligencji (AI) i platformy robotyczne w kontekście syntezy organicznej opartej na sztucznej inteligencji?
Połączenie algorytmów AI i platform robotycznych w syntezie organicznej opartej na sztucznej inteligencji (AI) może znacznie poprawić szybkość i wydajność procesu odkrywania. Synteza organiczna oparta na sztucznej inteligencji automatyzuje logikę syntezy, podczas gdy platformy robotyczne automatyzują praktyczną pracę laboratoryjną, więc jest to potężne połączenie.
Algorytmy sztucznej inteligencji mogą być wykorzystywane do przewidywania optymalnych tras syntezy dla danej cząsteczki docelowej, wykorzystując ogromne bazy danych reakcji chemicznych i powiązanych danych. Platformy zrobotyzowane można następnie wykorzystać do syntezy cząsteczki docelowej w oparciu o przewidywane trasy. Wykorzystanie tych platform pozwala na szybkie eksperymentowanie i wysokoprzepustową syntezę dużej liczby związków.
Połączenie algorytmów sztucznej inteligencji i platform zrobotyzowanych można dodatkowo ulepszyć, wykorzystując mechanizmy pętli sprzężenia zwrotnego do optymalizacji procesu syntezy w czasie rzeczywistym. Przykładowo, algorytm AI może monitorować proces syntezy i dostarczać informacji zwrotnych na temat warunków reakcji, prowadząc do dalszej optymalizacji trasy syntezy i ostatecznie lepszych wyników.
Innym sposobem na połączenie algorytmów sztucznej inteligencji i zrobotyzowanych platform mikroprzepływowych jest wykorzystanie algorytmów uczenia maszynowego w celu poprawy wydajności platformy mikroprzepływowej. Dzięki ciągłemu monitorowaniu i informacjom zwrotnym algorytmy uczenia maszynowego mogą nauczyć się przewidywać optymalne warunki reakcji oraz poprawić wydajność i dokładność platformy mikrofluidycznej.
Ostatecznie, łącząc moc algorytmów sztucznej inteligencji i zrobotyzowanych platform mikroprzepływowych, można przyspieszyć proces odkrywania leków, umożliwiając szybką identyfikację nowych kandydatów na leki. Może to znacznie poprawić wyniki leczenia pacjentów, zapewniając szybsze i skuteczniejsze metody leczenia wielu różnych chorób.
Ekscytujące jest to, że robotyka laboratoryjna staje się coraz bardziej dostępna dla wszystkich, dzięki komercyjnym dostawcom lub zdemokratyzowanym platformom sprzętowym typu open source. Dziedzina ta z pewnością jeszcze bardziej przyspieszy, ponieważ automatyzacja laboratoriów odgrywa coraz większą rolę w edukacji na studiach licencjackich i magisterskich, przygotowując kolejne pokolenie naukowców do pracy w przyszłości.
W jaki sposób automatyzacja laboratoriów zmieniła tradycyjną syntezę i jakie są jej kluczowe zalety w porównaniu z pracą ręczną?
Automatyzacja laboratoriów zmieniła tradycyjną syntezę, umożliwiając wysokoprzepustowe eksperymenty i szybszą, bardziej precyzyjną syntezę złożonych związków organicznych. Niektóre z kluczowych zalet, jakie oferuje w porównaniu z ręczną obsługą, obejmują zwiększoną wydajność, wyższą precyzję, lepszą odtwarzalność, możliwość obsługi materiałów niebezpiecznych oraz integrację ze sztuczną inteligencją i algorytmami uczenia maszynowego.
Automatyzacja pozwala na szybką i powtarzalną syntezę dużej liczby związków, skracając czas i wysiłek wymagany do rutynowych zadań chemicznych i uwalniając naukowców, aby mogli skupić się na bardziej złożonych badaniach. Zautomatyzowany sprzęt może dozować precyzyjne ilości odczynników, co prowadzi do mniejszej zmienności wyników reakcji i poprawy dokładności wyników, a także może bezpiecznie obsługiwać niebezpieczne materiały i reakcje, chroniąc naukowców przed potencjalnie szkodliwymi chemikaliami.
Automatyzacja zapewnia, że eksperymenty są przeprowadzane w spójnych warunkach, zmniejszając prawdopodobieństwo błędu ludzkiego i zwiększając powtarzalność wyników. Można ją zintegrować ze sztuczną inteligencją i algorytmami uczenia maszynowego w celu dalszej optymalizacji operacji laboratoryjnych i przyspieszenia opracowywania nowych związków.
Ogólnie rzecz biorąc, automatyzacja laboratoriów może znacznie poprawić wydajność i precyzję tradycyjnej syntezy, prowadząc do szybszego odkrywania leków i ostatecznie skuteczniejszych metod leczenia pacjentów.
Jakie są prognozy dotyczące przyszłości automatyzacji syntezy i jak wyobrażasz sobie przejście od pracochłonnych procesów do inteligentnej automatyzacji?
Oczekuje się, że przyszłość syntetycznej automatyzacji będzie naznaczona ciągłym postępem w dziedzinie robotyki, uczenia maszynowego i sztucznej inteligencji, co doprowadzi do powstania coraz bardziej wyrafinowanych i inteligentnych systemów automatyzacji.
Jednym z kluczowych obszarów przyszłej automatyzacji syntetycznej będzie rozwój autonomicznych laboratoriów, które mogą działać 24 godziny na dobę, 7 dni w tygodniu, bez interwencji człowieka. Systemy te będą wyposażone w robotykę i algorytmy uczenia maszynowego, które będą w stanie wykonywać rutynowe zadania, monitorować eksperymenty i podejmować autonomiczne decyzje na podstawie generowanych danych.
Kolejnym obszarem zainteresowania będzie dalsza integracja sztucznej inteligencji z procesem odkrywania leków. Będzie się to wiązało z opracowaniem algorytmów sztucznej inteligencji, które będą w stanie analizować ogromne ilości danych chemicznych, przewidywać wyniki reakcji chemicznych i optymalizować warunki eksperymentów w czasie rzeczywistym.
Oczekuje się, że z biegiem czasu syntetyczna automatyzacja będzie stawać się coraz bardziej inteligentna, a systemy automatyzacji będą podejmować coraz bardziej złożone zadania i generować nowe spostrzeżenia, które mogą przyspieszyć odkrywanie leków. Te wysoce zautomatyzowane systemy pozwolą naukowcom na przeprowadzanie szerokiej gamy eksperymentów przy minimalnym nakładzie pracy i nadzorze człowieka, prowadząc do szybszego i bardziej wydajnego opracowywania leków.
Ogólnie rzecz biorąc, trajektoria automatyzacji syntetycznej zmierza w kierunku bardziej inteligentnych i wyrafinowanych systemów, które mogą obsługiwać złożone eksperymenty i szybko generować duże ilości danych, które można wykorzystać do dalszej optymalizacji procesu odkrywania leków. W przyszłości możemy spodziewać się przejścia od pracochłonnych procesów do wysoce zautomatyzowanych, inteligentnych systemów, które mogą zrewolucjonizować proces odkrywania leków i doprowadzić do opracowania nowych metod leczenia wielu różnych chorób.
Biorącpod uwagę spostrzeżenia zawarte w tych artykułach i postępy w retrosyntezie wspomaganej komputerowo, jak widzi Pan dalszą integrację sztucznej inteligencji i automatyzacjiw kształtowaniu krajobrazu syntezy chemicznej w nadchodzącychlatach?
Oczekuje się, że dalsza integracja sztucznej inteligencji i automatyzacji będzie radykalnie kształtować krajobraz syntezy chemicznej w przyszłości. Oczekuje się, że sztuczna inteligencja i automatyzacja przyspieszą odkrywanie leków, umożliwiając chemikom szybszą i wydajniejszą syntezę związków. Umożliwi to badaczom przetestowanie większej liczby cząsteczek i zbadanie szerszego zakresu przestrzeni chemicznej. Integracja sztucznej inteligencji i automatyzacji może również pomóc zmniejszyć wpływ syntezy chemicznej na środowisko, umożliwiając naukowcom identyfikację bardziej zrównoważonych szlaków chemicznych.
Algorytmy sztucznej inteligencji z zautomatyzowaną syntezą mogą prowadzić do zmniejszenia liczby błędów ludzkich i skutkować bardziej precyzyjną syntezą, dając tym samym produkty wyższej jakości. Przyspieszy to eksplorację przestrzeni chemicznej w odkrywaniu leków i doprowadzi do identyfikacji nowych związków, które w przeciwnym razie byłyby trudne do odkrycia tradycyjnymi metodami. Integracja sztucznej inteligencji i automatyzacji z syntezą chemiczną ma potencjał, aby przekształcić tę dziedzinę w głęboki sposób, znacznie przyspieszając szybkość i wydajność odkrywania leków, jednocześnie poprawiając naszą zdolność do identyfikowania trwałych i skutecznych cząsteczek leków. Przyszłość syntezy chemicznej rysuje się w jasnych barwach dzięki ciągłej integracji tych technologii.
Ujawnienie: Laboratorium Cernaka otrzymało finansowanie badań lub darowizny rzeczowe od MilliporeSigma, Burlington, MA, spółki stowarzyszonej Merck, Relay Therapeutics, Janssen Therapeutics, SPT Labtech i MSD Inc. T.C. posiada udziały w Scorpion Therapeutics oraz jest współzałożycielem i udziałowcem Iambic Therapeutics.