ChatGPT會改變生物醫(yī)療嗎?
2022年12月,兩位計算生物學家凱西·格林(Casey Greene)和米爾頓·皮維多里(Milton Pividori)開創(chuàng)了一項不尋常的實驗:他們請一位非科學家助理幫助他們改進三篇研究論文。在一份生物學手稿中,助理甚至發(fā)現(xiàn)了一個引用方程式的錯誤,審核進行得很順利,費用也不高,每份文件不到0.5美元。這個助手不是人,而是一個叫GPT—3的人工智能算法。這個算法將幫助我們提高研究人員的工作效率。
今天,ChatGPT,一個基于這種通用的大規(guī)模模型算法的產(chǎn)品,一經(jīng)推出就引起了人們的關注。有一段時間,全球科技巨頭宣布他們將把ChatGPT引入他們的業(yè)務。人們或驚嘆狂歡,或居安思危。ChatGPT所承載的意義似乎超越了它本身。在百花齊放的應用場景中,生物技術領域如何搭上ChatGPT的快車?
ChatGPT和生物技術的結合
2020年,人工智能公司OpenAI發(fā)布的一個模型自發(fā)布以來就被大肆宣傳,它是一個人工智能聊天機器人般的工具,無論是創(chuàng)作散文、詩歌、計算機代碼還是編輯研究論文,它似乎無所不能。最近,微軟表示將把ChatGPT集成到其搜索引擎必應和網(wǎng)絡瀏覽器中,谷歌今天展示了其名為巴德的人工智能對話系統(tǒng)。這些系統(tǒng)可以對用戶提供的復雜問題提供全面的答案,從制定詳細的旅行計劃到分析公司運營策略。
ChatGPT在生物技術中最有前途的應用似乎是在蛋白質生產(chǎn)和基因測序領域
總部位于加利福尼亞州的生物技術公司Profluent使用類似于ChatGPT的人工智能模型,創(chuàng)造了新的抗菌蛋白,并顯示它們可以在實驗室中殺死細菌。該模型被稱為ProGen,是一個大的語言模型(LLM),使用大量的文本作為訓練數(shù)據(jù)來開發(fā)分析和生成語言的能力-類似于ChatGPT,但Progen的語言是蛋白質的語言。簡而言之,使用人工智能和大型語言模型,比如為ChatGPT提供動力的模型,來學習生物學的基本語言,并設計具有治療疾病潛力的新蛋白質。目前,ProGen已經(jīng)產(chǎn)生了100萬個不同的人工序列,研究人員從中選擇了100個在實驗室合成,其中66個產(chǎn)生了類似于蛋清溶菌酶的化學反應,并用作陽性對照。研究小組隨后選擇了五種新型抗菌蛋白,并對大腸桿菌進行了測試。其中兩種新的蛋白質能夠殺死細菌。同時,X射線成像顯示,盡管這些抗菌蛋白的氨基酸序列與任何已知的天然蛋白質相差30%以上,但它們仍然折疊成幾乎與它們的“天然表親”相同的形狀。這項研究或許意味著,未來我們可以與人工智能合作,創(chuàng)造出不屬于自然的蛋白質,并賦予這些蛋白質不同的功能,人類將成為微觀世界中的神。
在征服了蛋白質之后,ChatGPT似乎又向基因進軍了
科技公司英偉達在今年的摩根大通醫(yī)療大會上表示,隨著下一代基因組測序的速度越來越快,成本越來越低,我們目前的基因組DNA測序能力已經(jīng)超過了分析DNA序列并從中獲得洞見的能力。人工智能能更快速有效地處理海量的基因組序列信息。大規(guī)模語言模型可以像人類語言一樣分析DNA序列,從而加快基因組的拼接和基因突變的發(fā)現(xiàn),并將發(fā)現(xiàn)結果以人類對話的形式表達給研究人員。例如,集成了ChatGPT的基因測序分析系統(tǒng)在處理患者的基因組測序數(shù)據(jù)后可能得出結論——“該患者的某個基因突變可能導致罕見的遺傳病A”,這似乎取代了醫(yī)生。