Cell Press Live：蛋白质结构与功能预测及设计—新闻

来源：科学网发布时间：2024/8/21 15:26:26

选择字号：小中大

Cell Press Live：蛋白质结构与功能预测及设计

直播时间：2024年8月22日（周四）19:00——21:40

直播平台：

科学网APP

(科学网微博直播间链接)

https://weibo.com/l/wblive/p/show/1022:2321325069047447289984

科学网微博

科学网视频号

【直播简介】

8月22日（周四）晚19:00, Cell Press细胞出版社旗下数据科学期刊Patterns将联合Trends in Biotechnology（现已开始接收研究类文章）为大家带来本年度第四场Cell Press Live线上讲座，主题为《蛋白质结构与功能预测及设计》。

本次会议邀请到来自西湖大学的李子青、深圳湾实验室的周耀旗，复旦大学的朱山风、北京大学的张文彬、以及来自瑞典查尔姆斯大学的傅晓智、与大家共同探讨在AI时代，如何利用新兴技术赋能蛋白质结构与功能的预测和设计。

同时，Patterns期刊编辑Dr. Wanying Wang与Trends in Biotechnology期刊主编Dr. Matthew Pavlovich与也将参与本次会议与大家线上互动交流。

免费注册参会请扫码：

【嘉宾简介】

李子青（Stan Z. Li, IEEE Fellow），西湖大学人工智能讲席教授，曾任微软亚洲研究院lead researcher、中国科学院自动化所模式识别国家重点实验室资深研究员。发表论文500余篇，著作10部，Google Scholar引用70000余次，在World Scientist and University Rankings 2024 计算机学科中国区排名第2。

领导开发了世界上第一个实时人脸识别系统，比尔盖茨接受CNN采访亲自为之讲解；设计研发了多个国家级人脸识别系统，并落地实施应用。曾任AI顶级期刊IEEE TPAMI等刊物副主编，担任100余个国际学术会议大会主席、程序主席，或程序委员。加入西湖大学后，负责实施科技部“新一代人工智能”重大项目2项、国家自然科学基金区域重点项目（AI+生命科学方向）1项。

▌报告主题：

AI +生命科学研究：从基因、蛋白质到药物设计

▌报告摘要：

本演讲介绍西湖大学在人工智能与生命科学学科交叉领域的最新进展，包括（1）中心法则的人工智能模型、（2）蛋白质结构编码与生成模型、（3）蛋白质进化树，（4）蛋白质组学从头测序、（5）配体-蛋白靶点相互作用及一体化药物设计系统，等前沿研究课题。

周耀旗教授是深圳湾实验室资深研究员和系统与物理生物学研究所副所长，也是靶向RNA小分子药的公司砺博生物的科学创始人，畅销书《出发：不断走出舒适区的科研生活之旅》的作者。在此之前，他是中国科技大学近代化学系的学士，美国纽约石溪大学的博士，北卡州立大学、哈佛大学的博士后，布法罗大学助理教授，副教授，印第安纳大学正教授，澳大利亚格里菲斯大学教授。他长期在结构生物信息学方面工作，曾经多次在国际蛋白质/RNA结构预测和功能预测比赛中名列前茅。他的科研成果的原创力和影响力获得了世界专家同行的肯定，入选了全球前2%顶尖科学家“终身科学影响力排行榜”和“年度科学影响力排行榜”，“中国高被引学者（生物学）榜”等。谷歌学者总引用18,000余次，H因子73。回国后获得了中国科技部、基金委以及广东省科技厅等多个重大项目的资助。目前从事基于AI和高通量实验的关于蛋白质/RNA的基础和应用研究。

▌报告主题：

AI在蛋白质结构预测的局限和对策

▌报告摘要：

最近，AlphaFold 2 实现了一项被认为几乎不可能实现的目标：预测的蛋白质结构达到了实验测定的精确度。这个出乎意料的高精度预测是通过端到端的深度学习、利用大数据和大模型，找到了多个同源序列与相应的“单一”结构之间的关系。也就是说，AlphaFold 2强烈依赖于多序列比对（MSA）中的进化和协同进化信息。对于找不到太多天然同源序列的或者进化突变的覆盖率不完全的蛋白质（例如抗体，病毒蛋白，复合物结构等），AlphaFold 2 预测的精确度和区域置信度就会大幅度下降，导致了人类蛋白质组里的残基只有36%可以被高可信地预测。最新出现的AlphaFold3以及其他AI的方法并没有解决这个问题。在这个报告里，我们采用人工生成的、结构稳定性选择、高通量测序获得的同源序列来拓展AlphaFold 2和AlphaFold 3的应用范围。初步结果为快速、低廉、通过测序来对所有蛋白质实现高精度结构预测走出了第一步。

朱山风，复旦大学类脑智能科学与技术研究院研究员，博士生导师。牛津大学出版社Bioinformatics Advances 副主编，UniProt 国际科学咨询委员会委员。先后主持五项国家自然科学基金项目，以及多个国内外企业研发项目。主要研究方向为人工智能与生物医学大数据挖掘，特别是生物医学文本挖掘、蛋白功能预测、宏基因组、智慧医疗等。相关论文以第一或通讯作者在生物信息、人工智能、数据挖掘等相关旗舰国际会议和期刊发表，如Nature Communications, Genome Biology, Bioinformatics, Nucleic Acids Research, ISMB, NeurIPS, KDD, IJCAI, ACL,等。2014年-2022 年参加 BioASQ 大规模生物医学文本自动标注国际竞赛中八次取得第一名。2017、2020和2023 年分别参加 CAFA3、CAFA4和CAFA5 大规模蛋白功能自动标注国际竞赛获得第一名。2019年-2021年参加CAMI II大规模宏基因组数据解析国际竞赛在重叠群分箱算法中整体排名第一。

▌报告主题：

大规模蛋白质功能预测新进展

▌报告摘要：

全世界最大的蛋白质数据库UniProt收录了大约2亿5千万蛋白序列，但是目前只有不到0.1%的蛋白质具有生化实验验证的基因本体（Gene Ontology）功能标注。这凸显了开发高性能蛋白功能预测算法的重要性。现有方法主要关注蛋白质序列、网络及结构数据，而忽视了蛋白相关文献信息。然而目前大约82%的SwissProt蛋白已拥有专家标注的文献信息。为此我们提出了一种基于深度信息检索的算法GORetriever。大量实验结果表明，GORetriever能显著提高蛋白功能预测性能。GORetriever也是我们开发的GOCurator的核心组件，GOCurator在最近的第五届大规模蛋白功能自动标注国际评测（CAFA5，超过1,600个团队参与）中荣获第一。

张文彬，北京大学化学与分子工程学院博雅特聘教授。2004年获得北京大学理学学士学位，2010年获美国阿克伦大学博士学位（导师：程正迪院士），之后先后在美国阿克伦大学（合作导师：程正迪院士）和加州理工学院（合作导师：David Tirrell院士）从事博士后研究。2013年加入北京大学。主要研究领域为高分子化学与物理和蛋白质工程，致力于通过结合生物大分子和合成大分子的设计理念和独特基元，发展具有精密结构的非传统高分子，以发展相应的功能材料。至今为止，已在Science, Nat. Commun., Proc. Natl. Acad. Sci. USA, J. Am. Chem. Soc., Angew. Chem. Int. Ed.等学术期刊上发表论文160余篇，其中131篇为第一或通讯作者，总他引6000余次。目前担任国际期刊Bioorganic Chemistry编辑、中国免疫学会第一届自身免疫分会委员会委员、中国化学会超分子化学专业委员会委员以及高分子学报、ACS Macro Lett., Polymer, React. Funct. Polym., Sci. China Chem.和 Giant等多个国际学术期刊编委。曾获日本化学会杰出讲座奖(2017年)、国家杰出青年基金（2019年）、Bayer Investigator Award（2021年）、中国化学会超分子化学青年创新学术讲座奖（2023年）等荣誉和人才计划。

▌报告主题：

单结构域拓扑蛋白质

▌报告摘要：

蛋白质的体内合成受基因调控，其主链结构多为线型结构。具有非线型复杂拓扑结构的蛋白在大自然中较为少见，大多与特定的功能优势相联系。我们致力于拓展蛋白质的拓扑结构，以探索拓扑结构的构效关系以及生物医药应用。利用可基因编码的多肽标签-蛋白质化学反应，通过合理的设计及与蛋白质折叠的结合，我们已经合成了多种具有复杂拓扑结构的蛋白质，包括轮烷、纽结蛋白质、套索蛋白质、蛋白质索烃等。在此基础上，我们发展了单结构域蛋白质的拓扑改造方法，实现了一系列单结构域蛋白质拓扑异构体的选择性合成，并初步探讨了拓扑对构效关系的影响。结果表明，拓扑结构可显著提升蛋白的稳定性和耐酶切稳定性、抗变性、抗聚集能力，提示其在蛋白质药物和工业酶等方面具有广泛的应用前景。进一步地，我们认为可能存在着与目前线型蛋白质序列宇宙空间相平行的多元拓扑蛋白质序列宇宙空间。这大大拓宽了蛋白质分子的范畴，为蛋白质工程提供了崭新的维度。

傅晓智，2015年于清华大学获博士学位，现任瑞典查尔姆斯大学研究员，主要研究领域为蛋白质设计、改造与定向进化，以及基于微流控的高通量筛选。以第一作者身份在Nature Biotechnology, Nature Communications, Metabolic Engineering等期刊上发表论文多篇。

▌报告主题：

基于干湿结合的蛋白设计与筛选的快速迭代

▌报告摘要：

蛋白质设计与改造已进入AI时代，诸多基于序列或结构的模型为各类蛋白质家族补充了前所未有的生成式蛋白新序列，也赋予了传统蛋白新功能，但整体而言，大部分预测模型得到的蛋白新序列有效率不足50%，后续需要大量湿实验对序列进行进一步筛选和功能性验证，而很多相关模型研究缺乏湿实验验证。我们构建了基于蛋白序列与结构信息的COMPSS筛选器，并利用500多个蛋白的湿实验表达及功能结果对COMPSS进行进一步修正，通过COMPSS对生产式蛋白序列进行筛选后，蛋白功能有效率可提升50-150%，最高可达100%有效。同时，本报告也将分享AI时代下干湿结合实验室如何运行的一些思考。

特别声明：本文转载仅仅是出于传播信息的需要，并不意味着代表本网站观点或证实其内容的真实性；如其他媒体、网站或个人从本网站转载使用，须保留本网站注明的“来源”，并自负版权等法律责任；作者如果不希望被转载或者联系转载稿费等事宜，请与我们接洽。

编辑部推荐博文
基金申请季，这里有2份攻略请查收！科学网2026年1月十佳博文榜单公布！ Entropy 2026大会嘉宾公布，相聚巴塞罗那！三波段调节智能光伏窗构建绿色节能建筑坚持写科学网博客的好处王阳明思想为人工智能时代的教育和研发指明方向更多>>