学术繁荣计划:浙江省第一届人工智能与生物信息学前沿交叉论坛预告
作者:罗晓琴
发布日期:2022-11-08
浏览次数:
新一轮科技革命和产业变革加速演进,人工智能和生物信息学交叉领域重要科学问题和关键核心技术已经产生革命性突破,新的学科分支和产业新增长点不断涌现,学科深度交叉融合势不可挡。会议围绕"人工智能技术对结构生物学研究范式和产业应用的影响"和"生物信息学前沿发展及其与人工智能新技术交叉融合趋势"两个议题进行深入讨论。会议主题:"学科交叉、融合创新、人才培养、产业转化"。会议邀请国内人工智能、生物信息学、结构生物学、药学、医学等领域专家作专题报告,探索科技前沿。
一、会议组织: 主办单位: 浙江省生物信息学学会人工智能专业委员会、浙江工业大学 承办单位: 浙江工业大学信息工程学院 协办单位: 中国生物信息学学会(筹)多组学与整合生物学专业委员会、生物大分子结构预测与模拟专业委员会 名誉主席: 俞 立、陈 铭 会议主席: 张贵军 组委会: 张 彪、周晓根 秘书: 刘 俊(电话:13372541308 邮箱:junl@zjut.edu.cn)
二、会议时间、地点: 时间:2022年11月12日 线上地点:腾讯会议(会议号:143-249-473) 线下地点:浙江工业大学信息工程学院D533会议室
三、会议议程:
四、报告简介: 报告一:基于机器学习的RNA结构预测方法研究进展 内容简介:RNA分子参与各种生物过程,如催化和调控过程。为了完成这些功能,它们需要形成特定的结构。由于实验解析的RNA结构数目非常有限,人们发展了计算方法预测RNA结构。近年来,机器学习方法越来越多地应用于RNA结构预测,在许多方面预测准确性有了显著的提高,显示出很好的发展前景。这里将简要介绍RNA级结构预测研究的背景和现状,特别是基于机器学习的RNA结构预测方法方面的研究进展。
报告二:蛋白质结构和序列的数据驱动设计 内容简介:按需定向设计蛋白质等生物大分子具有重要理论和应用价值,也是极具挑战性的计算科学问题。深度学习等人工智能方法相对与传统计算设计方法的成功主要以其对高维复杂分布能进行更准确估计和更高效抽样为基础。目前相关方法进展集中于基于语言模型的氨基酸序列设计、基于结构的逆折叠、新主链结构从头设计等方面。我将介绍我们在蛋白质主链结构设计、氨基酸序列从头设计方面的进展,并讨论计算和实验指标对方法评估的价值。
报告三:"AI for Science" - "Science for AI" 内容简介:"AI for Science": Spatially resolved transcriptomics (SRT) technology enables us to gain novel insights into tissue architecture and cell development, especially in tumors. However, lacking computational exploitation of biological contexts and multiview features severely hinders the elucidation of tissue heterogeneity. Here, we propose stMVC, a multi-view graph collaborative-learning model that integrates histology, gene expression, spatial location, and biological contexts in analyzing SRT data by attention. Speci?cally, stMVC adopting semisupervised graph attention autoencoder separately learns view-speci?c representations of histological-similarity-graph or spatial-location-graph, and then simultaneously integrates two-view graphs for robust representations through attention under semi-supervision of biological contexts. stMVC outperforms other tools in detecting tissue structure, inferring trajectory relationships, and denoising on benchmark slices of human cortex. Particularly, stMVC identi?es disease-related cell-states and their transition cell-states in breast cancer study, which are further validated by the functional and survival analysis of independent clinical data. Those results demonstrate clinical and prognostic applications from SRT data. "Science for AI": Backpropagation (BP) algorithm is one of the most basic learning algorithms in deep learning. Although BP has been widely used, it still suffers from the problem of easily falling into the local minima due to its gradient dynamics. Inspired by the fact that the learning of real brains may exploit chaotic dynamics, we propose the chaotic backpropagation (CBP) algorithm by integrating the intrinsic chaos of real neurons into BP. By validating on multiple datasets (e.g. cifar10), we show that, for multilayer perception (MLP), CBP has significantly better abilities than those of BP and its variants in terms of optimization and generalization from both computational and theoretical viewpoints. Actually, CBP can be regarded as a general form of BP with global searching ability inspired by the chaotic learning process in the brain. Therefore, CBP not only has the potential of complementing or replacing BP in deep learning practice, but also provides a new way for understanding the learning process of the real brain.
报告四:AI for Bioinformatics 内容简介:介绍AI数据科学的流形原理,和最近AI+ 多组学数据分析、蛋白质结构预测、蛋白质序列设计的一些新进展。
报告五:基于AI的蛋白质与RNA结构预测 内容简介:AlphaFold2等方法使蛋白质结构预测取得了突破性进展。课题组前期开发了蛋白质结构预测方法trRosetta,在AlphaFold2的启发下,我们对trRosetta做了一系列发展,本报告将对它们做简要介绍。
报告六:从结构生物学看人工智能的影响 内容简介:结构生物学是利用物理学手段将生物学建筑在化学基础上的一门学科。结构生物学是生物学的重要领域,它使得生物学家可以从化学角度分析生物学问题。长期以来,结构生物学一直是一门以实验为主的科学。近年来,人工智能技术引领革命性突破,推动新一轮科技革命加速演进。人工智能赋予了结构生物学新的动能,促使其从新的视角和新的水平上研究和看待问题。报告将围绕会议主题探讨人工智能技术对结构生物学研究范式的改变。
报告七:新冠病毒多序列比对 内容简介:目前已从世界各地发现并测序了接近100万条新冠病毒DNA序列,新冠病毒序列高度保守但存在多处有语义和功能差异的变异。对新冠病毒序列进行多序列比对有助于高效地发现变异位点、重现进化关系。但是鉴于新冠病毒序列数目多、序列长度长,目前主要的多序列比对软件无法完成。我们的前期工作HAlign可以快速处理大规模相似DNA序列,有望解决该问题。在比对新冠DNA序列的过程中,我们进一步的优化HAlign,包括:首位序列的处理、部分插入空格的优化、以及后缀树的数据结构设计等方面。优化后的HAlign在比对效果和比对时间上都优于目前现有的软件,比对时间缩小了十倍以上。通过对新冠病毒序列全面的多序列比对,我们还分析出若干新知识。
报告八:组学大数据在复杂眼病诊断和治疗的研究 内容简介:据世卫组织统计,全球至少有22亿人存在视力障碍或失明,我国是致盲人数最多国家。其中至少有10亿人存在视力障碍,这种情况本可以预防或尚未得到治疗。眼部疾病非常普遍,那些活得足够长的人一生中至少会有一种眼部疾病。本报告将从组学大数据角度汇报课题组近期在近视预警和防控,高度近视、青光眼、糖网等多种致盲性眼病的遗传模式和调控机制,及潜在基因治疗途径等方面的进展。
报告九:蛋白与分子绑定位点和模体挖掘 内容简介:蛋白与RNA、化合物分子相互作用形成的网络是认识生命系统复杂现象的重要内容。DNA元件百科全书(Encyclopedia of DNA Elements, ENCODE)项目绘制了150多种RNA绑定蛋白的结合与功能图谱。这些数据使得我们能够开发机器学习模型挖掘RNA、小分子和蛋白绑定的序列与结构特征。我们考虑绑定位点的序列和结构上下文、全局和局部特性,开发了一系列的基于深度网络模型的绑定位点和模体预测方法。
报告十:RNA结构端到端预测 内容简介:RNA是细胞的重要基础,通过形成特定三维结构来执行相应的功能。从序列直接预测RNA的三维结构是一项具有挑战性的任务。该报告将介绍一种新的基于深度学习的RNA三维结构预测方法。该方法实现了RNA结构和远程核苷酸之间的几何相互作用的端到端预测,通过将预测的约束信息转变为混合势能,指导后续的构象优化过程。相比传统RNA结构预测算法,该算法具有一定的优势。
报告十一:多域蛋白质结构与功能预测 内容简介:蛋白质结构预测是阐明功能机理和揭示生命体生物学本质的基础,是加速疾病研究和促进创新药物研发、疫苗设计和精准诊断的核心技术。AI蛋白质结构预测程序AlphaFold2实现了基于氨基酸序列精确预测蛋白质三级结构的重大突破。AlphaFold2虽然精度较高,但多域蛋白质的全长结构建模精度仍需进一步提高,且结构域缔结与协作实现的功能至关重要。本报告介绍多域蛋白质结构组装和功能预测方面的工作,包括基于类似模板的多域蛋白质组装方法、冷冻电镜密度图辅助的多域蛋白质结构渐进组装方法、全自动化的多域蛋白质结构和功能深度学习预测平台。
|