首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏大数据文摘

    生命科学中的大数据

    大数据与生命科学 大数据是目前最热的概念之一,也是容易被曲解的概念。顾名思义,大数据意味着大量的数据,然而这只是从字面理解的含义。 概括来看,大数据包括三层含义(3V):数据量大(volume of data),处理数据的速度快(velocity of processing the data),数据源多变(variability of 生命科学的数据来源和形式多样,包括基因测序、分子通道、不同的人群等。如果研究人员能解决这一问题,这些数据将转变成潜在的财富,即问题在于如何处理这些复杂的信息。 为了应用这一理念,McVean领衔的研究团队通过李嘉诚(Li Ka Shing)捐献的3 300万美元正在剑桥大学创建Li Ka Shing健康信息和探索中心(Li Ka Shing Centre for (3)多变性 其一,生物学实验室往往有多种设备,这些设备产生的数据是以某种文档形式存在。所以,加拿大多伦多的ACD/Labs公司开发的计算系统在处理大数据时能够整合各种数据格式。

    94781发布于 2018-05-21
  • 来自专栏智药邦

    深耕生命科学智能自动化,镁伽完成3亿美元C轮融资

    2022年6月15日,镁伽科技宣布完成3亿美元C轮融资,由高盛资产管理、亚投资本、纪源资本联合领投,老股东创新工场持续超额加注,新加坡蘭亭投资(Pavilion Capital)、史带资本(Starr 自2016年成立至今,镁伽为生命科学行业提供了一整套自动化解决方案,从简单的操作台工作流程自动化,到大型系统流程应用中处理复杂步骤的全自动解决方案,并延伸至赋能AI药物研发服务的下一代生命科学基础设施和系统 ▲镁伽生命科学自动化系统 与此同时,镁伽着力打造下一代生命科学基础设施——镁伽鲲鹏实验室,与多家领先的生命科学领域企业开展深度战略合作,构建优化研发流程、提高效率的基础设施和平台,积极探索生命科学前沿研究 ,并于多项生命科学垂直细分领域取得重要进展。 本次融资将帮助镁伽进一步加强‘自动化+人工智能+生命科学’的能力闭环,打造和完善以智能自动化为特色的下一代生命科学基础设施。”

    55620编辑于 2022-11-16
  • 来自专栏生信技能树

    生命科学领域最容易就业的方向是?

    3阶段:元字符,通配符及shell中的各种扩展,从此linux操作不再神秘! 第4阶段:高级目录管理:软硬链接,绝对路径和相对路径,环境变量。 第5阶段:任务提交及批处理,脚本编写解放你的双手。 其实这些各个技术流程的视频教程好几年前我就全部免费共享在b站,而且我同步分享了视频配套讲义和教辅材料; 学徒第1月,基础知识介绍掌握:文档链接:https://mubu.com/doc/38tEycfrQg 密码:vl3q 学徒第2月,RNA-seq数据分析实战训练:文档链接:https://mubu.com/doc/38y7pmgzLg 密码:p6fo 学徒第3月,WES数据分析实战训练:文档链接:https://mubu.com

    68610编辑于 2022-03-03
  • 来自专栏IT创事记

    开放与包容:BGI Online加速生命科学产业发展

    文特尔称,要在3年内完成人类基因组的序列测定,目的是抢在“国际人类基因组计划”前完成,以便将人类基因组图谱申请成专利,靠垄断人类基因组信息来谋利。 开放包容的BGI Online 目前来说,生存对华大基因来说已经不是问题,它需要想得更远,更前瞻,去推动生命科学整个产业的发展。 ,华大基因的业务已经覆盖了全球100多个国家和地区,包括国内31个省市自治区的2,000多家科研机构和2,300多家医疗机构,其中三甲医院300多家;欧洲、美洲、亚太等地区合作的海外医疗和科研机构超过3,000 通过BGI Online,华大基因正在跟全球客户、合作伙伴一起,打造一个开放包容的基因生物学研究生态,分享数据,分享成果,加速生命科学产业发展。

    72010编辑于 2022-06-16
  • 来自专栏Python项目实战

    量子飞跃:生命科学中的量子计算应用前景

    量子飞跃:生命科学中的量子计算应用前景量子计算,这个听起来像科幻小说里的技术,正在逐步走入现实并为多个领域带来颠覆性的影响。 特别是在生命科学领域,量子计算以其强大的并行计算能力和指数级加速能力,正在解决一些经典计算无法解决的问题,例如蛋白质折叠、药物发现、基因组学分析等。 量子计算在生命科学中的核心应用1. 蛋白质折叠问题蛋白质折叠问题被认为是计算生物学中的“圣杯”。蛋白质的三维结构决定其功能,而通过传统方法计算所有可能的折叠方式需要天文数字级别的运算量。 -2})# 使用量子近似优化算法 (QAOA)backend = Aer.get_backend('qasm_simulator')qaoa = QAOA(optimizer=None, reps=3) 文字描述如下):分子量子态(Quantum States) ↓ 编码到量子比特量子运算(Quantum Simulation) ↓分子间能量解(Chemical Energy Levels)3.

    54910编辑于 2025-03-18
  • 来自专栏DrugOne

    AI工具正在接管生命科学实验室?

    欢迎关注 MindDance,一起探索 AI 与生命科学交汇的最前沿。 : [1]: Ascent Bio. https://www.ascentbio.ai/ [2]: Edison Scientific. https://edisonscientific.com/ [3]

    37120编辑于 2026-02-03
  • 来自专栏数据派THU

    【干货书】深度学习生命科学:药物发现与药物发现

    现在它在科学领域掀起了波澜尤其是在生命科学领域。这本实用的书教导了开发人员和科学家如何将深度学习用于基因组学、化学、生物物理学、显微学、医学分析和其他领域。

    35310编辑于 2022-05-12
  • 来自专栏数据猿

    算力赋能,打造生命科学云上新范式

    ——聚焦数据 · 改变商业 云端算力驱动生命科学创新 实现百万样本高效分析 某生命科学研究院推出的生命科学数据分析平台,是一款基于云架构、由AI驱动的多组学在线分析平台,以技术为根、数据为翼,为科研工作者提供全过程一站式分析服务 该生命科学数据分析平台被誉为生命科学研究与健康应用领域的“超级引擎”,致力于打通科研与临床的壁垒,释放生命大数据价值,助力守护人类健康共同体。 在强大性能的背后,是某生命科学研究院与火山引擎的深度技术合作。 以某生命科学研究院为代表的生命科学机构,在进行基因组重测序、蛋白质分析等业务时,面临两大核心挑战: 1.算力潮汐:蛋白等多组学分析任务常需并行处理数万个样本,瞬时需要高达十万核级别的计算资源,对算力弹性调度要求极高 解决方案与价值:某生命科学研究院选用火山引擎 AMD g3a 实例构建其核心分析平台。

    10610编辑于 2026-01-14
  • 来自专栏HyperAI超神经

    清华大学生命科学学院张强锋教授:AI 理解生命科学的海量数据,解析复杂调控网络

    作者:田小幺 编辑:李姝,李宝珠 清华大学生命科学学院、清华-北大生命科学联合中心研究员、博导张强锋教授在第六届北京智源大会的「AI for Science」论坛上以「当人工智能遇上生命科学」为题,分享了如何利用 「人工智能技术的进展,给生命科学带来了革命性的突破,能够让我们有机会理解生命科学的海量大数据、解析生命科学的复杂调控网络。」 在第六届北京智源大会的「AI for Science」论坛上,清华大学生命科学学院、清华-北大生命科学联合中心研究员、博导张强锋教授以「当人工智能遇上生命科学」为题,分享了如何利用 AI 结合冷冻电镜实现蛋白质结构的解析 人工智能的发展给生命科学带来了革命性的突破,能够让人们有机会理解生命科学的海量大数据、解析生命科学的复杂调控网络,也是研究生命现象、生命系统的强有力工具。 2016 年 3 月 15 日,AlphaGo 打败李世石,这是个历史的瞬间。

    46910编辑于 2024-07-15
  • 来自专栏DrugOne

    Methods | 面向生命科学的人工智能智能体

    但可以肯定的是,AI 智能体正在成为生命科学研究中不可忽视的新变量。下一代研究人员将如何塑造并驾驭这些系统,值得持续关注。 整理 | DrugOne团队 参考资料 Tang, L.

    24010编辑于 2025-12-25
  • 来自专栏DrugOne

    KDD 2022 | 编程指南:生命科学中的图神经网络

    与其它领域相比,生命科学的问题有其自身的独特性和细微的差别。 代码和比较详细的说明,这四类问题包括:1)小分子属性预测;2)大分子属性和功能预测;3)基于双图(bi-graph)的蛋白质-配体对亲和力预测;4)利用知识图谱进行医学预测。 图机器学习在生命科学的应用 图结构数据在生命科学中十分常见。 图3 在大分子数据RNA和蛋白质上:1)利用GCN预测COVID-19 mRNA疫苗的降解;2)利用等变GNN预测蛋白质功能。作者还提供了实用的RNA和蛋白质结构可视化代码(图4和图5)。 作者介绍了医学知识图谱上的三个经典应用:1)挖掘医学文献和出版物中的知识;2)处理来自医学数据库中的不同KG;3)将关系数据库转化为KG。

    51430编辑于 2022-11-28
  • 来自专栏用户7627119的专栏

    李彦宏:以生物计算探索生命科学“无人区”

    生命科学没有尽头,只有尽力。” 生物计算产业的发展,需要生态和产业链的协同,构建开放的生物计算创新生态,去探索广袤浩瀚的生命科学“无人区”。 以下为李彦宏现场致辞实录: 各位嘉宾,大家上午好。 我作为未来科学大奖-生命科学奖的捐赠人,作为一些基因组学研究项目的资助人,也一直在密切关注着这个行业的变化。 生命科学没有尽头,只有尽力。 生物计算产业的发展,需要生态和产业链的协同,一家乃至一百家企业,可能都远远不够。 我们希望能与诸位科学家、企业家一起,构建开放的生物计算创新生态,去探索广袤浩瀚的生命科学“无人区”。

    30340编辑于 2022-09-21
  • 来自专栏DrugOne

    首届中国生物计算大会 探索生命科学产业新机遇

    来源于微信公众号“生物计算大会” 首届生物计算大会 5月10-11日,由中国首家生物计算技术驱动的生命科学平台百图生科,与致力于IT和BT交叉融合的创新孵化中心播禾创新联合主办的首届中国生物计算大会于苏州国际博览中心召开 西湖大学校长施一公院士则从生命科学的角度看AI,分享了对于生物计算的宏观认知,并以自身在冷冻电镜技术的研究为例指出“计算领域一次次的突破创新,会带来人类对微观世界认知的革命,你要想抓住这次革命,就要和它同频共振 在听完几位院士分别从底层计算技术、生命科学、免疫疗法和智能诊断各个维度剖析了生物计算的发展现状,由恒瑞医药高级副总经理兼全球研发总裁张连山;药明康德联席CEO杨青;清华大学智能产业研究院首席科学家马维英以及连线嘉宾佐治亚理工学院机器学习中心副主任 在场的两位专家,北京大学生命科学学院长聘教授,百奥智汇科学顾问、百图生科科学顾问张泽民;北京大学肿瘤医院肿瘤生物信息中心主任,百图生科科学顾问吴健民,同时连线场外嘉宾:百图生科副总裁,原吉利德生物信息和数据科学部执行总监蒋昭实与大会主持薄荷天使基金合伙人

    85930发布于 2021-05-24
  • 来自专栏简说基因

    致敬生命科学史上的伟大发明(一):Sanger测序

    有些生命科学发明,看似并不复杂,比如 PCR,就是热水中的链合成反应。东西印迹、西方印迹,就是一块破布(来自本人一位大学老师)。今天要学习的一代测序,就是DNA合成反应末端终止加上毛细管电泳。 但是,它们都确确实实是生命科学史上最伟大的发明之一。 1981年,James W. Jorgenson和Krynn D. Lukacs发明了效率更高的毛细管电泳。 而3'羟基的功能则是与磷酸基团酯化。 同样地,核苷酸的3' 羟基也可以脱去。此时,下一个核苷酸的磷酸基团失去作用位点而无法与其连接,核酸长链无法继续增加。 3个SNP位点: 3.重叠峰(亦称双峰/套峰) 若PCR扩增效果不佳,会导致目的片段与非特异性扩增一起被测序。它们形成的峰图叠加在一起,会形成看起来混乱的重叠峰。

    2.3K01编辑于 2025-02-05
  • 来自专栏天意云&天意科研云&天意生信云

    GPT进入蛋白质组学:LLM如何推动生命科学变革

    科学家们将Transformer模型(GPT)应用于蛋白质序列数据,试图在蛋白质组学领域复制大语言模型(LLM)的成功。本篇文章将带你了解蛋白质语言模型(pLM)的起源、发展及其尚待解决的问题。

    38100编辑于 2025-03-06
  • 来自专栏大数据文摘

    年度10大科技人物揭晓 生命科学界占据5席

    在入选当选2014年度最具影响力的10大“科技创新人物”,生命科学领域占据5席,他们分别是:袁隆平、李兰娟、乔杰、戴建武和舒跃龙。 ? 其中,在入选当选2014年度最具影响力的10大“科技创新人物”,生命科学领域有5人入选。 ?

    62430发布于 2018-05-23
  • 来自专栏机器之心

    ChatGPT成功背后的技术原因及其对生命科学领域的启发

    3)基于自监督预训练的生成大模型与基于少量优质数据强化学习反馈策略的学习范式,有望成为未来推动各个领域前进的动力,除 NLP 领域外,有望在生命科学、机器人、自动驾驶等各个领域引发新一轮人工智能热潮。 GPT3、GPT3.5 和 ChatGPT 等工作都没有开源,甚至 API 都对中国做了封锁,这都是复制工作实际面临的困难。说得悲观一点,大部分想复制 ChatGPT 效果的团队,都不会成功。 生命科学领域,如果仅通过少量的试验数据反馈,就能显著影响模型预测结果的话,整个生命科学领域与计算融合的革命将会来得更快一些。 让我们把目光回到我们更关注的生命科学领域。 由于 ChatGPT 带来的技术进步改善了大多数 NLP 相关领域,所以,生命科学领域内和信息查询检索抽取有关的技术和产品,会优先受益。 受限于可用数据数量,当前生命科学领域使用的生成模型还比较浅,主要使用的是 GNN 等浅层深度学习模型(GNN 受限于消息传递的平滑性,层数只能使用到 3 层左右),生成效果上虽然体现了很好的潜力,但依然没有

    83410编辑于 2023-02-23
  • 来自专栏AI科技评论

    ACM、IEEE Fellow 李明:将 AI 用于生命科学的三十年

    1985年3月,李明拿到博士学位后,去了俄亥俄州立大学的计算机科学与信息系任教一半年。 3 李明的黄金时代与合作者联盟 进入新千年,伴随着人类基因测序工作完成,生信研究再次迈入新时代——后基因组时代。 具体来说,用深度学习寻找新抗原的过程,可以理解为3步: 一、在癌组织里面将癌细胞产生的新抗原提取出来,然后利用质谱仪DIA采集模式,将新抗原肽段产生大的谱图数据载入软件分析; 二、利用个人的HLA 肽段重新训练个体化模型 李明说,“生命科学领域存在大量的数据,单纯靠湿实验室远远不够。个性化治疗的普及需要干实验室化,AI将会帮助生物学家将制药流程从湿实验转到干实验。” 李明表示,从BSI到百蓁生物,如果能够为生命科学做出一点推动,我的工作就算没有白费。

    2.1K20编辑于 2023-04-12
  • 来自专栏arxiv.org 翻译专栏

    生命科学的重写理论: CTMC语义学的统一理论(CS LO)

    Kappa 生物化学和MD有机化学框架是迄今为止在生命科学中重写理论方法的最为成熟的应用之一。 原文作者:Nicolas Behr 原文地址:https://arxiv.org/abs/2003.09395 生命科学的重写理论 CTMC语义学的统一理论.pdf

    57810发布于 2020-03-26
  • 来自专栏DrugOne

    Nature丨AlphaFold2带着源码来了,开启AI生命科学的新时代

    仅根据其氨基酸序列预测蛋白质的3D 结构,50 多年来一直是一个重要的开放研究问题。尽管最近取得了进展,但现有方法仍远未达到原子精度,尤其是当没有可用的同源结构时。

    92530发布于 2021-07-28
领券