第212章 臥槽, 赵神来了! 开局一个属性面板,肝成无双国士
顾明教授听到这话,自然是欣喜万分,毫不犹豫地答应下来。
“求之不得啊!你这脑子要是能继续放在咱们课题组里,那绝对是大杀器。”
顾明教授大笑起来,隨后招了招手,“既然你打算回来,那正好,咱们去会议室。我正因为最近的一个项目头疼呢,咱们开个短暂的组会,顺便给你同步一下进度。”
顾青和另外两个学长也放下手里的活,跟著一起走进了旁边的小会议室。
大家围坐在会议桌旁,顾青坐在赵阳的斜对面,拿出了工作笔记。
顾明教授將手里的文献放在桌上,表情变得严谨起来,进入了工作状態。
“赵阳,既然你回来了,我也就不藏著掖著了。咱们实验室最近接了一个国家自然科学基金的面上项目。”
顾明教授打开会议室的投影仪,连接上自己的笔记本电脑。
幕布上出现了一张复杂的基因表达调控网络图。
“这个项目是关於某种特定农作物在重度乾旱胁迫下的耐旱机制研究。”
顾明教授指著图上的节点说道。
“我们前期的思路很明確。通过提取乾旱处理组和正常对照组的作物叶片rna,进行高通量的转录组测序(rna-seq)。试图找出那些在乾旱条件下显著上调錶达的耐旱关键基因。”
“目前的难点在哪里?”赵阳看著幕布上的图,直接问道。
既然是测序,那就有现成的数据。有了数据,对於他来说就好办。
顾明教授嘆了口气,有些无奈地说道:“难点在於数据量太大,而且噪音极其严重。”
“测序公司把数据发回来了,足足有几个tb的原始测序序列(reads)。我们虽然也懂一些基础的生物信息学分析,会用现成的商业软体去比对参考基因组,计算表达量。但是……”
顾明教授敲了敲桌子:“但是我们发现,这次测序得到的数据里,存在大量的假阳性差异表达基因。因为这种作物本身的基因组非常庞大且复杂,含有大量的重复序列。
常规的软体比对下来,找出了几万个差异基因,根本没办法进行下游的验证实验。我们不知道到底哪个才是真正起核心调控作用的主开关基因。”
旁边戴眼镜的学长也苦著脸补充道:“是啊赵神。我们这一个多礼拜,天天盯著那些火山图和热图看,眼睛都快瞎了。找出来的几个候选基因,做实时萤光定量pcr验证的时候,全都不符合预期。现在整个项目卡在数据分析这一步,没法往下推了。”
赵阳听完,大概思索了一下。
很快,他就大概明白了顾明教授他们的困境。
生物学家擅长设计实验、提取样本和操作验证,但面对海量的高维度测序数据时,如果仅仅依赖市面上那些打包好的商业软体或者开源的流程脚本,很容易陷入数据的泥潭。
因为那些现成的软体都是基於通用的统计模型,无法针对特定的复杂基因组进行算法上的底层优化。
“所以,你们现在需要一种更精確的算法,从这几万个假阳性的噪音中,把真正具有生物学意义的核心节点给挖出来,对吗?”
赵阳看著顾明教授问道。
“没错。”
顾明教授点了点头。
“但咱们实验室没有专业的生信分析大牛。原本指望这几个研究生慢慢筛,但进度实在太慢了。”