第212章臥槽，赵神来了！_开局一个属性面板，肝成无双国士

最新网址：m.92yanqing.com

顾明教授听到这话，自然是欣喜万分，毫不犹豫地答应下来。

“求之不得啊！你这脑子要是能继续放在咱们课题组里，那绝对是大杀器。”

顾明教授大笑起来，隨后招了招手，“既然你打算回来，那正好，咱们去会议室。我正因为最近的一个项目头疼呢，咱们开个短暂的组会，顺便给你同步一下进度。”

顾青和另外两个学长也放下手里的活，跟著一起走进了旁边的小会议室。

大家围坐在会议桌旁，顾青坐在赵阳的斜对面，拿出了工作笔记。

顾明教授將手里的文献放在桌上，表情变得严谨起来，进入了工作状態。

“赵阳，既然你回来了，我也就不藏著掖著了。咱们实验室最近接了一个国家自然科学基金的面上项目。”

顾明教授打开会议室的投影仪，连接上自己的笔记本电脑。

幕布上出现了一张复杂的基因表达调控网络图。

“这个项目是关於某种特定农作物在重度乾旱胁迫下的耐旱机制研究。”

顾明教授指著图上的节点说道。

“我们前期的思路很明確。通过提取乾旱处理组和正常对照组的作物叶片rna，进行高通量的转录组测序（rna-seq）。试图找出那些在乾旱条件下显著上调錶达的耐旱关键基因。”

“目前的难点在哪里？”赵阳看著幕布上的图，直接问道。

既然是测序，那就有现成的数据。有了数据，对於他来说就好办。

顾明教授嘆了口气，有些无奈地说道：“难点在於数据量太大，而且噪音极其严重。”

“测序公司把数据发回来了，足足有几个tb的原始测序序列（reads）。我们虽然也懂一些基础的生物信息学分析，会用现成的商业软体去比对参考基因组，计算表达量。但是……”

顾明教授敲了敲桌子：“但是我们发现，这次测序得到的数据里，存在大量的假阳性差异表达基因。因为这种作物本身的基因组非常庞大且复杂，含有大量的重复序列。

常规的软体比对下来，找出了几万个差异基因，根本没办法进行下游的验证实验。我们不知道到底哪个才是真正起核心调控作用的主开关基因。”

旁边戴眼镜的学长也苦著脸补充道：“是啊赵神。我们这一个多礼拜，天天盯著那些火山图和热图看，眼睛都快瞎了。找出来的几个候选基因，做实时萤光定量pcr验证的时候，全都不符合预期。现在整个项目卡在数据分析这一步，没法往下推了。”

赵阳听完，大概思索了一下。

很快，他就大概明白了顾明教授他们的困境。

生物学家擅长设计实验、提取样本和操作验证，但面对海量的高维度测序数据时，如果仅仅依赖市面上那些打包好的商业软体或者开源的流程脚本，很容易陷入数据的泥潭。

因为那些现成的软体都是基於通用的统计模型，无法针对特定的复杂基因组进行算法上的底层优化。

“所以，你们现在需要一种更精確的算法，从这几万个假阳性的噪音中，把真正具有生物学意义的核心节点给挖出来，对吗？”

赵阳看著顾明教授问道。

“没错。”

顾明教授点了点头。

“但咱们实验室没有专业的生信分析大牛。原本指望这几个研究生慢慢筛，但进度实在太慢了。”