第484章 完美数据
唐集中早在30岁的时候,就是个沉稳的老头儿了。
他眼睛里看着计算机系给杨锐出的数据,耳中听着许正平的询问,整个人平静的像是一只躺在冰块上的马鲛鱼似的——只有眼珠子清澈透明,以证明自己的新鲜程度。
许正平就没有如此平静了,即使唐集中不说话,他也小声评价了起来:“数据非常完美,如果画成曲线的话,基本没有异常点。”
他都不用现场画出曲线,就看数据,脑中即可模拟出相应的曲线,这大部分来自于经验。
唐集中也微微点头,道:“异常点非常少,而且均匀,几乎可以忽略。”
异常点顾名思义,就是有异于常的点。而它通常是借曲线表现出来的。
举例来说,“小明一个小时吃一个栗子”,将之画成曲线,如果横坐标是单位时间,纵坐标是被吃掉的栗子总数,那画出来的线,将会是一条标准的四十五度灰色向上的直线。灰色是铅笔的颜色。
但是,如果小明在某个小时吃掉了两个栗子,描述这个小时的点,将不会在其他点组成的线路上出现,它会比标准四十五度灰色向上的直线的位置高。
这条线就是异常点。
在科研上,出现异常点是再正常不过的事了,而且往往是研究的突破口。
比如说,“小明一个小时吃一个栗子”的曲线,大部分时间都是正常的,那异常点很可能代表着出现了异常情况,比如说,韩梅梅那天中午去找小明玩了,顺便吃掉了一个栗子——发现这个结果,就足够普通社会学家在国内期刊发表论文了。
如果韩梅梅那天中午去找小明玩了,小明没给韩梅梅栗子,而是拿两个栗子出去换了一个避孕套——发现这个结果,就足够普通经济学家在sci发表论文了。
当然,大部分的异常点是难以解释的,也许是仪器故障,也许是采样失败,也许是样品变质,也许是有人坐在拼命震动的仪器上来了一发。
总而言之,异常点是让科研者又恨又爱的事。
而完美曲线,则是令人惊疑不定的事。
因为有异常点反而是正常的,没有异常点,反而是非正常的。
越是复杂的情况,就越是如此。
毕竟,实验不可能完美的模拟真实。
“现在是什么情况?实验做出来了吗?”赵蕾举着话筒,开始采访起来。
“实验是完成了,数据还需要分析。”杨锐的表情也有些变化。
这样的数据,对他来说也是相当新鲜的。杨锐读研时用到的等离子表面共振,已然与pcr一样,是不值钱的大众技术了。
而它变成大众技术的原因,是生物技术公司对其进行了多重简化。如同汽车一样,生物技术公司将复杂的内核包裹在重重外壳之中,使得普通的生物技术人员,只需要在一头输入物料,在另一头获得结果就可以了。
用原始的部件拼接,并进行等离子表面共振的实验,对杨锐来说也是头一次。
所以,杨锐也不知道这种初级数据是正确的,还是错误的。
没有沮丧,也没有雀跃的场景让赵蕾觉得困惑,她将话筒转向许正平和唐集中,问道:“你们对实验的评价是什么?”
“我们不能评价实验,因为我们没有看到实验,我们现在看到的是实验结果。”唐集中纠正赵蕾。
“那你们对实验结果的评价是什么?”赵蕾笑着换了说辞,并面向许正平。
许正平是不会在采访中撒谎的,他想了一下,道:“是看起来很美观的数据。”
“很美观的数据?”赵蕾脑筋转了一下,追问道:“你认为数据正确吗?”
“我没有做过这个实验,不能说数据正确不正确。”许正平摇头,忍不住又加了一句:“但看起来是很完美。”
“不一定正确,但看起来很完美,是这个意思吗?”赵蕾将许正平的话重复了一遍,含义似乎明确了许多。
许正平装模作样的咳嗽了一声,道:“我也说不好。”
赵蕾觉得自己找到新闻点了,连忙问道:“您觉得数据可能会有什么问题?”
许正平状似不经意的扫了一下杨锐,发现他似乎并不在意自己和记者的谈话,有一瞬间,许正平突然有了诉说的冲动。好在他将之压制了下来,语气依旧缓和的道:“数据本身是没有好坏的,你不能说1比0长的苗条,1就是比0好的数据,关键在于数据是否能表现出实验想要的结果。”
这一个圈子绕的比较大,赵蕾稍微有些晕了,她想了一下,道:“您好像不太愿意聊数据的好坏,但是,现在实验刚刚完成,不正是最高兴的时候吗?你们似乎都没有显的高兴?”
“还有数据处理的步骤,这也是比较麻烦的一块。”唐集中将话给抢了过来。
赵蕾对这个年老成精的老头儿没什么兴趣,话筒一转,塞到杨锐嘴边,问道:“杨同学,你准备如何处理这些数据。”
“可能会聘请一个专业的数据团队吧。”杨锐的答案出乎几个人的意料。
赵蕾瞪大眼睛,问:“你不自己处理?”
“这么多数据,我自己处理太浪费时间了,我是做生物的,又不是玩数字的。”杨锐摇头,道:“对于专业的数据处理团队来说,处理这样的数据用不了多长时间,我们自己来做,就是纯粹的浪费时间了。”
实际上,杨锐也不会处理这种级别的数据,别看就几页纸,算起来是要人命的。
杨锐做研究生的时候,这样的东西要么用计算机上既有的软件来处理,要么就是打包交给数据公司来折腾。
当然,数据公司的要价会高一些,但专业的计算机软件也不便宜,这也是高级实验室和低级实验室的区别。
高级实验室样样都找好的,低级实验室样样都要自己完成。
赵蕾征询似的望向唐集中和许正平,问:“这样也可以?”
许正平没吭声,唐集中迟疑了一下,道:“国外的研究团队里,经常会有专门处理数据的成员或团队,咱们国内还比较少这样的合作。”
“也就是说,杨锐采取的方法,也是比较特殊的?”
“无所谓特殊不特殊,能够得到结果的方法就是好方法。”杨锐说完道:“赵记者,咱们今天的采访就到这里怎么样?我们又得忙起来了。”
“您忙您的,我尽量不打扰。”赵蕾觉得有新闻,退到后面,怎么都不愿意走。
刘院长呵呵的打着圆场,道:“小杨,你忙你的,别管我们了。北京电视台很厉害的,你以后要申请国家级基金,有名气总比没名气好不是?”
所谓影响力就是这个了,中国媒体的影响力,在**十年代最为兴盛,尤其是官媒的强悍,完全无愧于无冕之王的称呼。
在这个时间,拿着一张媒体证的记者,行走于中国大地,工作证可以当做饭票来用。以后甚至还会出现一名编制内的记者,带着几十名编制外的假记者行走江湖,坑蒙拐骗的故事。
电视台是社会影响力最高的记者,哪怕仅仅是北京台,因为其所处的地域特殊,也让北大不可忽视。他们虽然不能决定国家级基金的归属,捣乱总是有效果的。
杨锐也不能执意赶走对方,点了点头,默默的回去整理资料了。
半个小时后,杨锐开始一通通的拨打越洋电话。
参加一次国际会议的好处,就是能够得到许多国内外同行的通讯方式,再次联系,帮个小忙,或者谈论合作,至少能解决初始的信任问题。
杨锐也不知道国外的生物产业发展到了哪个地步,不过,就资本主义的德性,只要给钱,不会找不到干活的人。
唐集中看的一阵阵肉疼。
国际电话费的昂贵,从来都不是正常人能承受的,80年代的越洋电话就更可怕了,动辄每分钟十几元几十元钱,杨锐虽然有足够的经费,可这样挥霍,还是国内研究员无法适应的。
总算是没人打断杨锐。
赵蕾则是听的眉飞色舞,她是从美国留学回来的人,听着杨锐用不地道但很溜的英文,联系各色人等
他眼睛里看着计算机系给杨锐出的数据,耳中听着许正平的询问,整个人平静的像是一只躺在冰块上的马鲛鱼似的——只有眼珠子清澈透明,以证明自己的新鲜程度。
许正平就没有如此平静了,即使唐集中不说话,他也小声评价了起来:“数据非常完美,如果画成曲线的话,基本没有异常点。”
他都不用现场画出曲线,就看数据,脑中即可模拟出相应的曲线,这大部分来自于经验。
唐集中也微微点头,道:“异常点非常少,而且均匀,几乎可以忽略。”
异常点顾名思义,就是有异于常的点。而它通常是借曲线表现出来的。
举例来说,“小明一个小时吃一个栗子”,将之画成曲线,如果横坐标是单位时间,纵坐标是被吃掉的栗子总数,那画出来的线,将会是一条标准的四十五度灰色向上的直线。灰色是铅笔的颜色。
但是,如果小明在某个小时吃掉了两个栗子,描述这个小时的点,将不会在其他点组成的线路上出现,它会比标准四十五度灰色向上的直线的位置高。
这条线就是异常点。
在科研上,出现异常点是再正常不过的事了,而且往往是研究的突破口。
比如说,“小明一个小时吃一个栗子”的曲线,大部分时间都是正常的,那异常点很可能代表着出现了异常情况,比如说,韩梅梅那天中午去找小明玩了,顺便吃掉了一个栗子——发现这个结果,就足够普通社会学家在国内期刊发表论文了。
如果韩梅梅那天中午去找小明玩了,小明没给韩梅梅栗子,而是拿两个栗子出去换了一个避孕套——发现这个结果,就足够普通经济学家在sci发表论文了。
当然,大部分的异常点是难以解释的,也许是仪器故障,也许是采样失败,也许是样品变质,也许是有人坐在拼命震动的仪器上来了一发。
总而言之,异常点是让科研者又恨又爱的事。
而完美曲线,则是令人惊疑不定的事。
因为有异常点反而是正常的,没有异常点,反而是非正常的。
越是复杂的情况,就越是如此。
毕竟,实验不可能完美的模拟真实。
“现在是什么情况?实验做出来了吗?”赵蕾举着话筒,开始采访起来。
“实验是完成了,数据还需要分析。”杨锐的表情也有些变化。
这样的数据,对他来说也是相当新鲜的。杨锐读研时用到的等离子表面共振,已然与pcr一样,是不值钱的大众技术了。
而它变成大众技术的原因,是生物技术公司对其进行了多重简化。如同汽车一样,生物技术公司将复杂的内核包裹在重重外壳之中,使得普通的生物技术人员,只需要在一头输入物料,在另一头获得结果就可以了。
用原始的部件拼接,并进行等离子表面共振的实验,对杨锐来说也是头一次。
所以,杨锐也不知道这种初级数据是正确的,还是错误的。
没有沮丧,也没有雀跃的场景让赵蕾觉得困惑,她将话筒转向许正平和唐集中,问道:“你们对实验的评价是什么?”
“我们不能评价实验,因为我们没有看到实验,我们现在看到的是实验结果。”唐集中纠正赵蕾。
“那你们对实验结果的评价是什么?”赵蕾笑着换了说辞,并面向许正平。
许正平是不会在采访中撒谎的,他想了一下,道:“是看起来很美观的数据。”
“很美观的数据?”赵蕾脑筋转了一下,追问道:“你认为数据正确吗?”
“我没有做过这个实验,不能说数据正确不正确。”许正平摇头,忍不住又加了一句:“但看起来是很完美。”
“不一定正确,但看起来很完美,是这个意思吗?”赵蕾将许正平的话重复了一遍,含义似乎明确了许多。
许正平装模作样的咳嗽了一声,道:“我也说不好。”
赵蕾觉得自己找到新闻点了,连忙问道:“您觉得数据可能会有什么问题?”
许正平状似不经意的扫了一下杨锐,发现他似乎并不在意自己和记者的谈话,有一瞬间,许正平突然有了诉说的冲动。好在他将之压制了下来,语气依旧缓和的道:“数据本身是没有好坏的,你不能说1比0长的苗条,1就是比0好的数据,关键在于数据是否能表现出实验想要的结果。”
这一个圈子绕的比较大,赵蕾稍微有些晕了,她想了一下,道:“您好像不太愿意聊数据的好坏,但是,现在实验刚刚完成,不正是最高兴的时候吗?你们似乎都没有显的高兴?”
“还有数据处理的步骤,这也是比较麻烦的一块。”唐集中将话给抢了过来。
赵蕾对这个年老成精的老头儿没什么兴趣,话筒一转,塞到杨锐嘴边,问道:“杨同学,你准备如何处理这些数据。”
“可能会聘请一个专业的数据团队吧。”杨锐的答案出乎几个人的意料。
赵蕾瞪大眼睛,问:“你不自己处理?”
“这么多数据,我自己处理太浪费时间了,我是做生物的,又不是玩数字的。”杨锐摇头,道:“对于专业的数据处理团队来说,处理这样的数据用不了多长时间,我们自己来做,就是纯粹的浪费时间了。”
实际上,杨锐也不会处理这种级别的数据,别看就几页纸,算起来是要人命的。
杨锐做研究生的时候,这样的东西要么用计算机上既有的软件来处理,要么就是打包交给数据公司来折腾。
当然,数据公司的要价会高一些,但专业的计算机软件也不便宜,这也是高级实验室和低级实验室的区别。
高级实验室样样都找好的,低级实验室样样都要自己完成。
赵蕾征询似的望向唐集中和许正平,问:“这样也可以?”
许正平没吭声,唐集中迟疑了一下,道:“国外的研究团队里,经常会有专门处理数据的成员或团队,咱们国内还比较少这样的合作。”
“也就是说,杨锐采取的方法,也是比较特殊的?”
“无所谓特殊不特殊,能够得到结果的方法就是好方法。”杨锐说完道:“赵记者,咱们今天的采访就到这里怎么样?我们又得忙起来了。”
“您忙您的,我尽量不打扰。”赵蕾觉得有新闻,退到后面,怎么都不愿意走。
刘院长呵呵的打着圆场,道:“小杨,你忙你的,别管我们了。北京电视台很厉害的,你以后要申请国家级基金,有名气总比没名气好不是?”
所谓影响力就是这个了,中国媒体的影响力,在**十年代最为兴盛,尤其是官媒的强悍,完全无愧于无冕之王的称呼。
在这个时间,拿着一张媒体证的记者,行走于中国大地,工作证可以当做饭票来用。以后甚至还会出现一名编制内的记者,带着几十名编制外的假记者行走江湖,坑蒙拐骗的故事。
电视台是社会影响力最高的记者,哪怕仅仅是北京台,因为其所处的地域特殊,也让北大不可忽视。他们虽然不能决定国家级基金的归属,捣乱总是有效果的。
杨锐也不能执意赶走对方,点了点头,默默的回去整理资料了。
半个小时后,杨锐开始一通通的拨打越洋电话。
参加一次国际会议的好处,就是能够得到许多国内外同行的通讯方式,再次联系,帮个小忙,或者谈论合作,至少能解决初始的信任问题。
杨锐也不知道国外的生物产业发展到了哪个地步,不过,就资本主义的德性,只要给钱,不会找不到干活的人。
唐集中看的一阵阵肉疼。
国际电话费的昂贵,从来都不是正常人能承受的,80年代的越洋电话就更可怕了,动辄每分钟十几元几十元钱,杨锐虽然有足够的经费,可这样挥霍,还是国内研究员无法适应的。
总算是没人打断杨锐。
赵蕾则是听的眉飞色舞,她是从美国留学回来的人,听着杨锐用不地道但很溜的英文,联系各色人等