站内搜索 SEARCH
热门文章 TOP
 11种女性易怀上畸形儿
 《泡沫之夏》开机 何润东大S
 黄色食物:女性荷尔蒙原动力
 单身女人买房情结
 历代流传的天然丰胸食谱
 组图:“时装精”六法则把秀
 女性痛经厉害或是这些病的征
 女人 何时才能“下斑”
 春天来时尝春饺
 人大代表提倡环保 鼓励发展
您的位置:主页 > 新鲜资讯 > 衣食住行 >
    衣食住行

当今大学生的关键词
时间:2009-10-19 18:15  来源:未知   作者:祝你幸福   点击:

_史蒂夫·洛尔(Steve Lohr)  _沈彦俊    译自_《纽约时报》

我们正飞速迈入

一切都将被监控和测算的时代

但最大的问题在于人们是否有能力

利用、分析数据

并让数据有实际意义。

 

 

哈佛大学的Carrie Grimes小姐主修的专业是人类学和考古学,她去过很多地方。在洪都拉斯,她通过绘制古文物发现地的地图来学习玛雅人的居住模式。然而她要面对的都是计算机和数学的内容,这是工作的一部分。

她表示:人们认为野外考古学就和《夺宝奇兵》一样,可事实并非如此,我们所做的很多工作都是进行数据分析。

现在Grimes小姐在从事一项截然不同的挖掘工作。她目前就职于谷歌公司,通过对信息模块的数据分析,想方设法改进谷歌的搜索引擎。

互联网时代的统计师颠覆了该领域原本死板木讷的形象,Grimes正是其中一员。他们发现自己正逐渐成为抢手货甚至是稀缺人才。

我敢说在未来10年里,统计师会是最性感的工作,谷歌公司首席经济师Hal Varian表示。这可不是玩笑。

如果一位统计 师获得博士学位后进入顶尖的公司工作,那他第一年就能挣到12.5万美元,正是近年来电子数据量的飙升引发了对数据分析师需求的剧增。计算机和网络为各个行业的数据探索打开了新的篇章传感信号,监控录像,社交网络交谈,公共活动记录等等。根据调查公司 IDC的调查反馈显示,今后电子数据量的增长势必会加快,到2012年将达到现在的5倍之多。

然而数据本身只是信息的原材料。我们正飞速迈入一切都将被监控和测算的时代,麻省理工学院电子商务中心的经济师兼主任 Erik Brynjolfsson表示,但最大的问题在于人们是否有能力利用、分析数据,并让数据有实际意义。

新一代的统计师让这一问题迎刃而解。他们利用强大的计算机和复杂的数学模型在数据海洋中探寻有意义的模式和内容。

近期落下帷幕的 Netflix竞赛(任何能让公司电影推荐系统得到显著改善的人都将获得10亿美元)便是一场武装了现代数据的战斗。

尽管统计师身处战场的前沿,但在拥有大批现代数据技术专家的军队中,他们只是小角色。专家表示,计算机和数学技能远比学位管用。新一代数据领域的福尔摩斯需要有经济、计算机科学和数学等多重背景。

近年来,这些人才理所当然深受白宫的青睐。白宫管理及预算办公室主任彼得·奥斯泽格在五月的一次发言中表示:客观、有力的数据是制定长期经济需求及关键政策的首要步骤。他在博客中承认关于数据重要性的言论是发自内心的

IBM公司发现在数据搜寻服务中暗藏机遇,四月他们创建了商业分析和优化服务小组。该小组将在他们的调查实验室中觅入超过200名数学家、统计师和其他数据分析师相对于IBM计划在整个公司中留用或新招超过4000分析师来说,200名这个数字并不够。

从其他方面也能看出人们对该领域的兴趣正日益浓厚。据美国数据协会表示,本周在华盛顿举行的数据专家年度大会上预计出席人数将达6,400人,超过了往年的5,400人。

32岁的Grimes2003年获得斯坦福大学的统计学博士学位后进入谷歌公司工作,现在她是250名数据分析师小组中的一员,她利用数据建模来改进公司的搜索技术。

举例来说,谷歌的搜索器软件不断更新网络的搜索索引,而 Grimes的工作就是对该软件的算法进行微调,以增加捕捉到频繁更新的网页的机会,并减少对静态网页的访问过程。

Grimes解释说,对计算机和网络使用的效率有细微的提高就已完成目标。即使是百分之一或二的改善就很不错了,因为同样的事情你操作100万次,在谷歌的我们就要做上10亿次。

网络巨大的数据量为调查发现开辟了一片新天地。从传统角度来看,社会科学通过访问或调查来获取人们的行为活动。但网络提供了令人惊叹的大量资源,让我们能观察100亿人是如何互动的。康奈尔大学的计算机科学家和社会交际网调查员 Jon Kleinberg表示。

例如,在刚发布的一项调查研究中,Kleinberg和两位大学生通过网际空间中信息流进行跟踪分析。在2008年总统大选期间,他们利用搜寻与亲吻了一头猪主题相关的短语这一算法,捕捉到了16亿新建的网站和博客。

康奈尔大学的调查人员发现,通常传统媒体发布信息后,博客跟进的时间一般为2.5小时。然而有一些博客会迅速捕捉并引用媒体新发布的信息,这样就能获取广泛的关注度。

专家警告称,网络数据数量巨大也有其弊端。庞大的数据量很容易让人们遗失真正的数据模型。统计学家也告诫说,数据间有密切联系,并不足以证明两者有因果关系。

例如,乔治华盛顿大学历史学家和数据学家 David Alan Grier 表示,在19世纪40年代后期脑炎疫苗出现之前,美国的公共卫生专家注意到,脑炎病例出现,同冰激凌和软饮料的消耗成正比。事实上,在炎热的夏天,脑炎爆发很正常,而人们食用更多的冰激凌也理所当然,这只能说明两者在数据上有关联。

如果数据量的剧增能对统计学中长期遗留的问题进行放大,那同样就能开辟出一片新的前沿阵地。

    IBM调查员Daniel Gruhl最近从事的工作,包括缩小医疗数据量以改进医疗质量,他表示:计算机需要处理大量的数据元,这些数据元在数学上十分独特,关键是要让电脑做适合的工作。


 
关于我们 - 合作伙伴 - 联系我们 - 网上订购祝你幸福网: 广告营销 0531-82027197 商务合作 0531-82027197
祝你幸福杂志社 版权所有 znxf.com All Rights Reserved ┊ 鲁ICP备05023155号 ┊ 设计支持:WOTOON DESIGN