5月9日下午,電氣信息學院在管理學院報告廳舉辦了《大數據技術與應用》專題學術講座,邀請吉林建筑大學計算機系主任徐勇教授主講。電氣信息學院計算機教研室和信息安全教研室全體師生參加了講座。講座由電氣信息學院副院長劉舒婷主持。
徐勇教授把本次講座分成四個模塊,從大數據的來源、什么是大數據、大數據的應用及Hadoop介紹四個方面為師生們進行了講解。首先講述了大數據的歷史、來源,早在1980年,著名未來學家托夫勒在其所著的《第三次浪潮》中提出“大數據”這個概念,《自然》雜志在2008年9月推出了名為“大數據”的封面專欄。徐勇教授特別指出,從2009年開始“大數據”成為互聯網技術行業中的熱門詞匯,尤其是針對“大數據”的特點,由維克托·邁爾-舍恩伯格和肯尼斯·庫克耶在《“大數據”時代》中提出了“大數據”的四個典型特征:一是數據體量巨大(Volume);二是數據類型繁多(Variety);三是價值密度低(Value);四是處理速度快(Velocity)。這便是“大數據”著名的4V特點。
接下來,徐勇教授還突出強調了大數據在現代社會的應用,他列出社交軟件、商務軟件、門戶網站等我們現在常用的互聯網軟件,表明現在的互聯網公司都是大數據公司。他還生動的舉例了身邊的例子,如尿不濕與啤酒,這兩個看來是互不相干的商品,但是如果出現很多父親為小孩買尿不濕順便再買啤酒的信息反饋時,這兩個商品就會在超市里被擺放的比較近一些,它們之間就產生了商業關聯。這些生動的生活事例,展示出目前大數據在身邊現實生活中的廣泛用途,徐勇教授繼而談出了現在大數據所具有的商業價值。此外,徐勇教授對Hadoop大數據處理軟件進行了介紹,并講述了Hadoop的功能與用法。
徐勇教授的專題講座,話題新穎活潑,語言幽默風趣,使師生們受到了啟發,開拓了視野。在問答環節,師生們踴躍提問,各抒己見,徐教授也一一作出解答。同學們體會說,徐教授的專題講座留給我們許多需要深入思考的問題,比如現在一些大企業的數據量已經接近EB量級,而且數據類型的多樣性也對數據的處理能力提出更高要求;還有數據價值密度的高低與數據總量的大小成反比,如一小時的視頻,其中有用數據可能僅有一二秒,如何通過強大的機器算法更迅速完成數據的價值“提純”,這些都是目前大數據背景下亟待解決的難題。當然,這些問題也提高了我們進一步學習的興趣。我們一定會牢記徐教授對大家的寄語,即期望年輕一代在大數據時代下要有全新的思維方式,要有“開放性”、“深刻性”與“創新性”的品行。(電氣信息學院供稿)