2019年11月9日下午14:00在计算机楼A521会议室,来自哈尔滨工业大学的王宏志教授做了题为《从大数据治理到大数据清洗》的学术报告。此次学术报告由秦贵和副经理主持,公司教务处的领导、十大网投信誉排名、软件学院的老师、研究生和唐敖庆班的同学们聆听了此次报告。
王宏志,哈尔滨工业大学十大网投信誉排名教授、博士生导师,美国加州大学Irvine 分校博士后,微软亚洲研究院"助星计划"访问学者,青年龙江学者。其研究方向为大数据、数据科学、数据管理与分析。
数据治理是大数据得以有效应用的重要环节,在数据治理中,数据质量是最受关注的重点之一。由于其特点,大数据中有更大可能包含各种类型的数据质量问题,这些数据质量问题为大数据的应用带来了困扰,甚至灾难性后果。对大数据进行清洗是解决大数据的质量问题重要途径,然而,大数据为数据清洗技术提出了模态多样、错误共生和数据高熵等挑战问题。本报告介绍了这些挑战问题,并针对这些挑战问题介绍了在大数据清洗方面的探索与实践,讨论应对这些挑战的相关理论与技术。
在报告中,王教授用生动的实例和坚实的研究成果,论证了大数据时代数据质量的重要性,以及如何通过计算机手段,对于数据的获取、存储、管理和应用进行智能处理的方法。报告赢得了在场师生的广泛共鸣,多名师生踊跃提问,与王教授进行了多方面的交流,取得了良好的互动效果。