Post tagged: 机器学习

大数据的社会责任

大数据、机器学习、人工智能这些名词人们越来越耳熟能详,好像说这些就是现在和未来信息技术的发展趋势。确实,随着计算机计算和储存能力的提高,以往需要仔细考虑的计算资源分配问题变得不那么重要。例如,现在在资源充裕的情况下,我们通常动不动就上神经网络来解决,不是像以前那样仔细考虑,提取出数据的各种特征、开发对特定问题优化的算法,因为神经网络一般能自己归纳出合理的模型。然而,现在缺乏仔细讨论的不是用哪种方法处理数据,而是我们对待原始数据和处理结果的态度。

首先,原始数据的收集应该公开透明:数据的提供者,一般是用户,要有知情权。在各大网站上,基本都有「隐私政策」和「服务协议」页面,说明了其收集的用户数据及其用途。即使是这样,有的服务写的详细,并给出了停止收集一些数据的选项;有的服务措辞模糊,一开始就拿了许多权限,其用途无法解释,或者解释与实际行为不符。之前爆出的某些大厂的应用程序偷听或者偷拍用户,至少就没有做到数据收集的公开透明。我们暂时做善意的假定,这些收集的数据确实是「改善用户体验」。如果这些应用在申请权限之前有明确合理的解释,即使是像广告下面的小字,也可以算作是尊重了用户的知情权。后台收集数据的事情被发现后,这些大厂为了防止声誉受损,不对这些行为做出解释或道歉,只是重复「你怎么这样凭空污人清白」,就难免受到人们更多的质疑 …