利用我们的数据遗产

作者:Tshilidzi Marwala

二十二年前,当我在剑桥大学担任人工智能(AI)博士生时,我不得不创建所需的所有AI算法来理解与该领域相关的复杂现象。 AI是一种执行通常需要人类的智能任务的计算机软件。

算法是指示计算机执行特定任务的一组规则。在那个时代,创建AI算法的能力比获取和使用数据的能力更重要。 Google公司创建了一个名为TensorFlow的开源库,其中包含所有开发的AI算法。

通过这种方式,谷歌希望人们使用他们的软件开发应用程序(应用程序),谷歌的回报是,它将使用TensorFlow开发的应用程序收集任何个人的数据。今天,AI算法不是竞争优势,而是数据。世界经济论坛称数据为新的“氧气”,而中国人工智能专家李开复则将数据称为新的“石油”。

非洲大陆的人口增长速度超过世界上任何一个地区。非洲人口为13亿,名义国内生产总值(GDP)为2.3万亿美元。人口的增加实际上是数据的增加,如果数据是新的石油,则类似于石油储备的增加。

即使是像沙特阿拉伯这样的石油资源丰富的国家也没有增加石油储备。作为非洲人,我们如何利用这些庞大的数据?非洲有两类数据,其中包括遗产和个人数据。遗产数据存在于社会中,而个人数据存在于个人中。遗产数据包括从我们的语言,情感和口音收集的数据。个人数据包括健康,面部和指纹数据。

Facebook,亚马逊,苹果,Netflix和谷歌都是数据公司。他们将数据交易给广告商,银行,政党等。例如,有争议的剑桥分析公司收集了Facebook数据,以影响总统大选,这可能有助于唐纳德特朗普在美国大选中获胜。 Google公司收集语言数据以构建一个名为Google Translate的应用程序,该应用程序可以从一种语言翻译成另一种语言。

本申请要求涵盖非洲语言,如祖鲁语,约鲁巴语和斯瓦希里语。与处理欧洲和亚洲语言相比,谷歌翻译在处理非洲语言方面效果较差。现在,我们如何利用语言传统创造经济价值?我们需要构建自己的语言数据库并创建我们自己的Google Translate版本。

一个重要的领域是非洲情感数据库的创建。不同文化的情感不同。这些情绪在汽车和飞机的安全等方面非常重要。如果我们能够构建一个能够读取飞行员情绪的系统,我们就能够确定飞行员是否处于良好的心态来操作飞机,这可以提高安全性。

为了利用非洲情感数据库,我们应该创建一个数据库,捕捉非洲大陆各地的非洲人的情绪,然后利用这个数据库创建我们可以用来阅读人们情感的AI应用程序。梅赛德斯 – 奔驰已经实施了“注意力辅助”,提醒驾驶员疲劳。

另一个重要领域是建立非洲卫生数据库。 AI算法能够比人类医生更好地诊断疾病。但是,这些AI算法取决于数据的可用性。为了利用这个机会,我们需要创建一个收集此类数据的程序,并使用它来构建能够增加医疗保健的算法。

一些最新的技术发展是智能个人助理。这些设备可以接收语音指令。谷歌开发了Google智能助理,亚马逊Alexa,Apple Siri和IBM Watson。这些设备非常有效,但它们不能很好地处理非洲口音。

我们可以通过包含情绪检测算法来增强这些设备,并使它们对不同的重音不太敏感,尤其是丰富多样的非洲口音语料库。为了让我们充分利用我们的口音遗产,我们需要创建我们自己的非洲口音数据库,并使用它来建立能够理解非洲语言的智能个人助理。

面部识别算法不适用于非洲人的面孔。这是因为非洲面孔图书馆的局限性。第二个原因是非洲面孔的次优数据收集,不同于亚洲和欧洲的面孔。

第三个原因是我们没有从非洲角度设计人工智能算法用于人脸识别。 Facebook等公司正在收集拥有Facebook账户的非洲人的大量数据。

但是,我们应该考虑如何创建面部数据库。内政部(DHA)可以使用该数据库来提高我们国家的入境点的安全性。目前,对于智能身份(ID)卡,DHA仅对面部正面进行成像。

对于面部数据库,侧面也需要成像。在某种程度上,Facebook正在我们的帮助下构建这个,因为我们上传了我们的图像。这些图像也表达了情感,这有助于构建数据库的另一个方面。

因此,有如此多的遗产和个人数据,我们可以收集和货币化,以获得经济价值。其中一些数据包括眼睛虹膜和指纹的图片,这些图片对于构建生物识别安全系统非常有价值。但是,为了让我们做好准备,我们需要开发一套技能来有效地收集和分析这些数据。

这些技能是数据分析和AI算法技能。要使用这些开源AI算法,需要对编程有所了解。数据分析技能应超越我们在大学中经常发现的基本统计价格,并且必须包括高级主题,如信号处理以及处理不完整和不完善数据集的能力。

那么我们如何提高收集和分析数据的能力呢?首先,在全国范围内,我们应该引入收集这些数据的数据库。但是,我们应该以保护数据安全和隐私的方式执行此操作。

实现这一目标的一种方法是扩大南非统计局(Stats SA)等组织的任务范围,包括收集个人和遗产数据,以及收集和分析经济数据和进行全国人口普查。

南非发展共同体等区域组织必须建立区域数据库,以收集和货币化区域数据。在大陆一级,非洲联盟(非盟)应建立大陆数据库,以巩固和货币化大陆数据库。

例如,AU的“非洲联盟护照”方法就出现了新的机会。在创建这样的数据库时,我们应该记住,任何给定的数据库通常都是不完整和不完善的。

我们应该使数据收集组织能够分析不完整和不完善的数据。如果我们能够探索13亿非洲人民的巨大遗产和个人数据,那么我们就可以创造出第四次工业革命的“沙特阿拉伯”(石油)。个人数据的收集存在伦理影响,我们应该将其考虑在内。

Tshilidzi Marwala教授是约翰内斯堡大学的副校长和校长。他对南非第四次工业革命总统委员会的总统西里尔·拉马弗萨说。

本文与4IRSA合作出版。

资讯来源:由0x资讯编译自MYBROADBAND,版权归作者所有,未经许可,不得转载
提示:投资有风险,入市需谨慎,本资讯不作为投资理财建议。请理性投资,切实提高风险防范意识;如有发现的违法犯罪线索,可积极向有关部门举报反映。
你可能还喜欢