为什么以及如何建立一个启动 – 第6章:未来

编者注:以下是“新王子”一书的第6章,这是一篇关于违反直觉价格的论文集,翻译和风险投资公司Pi Campus的创始人Marco Trombetti通过建立和投资初创公司来学习。我们同意作者通过客串文章发表所有12章。在这里查看上一章。

未来

您可以通过识别,冲浪和预测不断增长的宏观趋势来增加成功的机会。识别这种趋势的简单方法是生活在未来。还没有时间机器:为了试验未来,你必须生活在大多数其他人认为是未来的环境中。一个研究实验室,一个创新型公司和一群对技术有着强烈共同兴趣的朋友就是很好的例子。

了解宏观趋势很重要,我可以在这里分享一个关于这个主题的简短个人经验。

人工智能是令人着迷和可怕的。人类语言和翻译尤其可能是机器面临的最困难的挑战。自然语言是一种非常压缩的信息渠道,其中含有丰富的意义,它需要超出单词本身的上下文信息才能被理解。

语言是机器面临的最大挑战,因为它是最人性化的东西。

因此,自动翻译系统进展缓慢;尽管如此,他们无可否认地在进步。

在Translated,我共同创立的翻译服务,我们在过去17年中应用了人工智能,以帮助专业翻译人员更好,更快地翻译。我们试图在人与机器之间建立共生关系。我们已经在很多方面做到了这一点,但一个非常重要的方法是为翻译人员提供每个句子的建议(翻译前)。我们为专业语言学家开发了一种翻译工具,它将网上提供的所有专业翻译材料与人工智能相结合,可以预测前所未有的句子。这是我们的开源产品MateCat的基础。

其他人尝试了更具破坏性的方法,用端到端翻译技术取代专业翻译人员。最引人注目的例子是谷歌翻译。

通过帮助专业翻译人员,我们能够利用一个独特的机会,即在多年的时间内衡量人工智能的进展。

我们已经衡量了专业翻译人员纠正AI提供的建议的程度,我们已经逐日,逐月,逐年完成了这些建议。

早在2003年,在欧洲委员会的宝贵财政支持下,我们进行了一项研究项目,我们翻译了数十万字,我们发现整体修正率(编辑后的努力1)为英语>意大利语和英语>法语大概是43%。 2015年,相同语言组合的修正率为27%。第二次我们使用了MateCat翻译的5000万字的样本。由于神经机器翻译和MMT(一种能够适应用户的系统)的应用,我们估计我们将在2018年达到22%至26%的校正率。

这种改进是不可阻挡和不变的,只有一些小的延迟和浪涌,因为一种技术达到其最大潜力而另一种技术正在引入。有两个主要变化:2006年投入使用的统计翻译,以及2016年底推出的深度学习。

如果我们继续这样的步伐,我们什么时候才能达到不再需要纠正机器翻译的程度?

如果我们只看这些数字,似乎这可能发生在2030年到2035年之间。

然而,还有一个有趣的事实,我们经常忘记:人类并不完美。

当我们分析由人类语言学家处理的逐字翻译建议(称为100%匹配)中的2000万个单词时,我们观察到来自其他人的建议的平均校正率为11%而不是0%。这是因为人为错误,也因为我们每个人都有一种我们想要推广的独特风格。当我们谈论奇点时,我们需要确保定义基准。它绝对完美吗?世界上最好的翻译?或者只是普通的专业翻译?

如果我们对能够比普通专业翻译人员翻译得更好的机器感到满意,那么2025可能是一个更合理的日期,我们将在这些语言组合中达到11%的修正率。在我看来,这是惊人的接近。

我一直想知道我现在是否应该出售Translated,因为专业翻译市场将大幅缩水,或者我是否应该试图克服变化以抓住更大的机会。最后,人们可能需要更多翻译,而不是更少。在从电影到数字的过渡期间,我感觉有点像柯达。

事实上,我已经意识到这一点,因此我已经决定我们会把它赶出去。

人工智能很可能在未来的每个部门中发挥关键作用。虽然语言是机器解决的最困难的事情,但很可能在许多其他领域中更早发生中断,这代表了创业思想的极好来源。

资讯来源:由0x资讯编译自EU-STARTUPS。版权归作者Marco Trombetti所有,未经许可,不得转载
提示:投资有风险,入市需谨慎,本资讯不作为投资理财建议。请理性投资,切实提高风险防范意识;如有发现的违法犯罪线索,可积极向有关部门举报反映。
你可能还喜欢