神话与现实:总拥有成本

时间:2019-04-11 21:40:30 阅读:14次

  当我向公司展示我们的软件解决方案(基于使用丰富而庞大的语义网络的语义技术)时,我发现自己面对的是一个清楚了解这种方法优势的受众。然而,他们提出的一系列担忧和疑虑常常会影响决策过程,导致对实际投资回报的错误评估。

  无论是由IT经理,知识管理工作者还是软件开发人员提出,问题分为两类:第一类是与语义网络的设置和维护相关的成本,第二类是与所需基础架构相关的成本保持能够满足运营的绩效水平。

  这些担忧背后有很多原因,但有两个因素似乎很突出。一方面,基于关键字技术的系统制造商进行了极好的(通常是不正确的)通信活动。他们几乎成功地说服了市场,信息管理这样的复杂问题可以通过自动快捷方式解决,任何其他替代方案都是无法承受的。另一方面,该领域的大多数研究人员仍然对完全语义化的系统持怀疑态度。这主要是由于他们无法(至少到目前为止)开发软件,可以将增加文本理解和性能的优点结合起来,以满足现实世界的需求(从而进一步加强竞争的地位。)

  在过去十年中,使用我们的语义技术开发了许多成功的项目。因此,我认为使用我们日常经验中的真实数据来帮助消除经常导致人们做出不合理决定的误解是有用的。

  发展成本

  为了向Cogito添加一种新语言,需要两年多的软件开发和8-10人年的语言开发才能完善语义网络。您可以快速估算这些资源的成本(如果您在硅谷,将估计总数除以2!)并立即了解初始投资相当可观,但考虑到成本将分摊到所有实施中随着时间的推移。

   Cogito的标准语义网络允许对内容进行水平管理,从而获得显着更高的精确度回忆率(与从静态系统获得的回忆率相比),无需进一步详细说明。对于垂直实施,启动成本是必要的,以便标准语义网络可以利用来自特定统治的知识来丰富(添加的概念的数量通常不超过5,000);语言学家通常需要20-30个工作日来完成这项任务。

  对于那些认为“语言不断变化并添加新术语可能代价高昂”的人,我可以提醒您,即使是最具活力的语言,如英语,也会增加不超过100-200个新术语(常用) )每年不少1000个非惯用词(在最坏的情况下,这可能意味着每年大约10个工作日。)

批评管理语义网络的复杂性的人经常提到管理实体列表的复杂性,例如:人员,地点,公司,组织等。传统系统只有在实体存在时才能识别实体一个列表;这方面经常与语义网络管理错误地混淆。一个好的语义引擎能够基于它在文本中扮演的语义角色来识别实体,因此它不需要创建列表也不需要维护。同时,它还能够正确识别不太频繁的实体(由于显而易见的原因,这些实体尚未插入列表中。)

  基础设施成本

   Cogito可以使用通用的单处理器服务器每秒分析超过120KB的文本(大约40页文本)。这种速度与其线性可扩展性和低成本相结合,使Cogito成为一种实用的解决方案,即使在必须分析大量(数千万)文档的情况下也是如此。

  语义网络的开发和维护成本远低于通常假设的成本;即使对于那些不是该领域专家的人来说,管理信息的能力方面的改进(即使非常复杂)也是显而易见的。我相信,当客观地分析这些方面时(忽略神话和过时的信息),采用真实语义解决方案的公司数量将会增加。

  

  作者:Luca Scagliarini

神话与现实:总拥有成本所属专题:成本 现实 《神话与现实:总拥有成本》链接:http://www.zhouchuanxiong.net/1773