以客户为中心是华为成功秘诀。

——任正非

创业有两条铁律:第一,做能为用户创造价值的事;第二,做你有能力做到的事情。

人工智能领域同样不例外。自动驾驶、金融科技、智能服务机器人、智能穿戴设备……过去几年,人工智能领域的初创企业争奇斗艳,群雄逐鹿。

数据显示,2018年中国人工智能领域共融资1311亿元,增长率超过100%。据福布斯最新发布的研究报告显示,到2024年,全球人工智能市场的规模将达710亿美元。

但在资本狂潮之下,概念大过应用,故事多过收入,行业虚火持续上升。市场开始意识到,抛开看得见摸不着的“概念们”,在已经存在的行业和需求中寻找突破点才是当务之急。

在大数据时代,每一个企业都存在着大量文字文本,法律、金融、媒体等等行业,需要对文本进行审核、分类、提取关键词等。“文本智能处理”应运而生,作为是人工智能的一个分支,它试图让机器来理解人类的语言,通过模拟人脑的机制来解释文本,并处理大量的重复机械工作。

不仅如此,文本的智能处理目前已经可以被应用在智能问答、机器翻译、文本分类、文本摘要、标签提取、主题模型等诸多方面。当艾问尝试寻找到这个领域的Top5企业时,我们发现在国内市场,目前有且只有一家技压群雄的开拓者——达观数据。

这是一家成立不过4年的初创企业,创始人陈运文是个低调的工程师。

这家企业融资拿得多自己也能盈利,截至今年7月,达观数据已经获得了宽带资本、软银赛富、真格基金等著名投资机构的近3亿元投资,是语义分析人工智能细分领域的获得融资金额最多的企业。

这是一家大众有些陌生的企业,但企业客户却对他们的系统爱不释手。

带着好奇和疑惑,艾问走进达观数据,独家专访创始人陈运文。

一问:十年之内,RPA代替人类?

艾问:我们应该怎样认识达观数据?

陈运文:达观是一个文本智能处理的公司,做的是让计算机能够像人一样看得懂文章资料,并且能够代替人来完成日复一日的重复工作。

我们统计过,每天每个人大概有1/3的时间是花在文字资料处理上面的,不是在看一个文件,就是在审核一个文件或者就在写一个文件。但只要计算机具备了文字阅读理解能力,它就可以代替人来完成很多工作。所以我们教会计算机一个达观智能文本处理的RPA系统,这和教一个学生学语文的过程是类似的,要教他认识汉字、组词、造句、写文章,最后能够让他上岗工作。

艾问:什么是RPA系统?

陈运文:文本智能处理主要依靠两个技术:NLP和RPA,就是自然语言处理和机器人流程自动化。达观开发的RPA叫基层流程自动化系统,它可以像人一样去阅读文档资料,大幅度提高企业的运作效率。

艾问:RPA提升的效率可以被量化吗?

陈运文:在我们所有的RPA系统里,文件资料自动填写系统是特别受用户欢迎的。比如打开一个网站,我们要填写很多很多的表格,这些信息的填写非常繁琐,以前可能要花半个小时才能完成的一个表单填写工作,计算机一分钟就能完成。

艾问:你曾经说希望未来跟文字相关的工作90%都靠计算机来做,最后把关的10%交给人类就好了,那预计发展到这个阶段需要多久?

陈运文:10年之内这个目标一定能够实现。我们今天开发的这些系统,每一年计算机阅读理解的能力都会上一个大的台阶,所以随着接下来几年新技术的应用和大量数据的训练,计算机系统可以进一步得到能力提升的,我们对未来充满期待。

二问:为什么是达观数据?

艾问:为什么要如此坚定地选择自己创业呢?

陈运文:我之前是在百度、盛大、腾讯这些互联网企业,但我后来发现其实中国的传统行业是一个更加广阔的天地。在这些传统行业中,能不能把我所学的计算机和人工智能技术应用进来,对我来说是一件特别令我兴奋,让我感觉特别有成就感的事情。所以在2015年的时候我就出来创办了达观数据。

艾问:有业内人士预测到明年中国会成为亚洲范围内的RPA第一市场,但相比于美国、新加坡等国家,中国其实起步晚、技术也不完善,达观有这个感触吗?

陈运文:整体来看,美国比中国大概要领先两年左右的时间,但我觉得大家仍然是在同样一个起跑线上,中国市场孕育的机会更大。在文字资料处理领域,英文和中文其实区别是非常大的,同样一个系统在英文领域处理很好,但到中国如果你不加改造是会水土不服的,这也是达观独特的优势,因为我们一直是做中文文字资料自动化处理的,所以在中国的RPA市场,我们有自己的技术优势。

三问:为什么只服务B端客户?

艾问:既然可以替代人类的重复操作,又具备很强的技术优势,为什么达观只服务B端客户?

陈运文:我们自己的判断是现阶段to B是达观最重要的研发方向,未来我们觉得从to B到to C也是自然而然过渡的一个过程,因为不管是企业还是个人,我们每天都需要智能化的工具来帮着进行文件资料的自动化处理,所以在扎稳了to B的脚跟以后,也会把业务拓展到to C这个领域。包括最近也在和WPS合作,把文本智能化处理的模块内嵌到WPS的生态里面去,用户在使用WPS的时候,可以使用一键智能化来进行文件资料的自动化处理、比对和纠错工作。

四问:为什么如此受资本偏爱?

艾问:截至目前,达观数据已经获得了宽带资本、软银赛富、真格基金等著名投资机构的数亿元投资,是语义分析人工智能细分领域的获得融资金额最多的企业。你认为投资人最看重达观的是什么?

陈运文: 达观能受到这么多投资机构的认可,非常重要一点是我们团队非常的务实。达观特别贴近于客户的应用场景,所以在和投资机构交流的时候,特别强调我们是实实在在能够把这些技术落地到每个应用场景底下,真正为客户创造价值的。这一点也得到了投资人的充分认可,他们期待的人工智能也不是停留在纸面上,停留在电视里,而是能够真正落地到企业的每一个应用系统里面去的。

五问:行业存在泡沫吗?

艾问:文本智能处理行业存在泡沫吗?

陈运文:文字资料处理它是看上去容易,但是要让计算机达到人类阅读理解的水平是非常难的。所以进入这个行业的企业并不多,真正落地的商业化应用系统就更少了。相较其他的人工智能应用领域,这个行业的发育其实比较滞后,也不像其他领域泡沫那么多,所以对我们来说也是一个比较好的事情,炒作没那么多,竞争没那么激烈。

艾问:听上去达观一切都很好,难道没有挑战和压力吗?

陈运文:挑战当然有,现阶段非常大的一个挑战是寻找更多优秀的人才。团队在扩大的时候如何能够保持一个非常好的节奏,同时能够吸纳优秀的人才,能够让人才在组织里面得到成长,我觉得是非常重要的事情。

整个中国人工智能领域优秀的人才其实是稀缺资源,非常非常难找,我们花了非常多的时间和精力来做,尤其达观的人才很多是在传统行业,比如说银行会计师事务所、政府机构,我们很需要相关行业的专家也加入我们,共同打造适合各个行业使用的业务系统。但传统行业对人工智能互联网创业企业还是心存疑虑的,觉得是不是有泡沫,是不是不靠谱等等,引进人才是我们现在最费时费力的事情。

六问:公司盈利吗?

艾问:作为一家高科技的初创公司,人工智能领域被诟病最多的可能就是融资多,估值高,但盈利少,达观目前在盈利方面做得怎么样?

陈运文:达观的团队非常务实,我们在商业化落地方面花了非常多的心血,所以我们也是在中国人工智能产业里面少数能够一直保持盈利的公司,这一点我是非常骄傲的。也就是说我们一方面在研发方面投入巨大的人力和资金,但一方面我们也能够从客户那边源源不断收到订单,确保公司能够非常稳健地向前发展。

七问:巨头为什么不入场?

艾问:这么好的一个生意和赛道,巨头为什么没有来做这件事情?除了RPA系统,你们还有其他竞争优势吗?

陈运文:文字资料处理你要达到一个很高的水平其实挺难的,我们也不是第一天就达到现在的水平,我也是在这么多企业工作了十几年,包括我们团队这些同学,此前在各大公司都做资料处理,工作了十几年,积累了很多经验以后,才达到一个比较高的水平。像BAT这些巨头是非常擅长做C端的,但B端的话做起来很吃力,为什么呢?to B你要俯下身去为客户解决问题,巨头更倾向做生态做平台,他们做一个通用的系统,但这些通用的功能很难满足B端客户。

第二,在这个领域的积累是特别重要的事情,中国有句古话叫读书破万卷,下笔如有神。只有积累了足够多的文字资料数据,才能够让计算机具备一个非常优秀的文字处理的效果,文字资料积累这件事情是一个细水长流的事情。假设现在一个企业要瞬间积累1000亿次的文字资料,你根本就没地方去找这么多公司的资料,需要花很长时间去收集、去整理、去归档、去分析。这其实也是很高的一个门槛,所以对其他企业来说,我们有这么多行业资料和数据,也是一个重要的竞争壁垒。

投资人说

蒋驰华 赛富投资基金合伙人

“和运文第一次见面是在2016年10月,当时赛富正在看NLP领域的早期项目,达观数据和另一家做交互的三角兽科技进入了我们的视野。和运文的沟通非常愉快,他本人有极强的专业背景,身处一个急速发展的赛道但依然可以把心静下来做研发,这也就是为什么达观可以在文本智能处理领域建立自己的技术壁垒。一拍即合,我们很快就决定投资达观。

这几年我们也看到有一些企业试图进入这个领域,包括阿里也在推进RPA的研发,但因为互联网巨头自身的价值网络对于他们在某些新兴领域的拓展,不是增值而是制约,在NLP及RPA领域他们并没有先天优势。观察下来,达观依然是这个赛道绝对的头部企业。”