专访爱数智慧CEO张晴晴:数据服务刚性需求,获客难度不大

国内新闻 阅读(1194)

第一次见到张庆庆,她有着美丽的眼睛和微笑,能干而优雅,但很难把她与“技术专家”的头衔联系起来 在我们看来,技术专家应该严肃而正直,外加一副黑色的镜框。 然而,作为艾塔智能技术的创始人兼首席执行官,张庆庆在语音识别领域拥有十多年的研究和工作经验。

妇女没有创办很多企业,尤其是在数据处理服务领域。

张庆庆自2005年加入中国科学院声学研究所,专注于语音识别领域 在为百度、腾讯、阿里、360、UCweb和蚂蚁金融等主要互联网公司构建语音识别基线声学建模系统的过程中,数据质量的重要性不断得到认识。

对于人工智能公司来说,高质量的数据至关重要 事实上,许多人工智能公司在获取信息和处理数据上花费了大量的时间和精力。 此外,该行业缺乏“有价值的”第一手数据。 面对数据采集困难、质量低、价值低的行业阵痛,张庆庆深刻认识到专业数据处理公司发展人工智能产业的必要性和紧迫性

2016年,张庆庆正式创立艾书智慧 作为人工智能大数据处理服务企业,Aitu Intelligence致力于在智能语音、自然语言理解、智能图像等领域为客户提供一站式数据服务,包括数据方案设计、数据收集、数据标注/转录等。

谈到创业精神,张庆庆笑了 从清洁和组装电脑到团队建设和公司运营,我们必须自己动手。 她说,特别是在团队建设中,数据处理服务需要许多专业的语音和其他算法技术人员。 在这个行业,对人才的竞争非常激烈,许多在大公司工作的技术人才不会轻易跳槽到初创企业。 但到目前为止,团队中的研发人员已达50多人,不亚于其他大型甲方公司。

根据招商局工业研究所发布的《2017年中国人工智能产业研究报告》,2016年中国人工智能市场规模达到96.61亿元,增长37.9%。人工智能市场的规模持续增长。预计2017年将超过130亿元,2018年将超过200亿元。 未来,通过对话的互动技术将成为常态。 从远场语音市场来看,2017年只有1600万人工智能语音助理将被发货 然而,根据国际数据中心的研究报告,到2020年,这一数字将达到1.5亿,增长近110% 从传统文本输入到更高效的语音输入,这为语音数据收集、清理和挖掘带来了更大的市场空。

要做数据处理服务,最关键的元素数据是不可或缺的,这是很自然的。 既然艾图智慧已经看到了该行业面临的数据难题,它如何解决这些难题?

首先,如何解决数据采集通道的问题 目前市场上有一些数据,可以通过微博智虎获取,公共数据可以通过大学或研究机构获取。然而,这一数据量不能满足人工智能公司的需求,数据的价值也不是很大。 艾塔智慧更喜欢众包模式。用户可以通过应用程序上的开放注释界面接收数据和注释。 这不仅保证了数据源的隐私性和安全性,而且丰富了数据源的通用性。

其次,如何保证数据质量和处理速度 数据收集将形成海量数据,但如何筛选出高质量的数据也是一个难题。 Aita Intelligence使用一套自己的核心算法来分层其供应商的质量,并通过算法与团队匹配任务,以提高数据采集的速度和质量。

最后,如何处理数据标注和劳动密集型问题 张庆庆认为,数据标注不会完全脱离劳动密集型 一方面,现有机器无法实现全自动贴标。所谓的无监督或弱监督数据标注结果性能相对较差,而人工标注数据的准确率可以达到99%以上。另一方面,数据标注也为传统工业企业的员工带来了新的过渡性就业机会

Aita Intelligence的核心业务是数据处理,包括数据收集、专有版权设计、数据标记和转录等。为客户提供定制和标准化的数据库。 其中,标准化数据库通过初步调查和充分的专业知识形成成品数据库,并通过清洗和校准提供给众多企业。 初创企业使用标准数据库来构建基线模型,而大型企业则将其作为补充来优化绩效。

除了张庆庆在语音识别领域十多年的研究和工作经验之外,团队的大多数其他核心成员也来自语音技术背景。 鉴于团队及其自身的技术背景,张庆庆表示,声音是艾树智慧的起点,声音是最初客户的主要领域。 但随后她补充道:“事实上,声音不能作为划分客户的标准,因为所有客户本质上都是多模态的。” 可以说,在我们把演讲做好之后,它将被广泛辐射到图像和文本领域。 "

目前,艾舒志的语音数据库已经覆盖了许多汉英语料库和语音数据库,此外,它还拥有许多丰富的语音数据库,如维吾尔语、粤语、日语、韩语和越南语 除了声音,图像是另一个重要的推广领域。目前,它们主要集中在三个方向:人脸识别、视频监控和辅助驾驶。其合作伙伴包括中国科技愿景 文本比声音和图像更难理解。声音和图像有标准的标准来定义它们是否正确,而文本理解是不同意见的问题。 关于其应用场景,张庆庆表示,最大的场景是客户服务,即自动应答机器人。 所涉及的自然语言理解技术仍然很难通过标记文章,提取中心思想,然后上升到问答水平。

谈到数据需求,张庆庆不同意明年整个市场的数据需求将是今年的5-6倍的说法。 她解释道:“当前市场的核心问题是无法满足客户的需求。也许目前的需求已经是一百万倍,一千万倍,但我们现有的数据不足以满足客户的需求。” “

此外,行业竞争不如芯片领域激烈,龙猫数据CEO赞芝(Zanzhi)也表示,现在还不是抢占市场的时候。 许多大公司都是多模式的业务开发模型,数据需求是严格的。 在现有市场中,数据处理服务企业不可能满足某一领域的所有需求。因此,张庆庆更关心业界的服务质素,共同推动业界健康发展。

就像数据处理一样,“垃圾进垃圾出”也适用于服务。 张庆庆表示,艾塔智慧只是坚持向客户提供高质量数据的理念,其获得客户的难度并不像想象的那么大。 许多以前服务过的客户会被推荐给其他数据需求公司,从而形成良性效果,在很大程度上解决了获取客户的问题。

艾舒志目前有50多名研发人员。未来,计划储备更多的技术人才,专注于数据库和数据分析领域,提高数据处理服务的技术支持能力 此外,张庆庆还表示,将开拓更多海外客户,将北美和欧洲作为数据处理服务业的风向标,并制定更准确的标准化数据库。

艾舒志辉成立于2016年5月。2017年初,它从史明资本获得了数千万元的预甲融资。据估计,今年的收入将达到2500万元左右。 然而,张庆庆表示,尽管该行业不是烧钱的行业,但它需要为早期研发预付大量资金。做得越好,需要的钱就越少。因此,未来将考虑新一轮融资。

人工智能2017年最热门的标签 对于许多人工智能水测试员来说,你知道如何平衡技术和需求吗?你知道如何利用这项政策事半功倍吗?你知道如何找到公司的投资机会吗?12月14日,“2017亿欧洲创新者年会人工智能产业应用峰会”将邀请众多投资者、企业家和人工智能精英共同探讨。它不仅是人工智能+行业+应用,也是需求者和技术提供者的沟通平台、政策专家和企业的沟通平台、投资者和企业的相互追逐平台、应届毕业生和企业的对接平台。 多维,更深,到这里来实现你的人工智能!

版权通知

本文来源于1亿欧元,并在1亿欧元的授权下发行。版权属于原作者。 请点击重印说明进行重印或内容合作。任何非法翻印都将受到起诉