获红杉6000万A轮融资 他让机器数据也能1秒搜索10亿条数据

铅笔道 | 2015-12-03 11:27:00

陈军说,“创业就像一个人穿越沙漠,资本就是随身携带的水。必须知道走到哪一点融到钱,太多没必要,太少可能会渴死。”

今年8月,陈军账上还趴着几百万,他感觉形势不太好,便启动A轮融资。当月他便收到不少橄榄枝,最终陈军接受红杉资本6000万A轮投资。

他的上一笔融资来自公司成立当月。2014年3月,陈成立了“日志易”,没有产品,凭着“中国的Splunk”的定位和BAT背景的技术团队,当月便获得1400万天使投资,投资方为真格基金和几位天使投资人。

“日志易”其实是一套实时日志搜索引擎。所谓日志,指计算机自动生成的机器数据,即计算机所有的操作记录,每条数据都带有时间戳,记录了设备什么时候做了什么操作,产生什么结果。

机器或系统出现故障,通过日志可寻找问题出在哪里。但日志是文本数据,查询难度较大。“日志易”通过抽取字段,将日志文本结构化,用一套搜索引擎便可做全文索引,可以搜索到日志中的任意数据,即可把机器数据“百度”一下。

陈军对标的是美国的Splunk,其已在2012年上市,市值100亿美金。陈的团队研发了日志实时搜索引擎,日志从产生到搜索只需几秒时间,最快每秒可搜索10亿条数据 。“Splunk可能需要几十秒或几分钟。”陈说。

目前,“日志易”已有近10个收费客户,如中国平安、国家开发银行、中国移动、国家电网公司等。与Splunk类似,其按客户每天接入的日志量收费,但整体费用仅为Splunk的10%。陈军将成果归功于团队的黄金组合:以80后为主力(BAT背景)的技术团队和来自外企的销售高管团队。

17年积淀 做中国的Splunk

有几分宿命的味道,70年生人的陈军,45年来一直在和互联网打交道。其母亲是广东海洋大学计算机教授,60年代便研究计算机。受此熏陶,陈军6岁开始玩旧式计算机打孔纸卡;小学一年级就学习二进制;14岁用Basic语言编程......

1992年,陈军大学毕业,国内计算机并未形成产业,IT工程师尚属冷门职业。3年后,一本比尔·盖茨的《未来之路》(微软顶峰时期),把陈军从热门的建筑行业拉回到计算机领域。“当时香港的报纸1/4都在讲电脑。”挡不住内心涌动,1997年,陈留学美国南加州大学(互联网起源地之一)攻读计算机硕士。

至2009年回国加入腾讯,陈军已在硅谷浸淫互联网行业12年。他曾先后就职于思科、微软、谷歌,主攻网络和搜索技术。“39岁了,在美国待了一个轮回,再不回,以后很难回了。”3月,陈军对着一通大洋彼岸的猎头电话,回复了“YES”。

结束了在谷歌每天爬取100亿张网页的硅谷式生活,5个月后,陈军在腾讯做起了云计算数据中心。此后,陈军做过搜搜,被挖到高德地图任职技术副总裁,直到去年高德被阿里收购,陈心想是时候出来做点事了。分析了几个方向,陈最终决定做日志搜索引擎服务,对标美国的Splunk(2012年上市,市值100亿美金)。

技术优势

所谓日志,指计算机自动生成的机器数据,即计算机所有的操作记录,每条数据都带有时间戳,记录了设备什么时候,做了什么操作,产生什么结果。

所有的IT系统都会产生日志,不论是服务器、网络设备、还是操作系统、应用软件都会产生大量的日志,小的公司一天产生几GB日志,大的公司一天几TB日志。“比如苹果电脑的WiFi日志,记录了我下午4:05分,自动连接了雕刻时光的免费WiFi。”陈打开电脑说道。通常服务器、系统等出现问题,运维工程师(负责运行和维护运行在服务器上的软件服务)会通过日志找出问题所在。但日志是文本数据,查询难度较大。常规做法有两种,都很费时费力。一是人工一条一条检查数据。“挨个字符看,像大海捞针一样。”二是运维工程师用一些命令或脚本程序找出关心的数据,将其导入数据库中进行分析。“首先很多日志的格式无法录入数据库,操作不灵活;其次你要预先知道关心的数据在哪里。经常会出现遗漏,导致检索不出结果。”

此外,由于日志量很大,如果硬盘空间不够,日志就会被删掉或者覆盖,运维工程师管理起来很难。

此类问题,陈军没少遇到,通常会自己写个程序解决。2010年,他第一次接触了Splunk,“感觉眼前一亮。”后者通过抽取字段,将日志文本结构化,用一套搜索引擎便可做全文索引,可以搜索到日志中的任意数据。

在高德时,陈也曾用过Splunk的免费版软件。他了解到:首先,国内并无此模式的成熟企业;Splunk按每天处理的日志量收费,价格很高。“一些大银行,一次采购就要几百万,他们都嫌贵。”陈分析,做成这事儿有两个门槛。一是技术团队要有搜索背景。“BAT的技术水平能做,但他们不会做如此专注领域的产品。”二是要能把产品卖给传统大中型企业。“互联网公司可自己开发软件,未来会重点服务传统企业。”陈说:“我提供更加本地化的产品服务,收费更便宜,应该会有市场。” 

2014年初,陈军把想法告诉了几个腾讯、高德的前同事,他们觉得方向靠谱,选择加入。3月,陈军创立了“日志易”。“早期成员全是BAT、360出来的,比如做到腾讯T3的,百度T6的,阿里P7的,都是技术骨干。”陈补充。

当月,陈军获得1400万天使投资,投资方为真格基金和几个天使投资人。

在日志中选择“apache.ua.browser”字段,可看到用户浏览器使用情况 

完善产品功能

产品研发,陈的团队早已轻车熟路。“基本和原来一样按流程研发,过去不知做过多少遍了。”

Splunk已做了十年,产品功能已很复杂。陈借鉴前者,做了精简版,先研发了前者30%的基本功能。凭借团队经验,陈的团队研发了日志实时搜索引擎,可做到日志从产生到搜索只用几秒时间,最快1秒可搜索10亿条数据 。“Splunk可能需要几十秒或几分钟,这是我们的不同之处。”陈解释,“在百度、谷歌上,一条信息从产生到被搜索到,最快要几分钟。”

10月,陈发布了“日志易”1.0版本,分为企业部署版(用户下载软件,在它的环境里部署运行)和SaaS版。陈军未急于寻找传统企业用户,而是利用自身人脉,将产品给一些互联网公司免费试用,通过反馈来完善产品,种子用户包括乐视网、陌陌等。过程中,团队不断增加产品功能。今年2月,“日志易”1.0版完整版上线。主要功能如下:

1、可采集各类来源日志。“底层架构类似于一套模板,用户可以自己配置解析规则。”他说,恒生电子交易系统的日志是二进制格式的,我们把它转成文本格式,处理后给券商使用。

2、及时关联搜索和分析。“日志易”将不同类型的日志串到一起,进行关联搜索。“比如一笔网上交易需要经过多个系统,每个系统都产生日志,‘日志易’将这些不同日志关联起来分析,知道这笔交易的总延时,及在每个系统的延时,方便工程师对交易进行监控。”

3、搜索后自动生成图表。“就像我要查一下WiFi没连接的原因,通过搜索把跟WiFi有关的日志调出来,同时生成分析报告。”

4、监控告警。日志里面的字段包含错误信息,过去一分钟出现了一次或者几次,就可以告警,发邮件或者发短信来告警。

5、安全审计。如果你的系统是被黑客攻击了,日志里就会留下黑客操作的记录。

去年,北京公交驾校网站被黑客攻击,导致学员考试上不了网。北京市公安局网警支队拿到5GB的日志,包含近两千万条数据。人工检查速度太慢,“通过使用‘日志易’几十分钟就分析出结果,线索出现,找到了黑客的IP地址,及上传可执行文件的操作。“日志易”的使用门槛并不高,对于复杂功能,‘日志易’提供定制化服务。若使用中出现问题,工程师会在线或到场进行技术支持。

引入外企销售高管

产品走通,如何卖给传统大中型企业?陈军的做法是直接挖来经验丰富的外企销售主管。今年4月,陈挖来销售负责人汤滨,他曾是IBM、SAP 和 Splunk 的销售主管。“这是一个风向,斯诺登棱镜门事件之后,外企在国内比较难做,更多人选择进入民营互联网企业。”

陆陆续续,陈军找来了华南、华东、华北销售的负责人。“全是70后,来自外企,超过15年大客户销售经验。他们过来,下游的代理商也会跟过来。”谈到找人的方法,“我们全员持股,每个人都是公司的主人。”陈笑着说。让传统企业接受新品牌并非易事。自身渠道资源外,陈军的销售负责人们选择从展会切入。“能接触到客户的各种行业展会,我们都参加了。”目前,“日志易”已有近10个收费客户,如中国平安、国家开发银行、中国移动、国家电网公司等。与Splunk类似,其按客户检索日志的量收费,但整体费用仅为前者的10%。“到年底,约有500万的收入。”陈说。

今年8月,陈军账上还趴着几百万,他感觉形势不太好,便启动A轮融资。当月他便收到不少橄榄枝,最终陈军接受了红杉资本的6000万A轮投资。未来,陈军认为“日志易”可用于用户数据挖掘、分析。“很多的网站用户来访问,每次访问每次点击都会在后台产生一条或多条日志,从日志这里就可以分析出用户行为。”此外,他还有一个更大的应用方向——物联网。“物联网传感器产生的数据也是带时间戳的,也是这种所谓的时间序列机器数据,这些数据我们引擎也能处理。”

去年,谷歌花了32亿美元收购了一个做智能恒温器的公司NestLab,它把智能恒温器的数据采集传到云端,通过Splunk来处理、分析。“国内的智能硬件发展很快,都需要数据分析。他们没必要养一支技术团队专门做这事,这或许是日志易的新机会。”

  • 城市合伙人