【猿团专访】| Cloud Insight李哲:不安份的程序猿做靠谱产品,监控原来可以如此简单

猿团-瘦司 | 2016-05-25 09:25:25

找一份安稳的工作,相信是大多数毕业生的追求。而李哲,从毕业初就很幸运地得到了大家艳羡的国企“铁饭碗”,却又转而放弃,而且是两度放弃,只因为觉得“工作太悠闲”,简直让人大跌眼镜。这个不安份的程序员,随后受到创业者激情的感染,加入到联网的创业大潮,先后在两个法国、中国创业团队担任技术负责人,技术也从Java转向Ruby,Node.js等小众语言。

在国企的工作经历和在创业公司工作大相径庭,这种强烈的反差让李哲学习到很多软件开发中的方法论,如敏捷开发、TDD、结对编程、持续集成、持续交付、DevOps等等,并在现在的团队中大力推广这些相关方法。目前,李哲担任Cloud Insight 总负责人,带领这支15人的团队,创建了一个全新的系统监控工具。

猿团专访,Cloud Insight,CEO

以下为猿团记者专访内容,原创作品,如需转载请注明出处。

李哲所负责的Cloud Insight是oneAPM旗下产品。oneAPM是一家中国基础软件领域的新兴领军企业,专注于为企业级用户提供一站式的 IT 管理解决方案,通过一个探针就可以完成日志分析、安全防护、APM 基础组件监控、集成报警以及大数据分析等多种功能。据悉,oneAPM目前被全球数十万开发者选择,其中企业级用户超过 20000 家,全面覆盖了运营商、金融、政府、交通、能源、电商、O2O、旅游、教育等多个领域。

oneAPM如此强大,而Cloud Insight也不遑多让。虽然新开发不久,但Cloud Insight目前已经积累数千忠实用户,市场上还没有可以匹敌的竞品。好产品离不开好人才。李哲告诉笔者,Cloud Insight的团队虽然只有15人,但有来自像英特尔国际知名的企业,也有一些来自小的创业团队。“团队在创建之初并没有把成员的背景作为重要的考量标准,活力和想法是第一标准。”李哲如是说。对于自己的团队,李哲表示现在团队中的每个人都非常的有想法,每天都能贡献出想象不到的新思路,这让队员们每天都非常有激情。大家可能一人身兼多职,但并不觉得累,反而都特有满足感,因为每天都有新的成长。

Cloud Insight 让监控变得更简单

Cloud Insight是一款次世代系统监控工具,集监控、管理、协作、计算、可视化于一身,减少在系统监控上的人力和时间成本投入,让运维工作变得更加高效、简单。为了让笔者了解Cloud Insight的用处,李哲举了一个生动的例子:用户可以使用Cloud Insight实现监控、数据采集,比如使用Cloud Insight监控PM2.5,当污染度超过既定数据后,就会收到来自系统的报警,有了Cloud Insight,就可大幅度减小人力成本,而且采集到的数据更精准。

猿团专访,Cloud Insight,CEO

为什么会有Cloud Insight这款产品?其中还有一段渊源。原来,早期oneAPM就打算要做这样一款产品,但经过初步实验,不是太成功,因此也一直没有落实下去,在一次会议上,李哲提出了对于产品的一些看法,没想到之后公司直接将产品交给他来打造。因为这个原因,原本打算自己单干创业的李哲没有离开,而是静下心来,将Cloud Insight当成自己的事业来做。有这样的决心,产品当然越做越好,在这个过程中,李哲本身也获得了非常多的成长。

说到Cloud Insight,李哲表现出技术人员特有的专业,据他介绍,Cloud Insight为用户提供了一体化解决方案,集操作系统监控(如 Ubuntu, CentOS, RedHat 等),和云主机监控(如 Amazon Linux),以及数据库监控(如 MySQL, MongoDB 等),和中间件监控(如 Tomcat, ActiveMQ 等)于一身,可有效减少企业在系统监控上的人力和时间成本投入,让运维工作变得更加高效、简单。

同时,Cloud Insight还具有以下特点:

集中管理集群和云主机 轻松应对复杂的基础设施架构: Cloud Insight 支持多种操作系统和云主机的监控,在一个平台上对所有基础设施进行集中管理。通过标签,对基础设施进行有效地管理,让您轻松应对复杂的基础设施架构。

数据集中处理和计算 让数据管理更专业:Cloud Insight 将所有性能指标作为时间序列数据来处理,提供对数据的聚合、过滤、分组、计算;方便运维人员来组合不同主机的数据,和发现数据之间的关系,以及组合出满足自身业务的抽象性能指标。

协同管理报警 提高工作效率:Cloud Insight 可以对每项性能指标来设置报警,并在触发阈值时产生告警事件,分派到具体责任人。使用 Cloud Insight,提高每个人的工作效率,共赢共生。

深入各个平台 开箱即用 Cloud Insight不可复制

传统的IT监控基本都需要二次开发才能解决,虽然可能已经存在相应的开源脚本,实现了相应组件的监控,但由于代码质量,环境差异等问题,在实际操作层面总是面临各种各样的问题。针对用户痛点,Cloud Insight 对各种组件及服务深入研究,避免了这样的问题。Cloud Insight Agent 安装只需一条指令,配置数据库监控也只需要打开配置文件即可。从未有过这样一款系统监控工具,能够做到如此简单、易用。

除此之外,Cloud Insight也解决了技术指标和业务指标的关联监控问题,由于用户可以通过API上传业务数据,通过关联两方面的数据,能够得知系统故障与业务之间的关联关系。最后,Cloud Insight 通过基于事件流的协作机制,可以统一全公司的可视化与事件管理需求,所有的事件可以通过API上传到 Cloud Insight ,然后进行事件的查看和分析,在将来,任何事件都可以分配到具体某个团队成员,进行更加定性、定量的工作分配。

Cloud Insight 的最大特点是集成了几十种开箱即用的监控服务,提供了非常丰富的数据展示形式,以及对于任意数据指标报警的能力,同时具有二次开发的能力,除此之外还提供不需要探针即可对阿里云等云厂商进行监控。要支持这么多的监控服务,需要对各种平台服务都了解得比较深入,同时对数据可视化需要深入的理解,因为不同的监控服务需要不同的数据展示形式。Cloud Insight是一个平台,而当这个平台建立起来后,竞争厂商基本没有办法再复制这样的产品。

猿团专访,Cloud Insight,CEO

强大技术汇集 保障用户体验

为了保障用户的使用体验,Cloud Insight 采用了各种技术来保证产品和系统的稳定。首先, React.js 以及出色的设计团队,通过靠近用户需求的产品设计,保证了用户的第一感官和使用体验。李哲认为,从工作和产品中出发,最适合的技术才是最好的技术。秉承这个观点,Cloud Insight采用了各种技术:在产品中,Cloud Insight使用了 Node.js, Python, Ruby, Java, Clojure,在存储上使用了 OpenTSDB,HBase,消息队列采用 Kafka,DevOps上以 jenkins和 Cloud Insight本身为主。这些功能中的任意一个,都是团队本身需要使用的,也就是说,CI的团队在通过自己本身的需求来改进产品,让产品更简单更实用,所以当用户使用 Cloud Insight时不会有太大的障碍,体验上也就得到了保障。

针对Cloud Insight未来的打算,李哲表示,未来,Cloud Insight将成为每个IT团队的工作中心,各种数据的监控与协作都会在 Cloud Insight 上完成,不仅仅是技术上的监控,也包括业务上的。Cloud Insight 会集成国内乃至国外的各种流行SAAS服务,将他们的数据吸收过来,成为一个SAAS的使用中心,解决目前一个IT团队或者公司被各种SAAS工具割裂的局面。猿团创业网

如果你也有一个创业梦,欢迎关注【猿团专访】,了解每个CEO背后的故事,或者创投信息;如果您创业成功,想与我们一起分享创业故事,预约CEO专访,欢迎发送CEO简介或公司简介至邮箱:liuqiying@yuantuan.com

(文章来源:猿团 作者:瘦司)

  • 城市合伙人