人和未来布局有三条业务线,IVD与大健康业务

图片[1]-人和未来布局有三条业务线,IVD与大健康业务-4747i站长资讯

研究 | 凯文青川关磊

书面 | 关磊

大数据领域,人和未来是一家跨越BT(生物技术)和IT边界的公司,被归类为基因大数据公司。

近年来,在基因测序需求的推动下,基因大数据产业蓬勃发展。然而,与不断增加的遗传数据量相对应的是低效的数据处理技术。

行业数据显示,人类全基因组数据占用约100-200GB存储空间c语言大数据运算,单个样本数据量巨大。目前,单台计算机分析一个人类基因组的 200GB Fastq.gz 数据需要 30 个小时。高性能压缩、传输、计算等数据处理技术是业界普遍面临的技术瓶颈。

为解决数据处理效率低的问题,结合BT+IT领域的跨界优势,人和未来在IT信息化方向进行了早期布局和重点投资,目前处于领先水平在行业中。去年,它以绝对优势打破世界纪录,将全基因组分析时间从30小时缩短到18分钟,仅为次优时间的1/5。

人人公司成立于2014年,团队来自遗传学、生物信息学、计算机和医学等多个领域,为其综合发展路线奠定了基础。

目前,人和未来拥有IVD(体外诊断)、大健康、大数据三大业务线。其中,IVD和大健康业务以基因检测为基础,服务于医院、体检机构、保险公司等客户。此外,新拓展的大数据业务为上下游基因测序中心、精准医疗中心、测序客户、云厂商等提供高性能数据压缩、传输、计算等信息技术解决方案。

人和未来CTO宋卓表示,人和未来为基因大数据产业提供一系列信息化解决方案。数据压缩、传输和计算技术解决方案将首先进入商业化阶段,而数据解释和发现解决方案将适时发布。

企业客户是其主要目标,直销是目前的主要重点。根据大型B型企业的特点c语言大数据运算,客户更换供应商的频率较低,具有一定的客户粘性。人类及未来信息技术解决方案,以自身基因产业背景为主要竞争力,能否扩展到其他行业,如医学影像数据处理等,需要等待市场验证。

近日,对人和未来联合创始人兼CTO宋卓进行了专访,现将精彩内容分享如下。

图片[2]-人和未来布局有三条业务线,IVD与大健康业务-4747i站长资讯

部署基因大数据,数据技术正在商业化

:大数据业务板块新发展的原因是什么?为客户提供哪些服务?

宋卓:第一,基因数据总量在快速增长。今年全国有望突破100PB,并保持100%的增长。其次,没有合适的工具对基因大数据进行高性能处理和分析,所以我决定自己开发。基于已经取得的优异成绩,我们计划为整个行业提供最好的技术解决方案,做基因相关的大数据技术产品。

爱分析:大数据技术在遗传学领域有哪些组成部分?

宋卓:它由压缩、传输、计算、解释、发现五个部分组成。让我们首先关注前三个。通过数据压缩、传输和高性能计算节省的资源和提高效率可以量化比较,商业化路径比较清晰。解释和发现涉及机器学习、生物信息学、文本挖掘等技术,商业化之路仍需探索。

爱分析:压缩和传输的IT属性很强,计算有行业属性?

宋卓:压缩和计算处理是生物遗传数据。数据格式和特点需要对专业知识进行特殊处理,对最终效果有影响,具有很强的行业属性。数据解释和发现的生物学特性最强。存储和传输的行业属性相对较弱。

爱情解析:解读包括什么?

宋卓:临床上,解释包括肿瘤精准用药指南和遗传病诊断咨询;一般健康方面包括基因相关科普教育、肿瘤早期筛查和基因健康风险。

:除了盛信数据,大数据业务常见的行业数据有哪些?

宋卓:在医疗健康行业,除了基因的大数据,医学影像领域也在产生海量数据,单人数据超过5GB,所以对高性能也有刚性需求压缩和传输。我们的技术方案架构适用于很多领域,但首先会在基因数据领域进行推广和打磨。

:大数据商业化的时候,服务了哪些2B客户?

宋卓:客户有两种。首先,大型基因测序公司是生产和汇总基因数据的机构。全国有20多家公司。其次,拥有基因数据中心的医院、大学和研究机构是基因数据的用户和应用。

爱分析:您目前与哪些基因测序公司合作?

宋卓:目前大部分还在测试和合作洽谈中。一方面,我们通过社区版推广先进技术,另一方面,我们发布企业版,为B端客户提供专业、安全的贴身技术服务。

爱分析:商业化会采用什么样的模式?

宋卓:还在讨论,主要成本在研发成本和计算硬件上。在定价层面,计划是根据数据量收费,指的是为客户节省的成本。我们提供服务器租赁以降低客户的启动成本。

:如何在云端服务客户?

宋卓:越来越多的基因测序公司开始使用云服务。生成的数据有的存储在本地,有的传输到云端。我们支持这两种方法。从云端的角度来看,我们支持边压缩边传输,并且我们在 AWS Place 中提供工具帮助客户节省存储和传输成本。现在 1 PB 的存储成本超过 100 万,我们可以节省到 1/3,节省 2/3 的成本和空间。

爱分析:AWS地方的收费模式是什么?

宋卓:收费模式灵活。根据用户的实际需求,可以按带宽或数据量收费。

爱分析:企业版的数据会有什么竞争力?

宋卓:企业版的竞争力来自于它的高性能和安全性。以最新数据为例,企业版已经打破了原始数据压缩到3%以下的记录,具有巨大的性能优势。更重要的是,企业版将通过技术手段保证压缩传输的数据与原始数据100%一致,数据安全性有很高的保障。

爱分析:压缩效率这么高是因为基因信息分析有很多冗余?

宋卓:对对对。人类有3个基因组。测试时需要对基因组进行30次测试,数据量在100G左右。由于目前高通量测序方法的限制,数据必须是冗余的,否则将无法统一覆盖整个基因组。就像打断了一条长长的链条,小碎片很容易丢失,所以必须将30条链条全部打断,一起摩擦才能恢复原貌,然后通过比较寻找突变。

图片[3]-人和未来布局有三条业务线,IVD与大健康业务-4747i站长资讯

IVD与大健康共同发展,IVD认证是关键

爱情解析:基因检测属于哪个业务线?商业化程度如何?

宋卓:基因检测作为一项重要的基础技术,既支持IVD,也支持大健康业务。其中,IVD专注于临床体外诊断检测,而大健康专注于基因相关的健康管理。目前,已有多条产品线实现商业化。

爱分析:IVD业务有哪些特点?

宋卓:IVD是体外诊断。基因相关IVD根据检测内容大致可分为遗传病、肿瘤、感染三类。IVD的主要客户是各级医院和第三方医学实验室。IVD的特点是必须是CFDA(国家食品药品监督管理局)认证的医疗器械或试剂盒,供医院或医学实验室购买后提供检测服务。

爱心解析:目前基因检测获得的CFDA认证有哪些疾病?

宋卓:跟高通量测序没有太大关系。现在颁发的认证主要集中在产前唐氏综合症筛查领域。PCR相关的话题很多,主要集中在遗传学、肿瘤和感染方面。

爱情分析:一般情况下,报告周期是多久?

宋卓:最短18个月,平均3年。

爱心解析:肿瘤筛查属于哪个业务线?

宋卓:我们做一些癌症筛查项目,比如大肠癌筛查,属于大健康业务线。

爱情解析:大健康相关的应用有哪些?

宋卓:作为一项新技术,基因检测相当于从一个新的维度观察健康问题。与健康相关的应用可以分为三类,包括检测父母遗传基因的疾病易感基因;检测人体内累积突变的早期肿瘤筛查;除了人体基因,因为肠道菌群与人体的各种健康状况密切相关,也与检测人体肠道菌群基因的精准健康管理和干预项目息息相关。

爱分析:在客户层面,除了机构客户,还会考虑2C客户吗?

宋卓:最终的测试者都是个人用户,但我们是B2B2C。我们的判断是,2C市场还处于起步阶段,需要几年的市场教育才能形成。

:你刚才提到的大健康业务积累的基因突变和IVD业务的肿瘤应用有共同之处,但呈现方式不同?

宋卓:是的,我们共享同一个技术平台。这种高精度、多热点低频突变检测技术平台可以同时支持一般健康和临床基因检测需求。临床上是辅助诊断,不涉及干预;在健康领域,我们负责提供干预方案和产品以满足客户的健康需求。

爱分析:在您看来,现阶段,遗传数据量和算法哪个更重要?

宋卓:在不同的阶段,重要性是不同的。如果在探索初期还没有形成合适的算法,那么数据是最重要的。一旦算法成形并开始关注计算效率,算法就会变得很重要。有许多计算相同内容的实现算法。在比较更快和更低成本的计算时,高性能算法更为重要。

爱情解析:肿瘤早期筛查,基因检测需要定期检测吗?

宋卓:是的。早期的肿瘤筛查检测到在人类生长和衰老过程中积累的突变,这些突变发生在某些概念时间。除少数家族性遗传性肿瘤外,大多数肿瘤是获得性致病突变的积累。因此,早期肿瘤筛查需要定期检测,相信这类基因检测将成为未来众多为人熟知的体检项目之一。

图片[4]-人和未来布局有三条业务线,IVD与大健康业务-4747i站长资讯

组建多学科团队,大数据业务可独立运营

爱分析:哪个业务板块最先商业化?

宋卓:体外诊断和大健康是最早商业化的业务板块。虽然一直有大数据团队,但早期一直处于技术开发阶段,现在大数据技术方案已经形成并商业化。

爱分析:在人员方面,这三项业务的分布情况如何?

宋卓:公司目前有250多人,技术中心占90多人。实验、盛信、大数据三支研发团队比较平均,各占1/3。

爱分析:项目执行过程中定制的比例是多少?

宋卓:企业客户往往有自己的特殊需求,需要定制化服务。这些定制的内容也是产品的衍生。通常定制部分占整个工作量的1/5-1/4。解决一个企业的需求,也就是解决一类企业的需求。

:与医院合作是按样本量收费吗?

宋卓:是的,根据样本数量。

爱心解析:一般样品费用是多少?

宋卓:从几百到几千,取决于检测项目和产生的基因数据量。在大健康业务中,除了检测,管理和干预方案也是价格因素之一。

爱分析:大数据商业化预期?

宋卓:今年预计会产生几百万的收入。

爱情解析:保险公司提供哪些服务?您是否看到影响保费的基因检测趋势?

宋卓:我们为保险公司提供样本基因检测和数据分析服务。保险公司将基因检测视为对客户的健康益处。基因检测结果不影响保费的计算。事实上,由于涉及到许多政策和伦理问题,这与现实还相去甚远。美国还没有开始,中国看好5-10年。

爱分析:大健康业务的年增长率是多少?

宋卓:增长率是100%。我们希望建立一个智能、精准的健康解决方案服务平台,服务于健康产业上下游企业。

爱情解析:如何将个性化基因数据作为通用平台?

宋卓:个体数据是个性化的,但数据分析的逻辑是通用的。

:仁和未来会向基因测序公司输出大数据技术,会不会因为业务冲突而降低竞争力?

宋卓:没有,可以从几个层面看。首先,我们提供底层IT技术解决方案,对所有应用方透明,欢迎通过提高效率为企业省钱。其次,基因检测的种类很多,属于新兴市场,每个公司都有自己的优势和优势。我们的业务很难与特定的公司竞争,更多的是合作。第三,从长远来看,我们会将大数据业务拆分为一家公司,独立运营。

爱分析:标杆公司有哪些?

宋卓:在大数据业务中,高性能云计算的标杆是七,FPGA计算加速的标杆是。IVD和大健康业务,虽然有很多基因检测公司,但由于市场足够大,各有侧重和优势,我们没有设立具体的标杆公司。

文章来源:https://cj.sina.com.cn/article/detail/5796255450/439010

------本页内容已结束,喜欢请分享------

感谢您的来访,获取更多精彩文章请收藏本站。

© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享