7725 NLP案例分析百度5年深耕NLP 他把聊天机器人变成你的全科医生.docx

上传人:b****9 文档编号:25718884 上传时间:2023-06-11 格式:DOCX 页数:10 大小:212.80KB
下载 相关 举报
7725 NLP案例分析百度5年深耕NLP 他把聊天机器人变成你的全科医生.docx_第1页
第1页 / 共10页
7725 NLP案例分析百度5年深耕NLP 他把聊天机器人变成你的全科医生.docx_第2页
第2页 / 共10页
7725 NLP案例分析百度5年深耕NLP 他把聊天机器人变成你的全科医生.docx_第3页
第3页 / 共10页
7725 NLP案例分析百度5年深耕NLP 他把聊天机器人变成你的全科医生.docx_第4页
第4页 / 共10页
7725 NLP案例分析百度5年深耕NLP 他把聊天机器人变成你的全科医生.docx_第5页
第5页 / 共10页
点击查看更多>>
下载资源
资源描述

7725 NLP案例分析百度5年深耕NLP 他把聊天机器人变成你的全科医生.docx

《7725 NLP案例分析百度5年深耕NLP 他把聊天机器人变成你的全科医生.docx》由会员分享,可在线阅读,更多相关《7725 NLP案例分析百度5年深耕NLP 他把聊天机器人变成你的全科医生.docx(10页珍藏版)》请在冰豆网上搜索。

7725 NLP案例分析百度5年深耕NLP 他把聊天机器人变成你的全科医生.docx

7725NLP案例分析XX5年深耕NLP他把聊天机器人变成你的全科医生

【NLP】【案例分析】XX5年深耕NLP他把谈天机器人变成你的“全科医生”

智东西

微信号ai-cps

功能引见OT技术(工艺+精益+自动化+机器人)和IT技术(云计算+大数据+物联网+人工智能)深度融合,在场景中构建:

外形感知-实时分析-自主决策-精准执行-学习提升的机器智能认知系统,实现产业转型升级、DT驱动业务、价值创新制造的产业互联生态链。

2017-07-25原文

收录于话题

智东西(公众号:

zhidxcom)

文|Lina

随着人工智能技术的进展,AI也开头渐渐在各行各业中落地使用,发挥本人的价值,其西医疗由于涉及国计民生,并且行业较为传统,有不错的进展空间,自然也就成了一块被众人看好的AI使用领域。

2017年里,“AI+医疗”已经成了一个渐渐火热的话题,智东西此前也在医疗影像识别、帮忙问诊、医疗单据数据化等领域做过相应采访。

今日,智东西来到了另外一家AI医疗创业公司康夫子,与创始人兼CEO张超聊了聊。

据张超引见,康夫子专注于为B端客户供应基于医疗数据的AI服务,核心技术包括学问图谱、NLP(自然言语处理)等,曾推出医疗预问诊系统“全科医生”、病历数据结构化服务等产品。

一、五年XXNLP阅历

初见张超,瘦瘦高高的,戴着眼镜,笑容很绚烂。

据张超引见,康夫子成立于2015年,至今已经经过了种子轮和天使轮两轮融资,目前A轮数千万元融资即将结束:

其中天使轮融资将近一千万,由晨兴创投投资。

张超本人此前曾在XX搜索有5年的NLP部门资深研发工程师经受,同时也是文本学问挖掘方向担当人,并担当有关学问图谱和实体建模(这几项技术后文将会进一步解释)。

而公司的另外两位合伙人也都是XX出身:

分别是担当全体架构的前XX高级研发工程师张冲、以及技术合伙人/前XXNLP高级研发工程师栗晓华。

目前康夫子的团队大约有30人,其中大部分都是XXNLP部门出身,约20人属于技术研发。

张超说,其实一开头有创业想法的时候,最早找的是张冲。

“我是周三约的他,我们周五见的面,约的是新中关下面的星巴克,那时候他已经(从XX)离职了。

”两人几乎是一拍即合,快速敲定了进展方向。

栗晓华则是张超“六顾茅庐”请出来的人物。

此前栗晓华跟张超在XX里是关系格外好的伴侣,已经几次三番由于“好伴侣不要在一起创业”而拒绝了张超的邀约。

(从左到右:

张超、栗晓华、张冲)

二、深耕学问图谱,团队阅历丰富

作为同时毁灭在昨日国务院印发的《新一代人工智能进展规划》中的重点人工智能技术,NLP(自然言语处理)我们已经很生疏了,比较很好理解;可“学问图谱”是个什么?

2012年5月,谷歌在其官方博客上发表了一篇名为《IntroducingtheKnowledgeGraph:

things,notstrings》的文章,引见了谷歌借助学问图谱,将搜索技术从关键词到实体的飞跃,也就是让机器学会理解关键词所代表的实际含义。

至此,学问图谱概念开头渐渐衰亡。

张超引见道,学问图谱就是实体和实体关系的总和,我们可以理解成一张由实体(entity)相互连接而成的语义网络。

(图源:

网友高天蒲《什么是学问图谱》)

在图中可以看到,通过实体的属性可以将不同的实体建立关联关系,例如:

1)刘德华(实体)–妻子(属性)->朱丽倩(另一个实体)

2)刘德华—电影作品->无间道

3)无间道—制片国家/地区->中国香港

最终得到的学问图谱就是一张实体和实体关系总和的图片。

以搜索引擎为例,随着数字信息的指数式增长,“关键词搜索”已经不能满足用户的精准需求了,搜索引擎需要识别出内容中毁灭的实体以及实体关系,精确     理解用户的搜索意图,并给出精准的回答。

而学问图谱中技术所面临的挑战又包括实体识别、消歧(重名,别名)、实体关系挖掘等,归根到底又是NLP自然言语处理的技术了。

张超说,学问图谱的构建需要通过信息抽取技术(InformationExtraction,IE)来实现,而信息抽取技术现阶段并没有太好的处理方案。

所以全体上来讲信息抽取是一门“娴熟工种”的技术,“熟”才“能生巧”。

由于康夫子的团队普遍具有多年的实战阅历积累,曾基于XX大量语料库做过信息抽取,能够总结出适于实战的方法论,晓得如何对数据进行快速结构化。

学问图谱的方法是清楚的:

实体提取,关系提取,图谱存储和检索。

但由于这仍是一门格外年轻的学科,单从论文、教科书上进行理论学问争辩并不足够,需要在实践中将众多的“坑”一个个踩遍,才能真正落地到产业中去,得到成效。

“我们的优势是阅历多,做得快,别人做一个维度需要一个月,我们只需不到一周。

医疗有100多个维度,我们已经做到7、80维了。

”张超带着点小傲慢地对智东西说着。

三、基于学问图谱,打造三项医疗法宝

目前,康夫子的次要合作伙伴是为医院供应软件平台(比如HIS医院管理和医疗活动信息化系统)的企业,核心产品有以下几类:

1)“机器人全科医生”(医疗chatbot)

“机器人全科医生”其实是一个设立在医院挂号处的机器,内置了康夫子的预问诊系统,类似一个医疗类的谈天机器人(Chatbot)。

在输入/点选了姓名、性别、年龄后,用户可以输入相应症状,比如“肚子疼得厉害”,系统将会仿照一个全科医生一样,一步步询问病患的病情,比如“腹痛最在是在什么时候毁灭的?

”、“属于以下哪一种苦痛?

”等等。

(图为康夫子全科医生的iOSSDK)

问到最终,系统将会告知用户,依据以上症状,你有73%的可能是肠炎,需要去消化内科问诊。

与此同时系统还会生成一个用专业医学术语描述的病历,并将这份病历发给消化内科的医生,提高了医患沟通效率,节省了时间成本。

目前这套系统已经在张家港第一人民医院中进行线上测试了。

除了提高挂号效率外,将来这套预问诊系统还可以使用在急诊抢救车上,在抢救车运送患者途中,可以由抢救人员事后采集患者信息,提前预备相应医生。

2)病历结构化

这么多年来,医院存贮的患者病历通常都是一段病情描述——这属于无结构化数据,格外不利于信息的检索与分类。

而且医疗数据的维度普遍很高,光是高血压一项,就有“已经诊断出、现在诊断出、将来可能诊断出”等不同结果。

再比如,“一名病患住院第一天没有咳嗽,其次天使用了某种药物时毁灭咳嗽,并在24小时内毁灭高烧”,在这个案例中,药物、住院历史、患者病情属于不同的关联文档,并且需要依据时间线排序分析,再加上各个查房护士对同一症状的描述方式可能不同,构成医疗数据特殊纷繁简约。

康夫子的做的就是将这众多数据进行结构化处理,最终得出一个可供医生点选搜索的病历平台。

比如“患者性别=男”+“疾病名称=感冒”+“疾病史!

=糖尿病”等等,最终得出2007年3月某日的某个用户病历。

3)临床帮忙系统

跟前两项一样,康复子的临床帮忙系统也是一套基于康夫子NLP(自然言语处理)技术的产品。

这项技术将会植入到医生填写病历、开具药品、检查单的系统里,在依据医生填写的病历理解分析了患者病情后,系统会给出推举的医治方案。

不过,这个系统并不会转变医生的工作流程,医生填写病历、点选药物、开检查单等动作都与之前一模一样,独一不同的是在填写完毕后系统会毁灭一个小弹窗:

系统在分析完医生填写的病历后,会赐予查漏补缺式的提示(比如某两款药物或许存在冲突),医生可以选择听从它,又或者是直接忽视。

目前这款产品正在打磨阶段,张超表示,康夫子正在和一家三甲做医疗调研,估量年底将会上线。

四、从2C到2B,康夫子的转型之路

其实,2015年成立之初的康夫子最早定下的方向为:

从孕妇群体切入,做饮食养分的学问图谱。

基于基于孕妇人群对养分尤为看重这一基础,以孕妇的饮食分析为切入口,推出了孕食App;孕妇在App中记录饮食情况后,“饮食记录分析”功能,能依据内化的养分学学问图谱输出分析报告以及饮食建议。

然而,医疗类App首先面临着作为C端产品难以变现的问题,而这也是2014-2015年那一波衰亡的互联网+医疗App所面临着的一个共性问题;其次,养分学问问题虽说是孕妇刚需,但它并不具备一个严格的标准,经常东家西家各执一词(比如到底该当饭前吃水谷还是饭后吃水果……),很难让人信服。

2015年底到2016年初,团队开头思考转型之策。

由于团队本身的强项照旧是多年的学问图谱、文本分析技术积累,而医疗健康照旧是康夫子看好的领域。

几经考虑之下,2016年4月,团队最终打算转型B端,并且选择医学这类有严格界限,愈加适合使用机器进行理解分析的领域。

张超表示,目前康夫子的合作伙伴已经掩盖了全国前十大的HIS医疗信息化公司中将近一半的企业,其问诊交互服务也应在搜狗名医、360良医网站上线,当用户在这些网站搜索“咳嗽”或者“肚子疼”时,系统将会给出可能的疾病类型,比如“可能57%是感冒,4%是支气管炎,3%是咽炎……”

结语

在和张超沟通的过程中会发觉,在他身上有着和很多技术出身的创业者所类似的特质,规律思维清楚、执着、谈起技术来格外兴奋、并且对本人及团队的力气有着足够的决心与傲慢。

在经受过从C端到B端,从养分到医疗的转型后,康夫子的业务推动路线已经渐渐成效初显,在优化问诊流程、医疗数据结构化方面有了不错的进展。

在这个医疗数据纷多繁杂的时代里,医疗信息的数据化、结构化、以及信息检索的重要性也日益凸显。

在这样的背景下,有创业团队选择做医疗信息数据化的单据识别(比如智东西此前采访过的医拍智能),而康夫子选择的路线则是在数据化的基础上对数据进行结构化、图谱化处理,并且凭仗公司创始人及团队在XX多年的阅历与技术积累,打入医疗信息化企业,取得了不错的成果。

子曰:

“君子和而不同,小人同而不和。

” 《论语·子路》

 云计算、大数据、物联网、区块链和人工智能,像君子一般融合,一起体现科技就是生产力。

假如说上一次哥伦布地理大发觉,拓展的是人类的物理空间。

那么这一次地理大发觉,拓展的就是人们的数字空间。

在数学空间,建立新的商业文明,从而发觉新的创富模式,为人类社会带来新的财宝空间。

云计算,大数据、物联网和区块链,是进入这个数字空间的船,而人工智能就是那船上的帆,哥伦布之帆!

人工智能通过三个方式激发经济增长:

1.制造虚拟劳动力,担当需要顺应性和灵敏性的简约任务,即“智能自动化”,以区分于传统的自动化处理方案;

2.对现有劳动力和实物资产进行有利的补充和提升,提高资本效率;

3.人工智能的普及,将推动多行业的相关创新,开辟簇新的经济增长空间。

新一代信息技术(云计算、大数据、物联网、区块链和人工智能)的商业化落地进度远不及技术其本身的革新来得迅猛,究其缘由,技术供应商(乙方)不明确本人的技术可服务于谁,传统企业机构(甲方)不懂如何无效利用新一代信息技术创新商业模式和提升效率。

“”,通过采编对甲、乙方参考价值巨大的云计算、大数据、物联网、区块链和人工智能的论文、争辩报告和商业合作项目与案例,面对企业CEO、CDO、CTO和CIO,从而服务新一代信息技术输出者和新一代信息技术消费者。

助力新一代信息技术公司查找最有价值的潜在传统客户与商业化落地路径,挂念传统企业选择与开发适合本人的新一代信息技术产品和技术方案,衰退新一代信息技术公司与传统企业之间的信息不对称,推动云计算、大数据、物联网、区块链和人工智能的商业化浪潮。

给决策制定者和商业领袖的建议:

1.迎接新一代信息技术,迎接人工智能:

无缝整合人类才智与机器智能,重新评估将来的学问和技能类型;

2.制定道德规范:

切实为人工智能生态系统制定道德准绳,并在智能机器的开发过程中确定愈加明晰的标准和最佳实践;

3.留意再支配效应:

对人工智能可能带来的冲击做好预备,制定战略挂念面临较高失业风险的人群;

4.超越自动化,开启新创新模式:

利器具有自主学习和自我把握力气的动态机器智能,为企业制造新商机;

5.开发人工智能型企业所需新力气:

员工团队需要乐观把握推断、沟通及制造性思维等人类所特有的重要力气。

对于中国企业来说,制造兼具包涵性和多样性的文化也格外重要。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 自然科学 > 物理

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1