喜訊:啄醫(yī)生醫(yī)療大模型在最新的中文醫(yī)療模型評估中(CMB-Exam)排名第一!
熱點(diǎn)
近日,CMB官方發(fā)布了最新的中文醫(yī)療模型評估(CMB-Exam)排名,列出了從四種生成類別中選擇的最佳準(zhǔn)確率:Zero-shot (with/without COT) and Few-shot (with/without COT) 生成和評估的詳細(xì)信息。包括香港中文大學(xué)、阿里云通義千問、中科院深圳先研院、螞蟻集團(tuán)、美國人工智能研究公司等團(tuán)隊(duì)成功上榜。其中健培科技啄醫(yī)生醫(yī)療大模型??jianpeiGPT 以 81.78 平均分位列第一。
啄醫(yī)生團(tuán)隊(duì)基于龐大的醫(yī)療行業(yè)數(shù)據(jù)集、自主開發(fā)的多學(xué)科專業(yè)知識庫、以及豐富的臨床實(shí)踐,訓(xùn)練的醫(yī)療垂直行業(yè)大模型,已經(jīng)在多個(gè)場合落地應(yīng)用。在CT、DR、MRI、眼底等影像上實(shí)現(xiàn)了AI輔助疾病診斷,并在醫(yī)療數(shù)據(jù)質(zhì)控、健康篩查、隨訪、手術(shù)規(guī)劃等全流程環(huán)節(jié)應(yīng)用,幫助提高疾病診療的質(zhì)量和效率。
啄醫(yī)生大模型??JianpeiGPT
啄醫(yī)生團(tuán)隊(duì)在醫(yī)療健康大模型的研發(fā)上具備深厚積累,在數(shù)據(jù)、算法和落地能力方面優(yōu)勢明顯。
數(shù)據(jù)層面,圍繞醫(yī)療垂直領(lǐng)域中防、篩、診、治、康各環(huán)節(jié),提煉海量高質(zhì)量的醫(yī)學(xué)知識數(shù)據(jù)形成上百億token的高質(zhì)量醫(yī)學(xué)知識專庫,以及上萬份醫(yī)學(xué)指南、幾千萬例次真實(shí)病歷等。海量高質(zhì)量的訓(xùn)練數(shù)據(jù),保證了“啄醫(yī)生”醫(yī)療大模型響應(yīng)的可靠性和準(zhǔn)確性。
算法層面,通過高效的分布式計(jì)算技術(shù)、硬件加速器技術(shù)支持,高效持續(xù)訓(xùn)練“啄醫(yī)生”醫(yī)療大模型,激發(fā)大模型對醫(yī)療場景的強(qiáng)大的理解、生成、邏輯和記憶能力,為“啄醫(yī)生”醫(yī)療大模型開發(fā)和高效快速迭代提供強(qiáng)力支撐。
關(guān)于CMB
CMB是一個(gè)全方位、多層次的中文醫(yī)學(xué)基準(zhǔn)。它包含了280,839道題和74道復(fù)雜病例會診題,涵蓋了所有臨床醫(yī)學(xué)專業(yè)和各種專業(yè)水平。該平臺旨在全面評估大模型的醫(yī)學(xué)知識和臨床咨詢能力。具體組成如下。
中文醫(yī)療模型評估基準(zhǔn) CMB,其包括了醫(yī)學(xué)知識的多層次綜合評估(CMB-Exam)和基于真實(shí)病例的復(fù)雜臨床診斷問題(CMB-Clin)。其中 CMB-Exam 的構(gòu)建理念是反映真實(shí)醫(yī)療領(lǐng)域的考核體系,覆蓋了醫(yī)生、藥劑師、醫(yī)技科室、護(hù)士崗位,對于一致的大學(xué)學(xué)科知識考試和研究生入學(xué)考試進(jìn)行了合并,歸納出了六個(gè)類別。以此來評測出模型對于醫(yī)療知識的掌握程度。CMB 從現(xiàn)實(shí)醫(yī)學(xué)考核和臨床應(yīng)用出發(fā),結(jié)合選擇題和復(fù)雜病歷問診來全面檢驗(yàn)?zāi)P驮卺t(yī)學(xué)知識與診斷能力上的表現(xiàn)。為醫(yī)學(xué)大模型的研發(fā)者們提供有力的反饋,幫助更快地完善模型,促進(jìn)中文醫(yī)學(xué)領(lǐng)域語言模型的持續(xù)創(chuàng)新和應(yīng)用。?