在医疗信息化领域,患者主索引(Enterprise Master Patient Index,简称EMPI)自二十世纪末兴起,其核心价值在于作为患者基本信息的检索目录,特别是在复杂多变的医疗环境中,通过赋予每位患者唯一的标识,将众多分散的医疗信息系统紧密相连。
EMPI系统,本质上是一个高效的数据桥梁,它能够将来自不同系统的患者标识整合为一,确保每位患者仅对应一个独一无二的标识,其所有医疗信息均归集在这个标识之下。这样一来,跨系统的患者身份识别问题便得到了有效解决,信息孤岛现象得以缓解。
在EMPI的运作机制中,每个接入的医疗信息系统都会被分配一个特定的Domain ID,作为其身份标识。当这些系统新增患者或医生信息时,会生成一个Internal ID用于内部管理。与此同时,系统会向EMPI发送请求,以添加或更新相应的患者主数据。EMPI在接收到这些信息后,会生成一个Global ID,并建立Global ID与Domain ID、Internal ID之间的映射关系,从而实现患者标识的交叉引用(即PIX,Patient Identifier Cross-reference)。
PIX作为患者标识号关联的指导标准,在医疗信息化中发挥着重要作用。而PDQ(患者人口学信息查询规范)则进一步增强了这一功能,它允许多个应用程序通过特定的查询语法,向EMPI中心查询患者信息,提高了信息查询的效率和准确性。
在构建EMPI系统时,选择合适的患者身份标识至关重要。虽然中国的身份证UID是确定性匹配算法的首选,但它并不能直接作为EMPI系统内部的患者唯一标识。因此,引入全局唯一标识符(GUID)作为主索引成为了一种有效的解决方案。GUID通过特定算法生成,具有128位的二进制长度,能够确保患者身份的唯一性和准确性。
在实际应用中,概率算法因其广泛的适用性而备受青睐。与确定性算法相比,概率算法能够基于概率基础结果判断两个记录是否匹配。在进行患者身份匹配时,系统首先会对患者姓名拼音进行索引匹配,得到一个基础分数。然后,系统会依次查询患者的其他信息,如姓名、性别、出生日期、身份证号、居住地址、电话号码等,每次查询都会得到一个分数。最后,系统将所有分数相加,得到总评分,并筛选出评分达到或超过预设阈值的结果集。在筛选过程中,系统还会对候选记录的相应字段进行相似性计算,如Levenshtein distance,以进一步评估字符间的差异。