推敲研究用词,发现设计瑕疵
作者:周毅越整理,赵耐青教授审阅 来源:中国医学论坛报 日期:2012-12-28
在《全科医学周刊》科研论坛(简称科研论坛)第1期上,上海市徐汇区斜土街道社区卫生服务中心(简称斜土中心)的朱兰医生就其开展的《“社区高血压群组干预”新型管理模式的创建与应用》研究进行了汇报,复旦大学公共卫生学院卫生统计教研室赵耐青教授对照着研究的幻灯片进行了逐页点评。
科研论坛第1期主席、中华医学会全科医学分会常务委员 潘志刚 副主任医师:赵耐青教授通过逐个层面地对朱兰医生的研究进行点评,介绍了社区开展较多的一类研究——干预性研究应如何设计。也许在进行科研设计时我们已觉得很完满了,但经专家点评就会发现其中尚有许多可改进之处。赵教授特别强调了干预研究的3个要素及对研究用词的细细推敲,这主要体现了研究的细节,因用词反映了研究思路。
■ 研究
“社区高血压群组干预”新型管理模式的创建与应用
研究目的
探索一种社区慢病群组干预管理模式,以有效管理慢病患者。
研究对象
入选标准: 35~80岁;有医疗正式记录的高血压患者,可同时患其他慢病;居住在斜土社区。
排除标准: 精神异常者;同时患肿瘤且近半年内接受过化疗、放疗或放化疗者;<35岁或>80岁者;存在可能导致参加者不依从或失访情况者;正在参加或近30天内参加过其他研究者;伴严重躯体功能损害者;严重视听障碍者。
实施内容
招募400例高血压患者,以个体随机法将其分至干预组和对照组,每组各200例;每组20例患者,每两周1次群组干预管理活动。在干预结束、干预后6个月、1年和两年时对两组患者利用与基线时相同的调查问卷进行随访。
评价指标
效果考核评价 定量指标包括生物学指标(血压、健康状况、躯体功能)、心理行为指标(自我效能及服药依从性)和社会学指标(社会功能、高血压相关知识和行为)。定性指标包括自愿参加群组看病的患者数(参与率)、参加者对活动内容与形式的体会和建议等。
成本-效益考核分析 根据高血压的门(急)诊就诊次数和药物用量等判断该教育模式的收益。
■ 点评
通过推敲研究用词的细节完善研究设计
这个研究其实很多设计都很好,这里仅主要就其中的问题进行点评。
题目中的要素是否匹配
题目中“创建”和“应用”并不匹配。对于一种新型干预方法,首先应对其进行评价,而不是马上应用它,故建议将此处改为“探索此模式并评价其干预效果”。
之前,曾有一位研究者将其研究的题目定为《探讨某基因对胃癌发生和发展的影响》,这就是不匹配的,因肿瘤的发生和发展完全是两回事,发生指肿瘤发病,考虑的是高危人群和高危因素;而发展研究的是患者预后。因此,医生,特别是全科医生,在用词上一定要仔细考虑。
个体随机的研究方法是否适合
研究中探讨的干预措施是种健康教育方式。而健康教育与仅影响单个个体的药物干预不同,其存在“污染效应”,即在某社区进行健康教育,不但对参加者,且对参加者周围的人都有影响,故关于健康教育的研究一般不应采用个体随机方式进行。
干预性研究的三要素是否清晰
干预性研究有3个要素:对象、干预方式及评价指标。实际上,在讨论临床研究设计时,专家们花费很大精力讨论的往往是如何设置干预对象及干预措施与干预对象的关系,这样才能谨慎地评估干预效果,故不能简单地设置入选标准,特别是在涉及影响血压的干预措施时。此研究未清晰表述出干预性研究的3个要素。
关于干预对象 此处主要存在以下两个问题。
1. 所规定年龄段群体是否对干预有良好的依从性,这是选择干预对象时的首要考虑问题。一般三四十岁的人都处于工作繁忙、生活压力较大的阶段,在时间和心情两方面都很难坚持完成健康教育。健康教育多在50岁以上人群中开展。虽此研究未列出其中干预对象的依从性如何,但根据常识已可基本判断,至少在45岁以下人群中,健康教育干预或相当于“纸上谈兵”。一般而言,女性依从性较男性好,退休者较在职者好。
2. 列出明确的入选标准和排除标准以减少混杂因素。入选标准代表要干预的人群,即将来通 过干预措施可能获益的目标人群;排除标准指可缩小干预人群以使其尽可能“干净”地设定条件,其可将影响干预效果的人群剔除。比如,若有的干预对象未合并其 他疾病,而有的合并了糖尿病或冠心病,这时干预后的效果就可能存在偏差。故研究者应对干预人群进行一定的限定,一般都对条件基本相同的人群(如都为合并糖 尿病的高血压患者)进行干预和比较,这样可去除混杂因素。否则,对于效果不明显的干预措施,其对干预对象的影响力度将淹没在多种混杂因素中。当然,若想将 干预对象的范围放大一些也是可以的,但一定要注意分层。
此研究中虽列出了入选标准,但其表述还有待商榷。研究者设计的人群虽都是可干预的,但其中部分人群(如合并多种疾病者)存在较多混杂因素,故其干预效 果或很难评价,最终这将使研究结果受影响。在设计研究时,应清晰地认识到其中每个设置的意义,这样才能将入选标准、排除标准都科学地分配好。
关于干预方式 该研究在干预方式的表述上较好,但其中还有一处须注意,研究者先将纳入者分为干预组和对照组,后面又说“每20人一组”,这容易引起大家理解混乱,表述时须用其他词语(如小组)将其区分开来。
关于评价指标 此研究探讨的是对高血压患者的干预效果,在入选时就应考虑纳入者的血压范围,否则将来很难评价研究结果。例如,若有人在服降压药且血药浓度达峰值时测量血压,有人在服药前测量血压,这时的比较有意义吗?若一种力度大的干预措施可将患者的收缩压从180 mmHg降至140 mmHg,但其对于收缩压150 mmHg者,也可使之降低40 mmHg吗?故关于血压下降幅度的评价有很多问题可讨论。
一般而言,药物的干预力度较大,非药物措施的干预力度较小。对于力度小的干预措施尤须注意考虑混杂因素对干预效果的影响。比如本研究的干预对象都是高血压患者,但他们是否都在服用降压药治疗?服用的药物是否是同一档次的?这都要考虑,否则最后进行成本-效益分析时就会发现,医疗花费越多者干预效果越好,这样研究结果就没意义了。因此,研究者应将评价指标进行细化的限定。
另外,还须考虑血压测量的问题,在基线时就要问清纳入者的血压是服用降压药后测的还是服药前测的。特别是短效降压药,其可对研究结果产生很大影响。
总之,用词其实反应了研究者本身的科研思路是否清晰,在表面上看这是用词的问题,但仔细推敲会通过用词发现很多研究设计上的瑕疵。
|