系列6:(如何采集数据)渔网系列——详看《科学研究的逻辑》第7章节

10/5/2019

小全编辑

全科之窗|ABC平台编辑

1197

10/5/2019 12:00:00 AM

前言

说到科研,全科医学的伙伴们估计不少人认为这是三级医院医生或者是专门从事医学研究人员的专属,和自己没有多大关系、或者是很多人是为了职业发展及晋升被迫去开展科研的——感觉科研是个痛苦的过程。

那么科研到底是什么?为什么我们要做科研?能不能快乐的做科研呢?由张勘及沈福来主编的《科学研究的逻辑、方法和工具——科研三部曲》系列作为针对全科医生提升科研能力的教材,这些年来在上海普及培训了超过1000人次的全科医生,整个系列教材化繁就简,案例详实、阅读性强,得到了广大学员的好评。本栏目也将连载原书部分内容以飨伙伴,希望大家能把科研的思维和逻辑带到日常工作中,全科医学是科研的热土,希望能抛砖引玉,启发及开拓大家的思路,也鼓励大家勇于探索、不断总结、优化实践!

祝愿大家快乐的做科研,以科研助推全方位的进步!  

三部曲之一——科研逻辑篇 

系列6——(如何采集数据)渔网系列(详看《科学研究的逻辑——思考判断胜于一切》第7章节)

数据采集的逻辑,是从为什么要进行数据采集、什么是数据采集、数据采集的常见问题、常见问题对研究质量的伤害、如何正确进行数据采集、数据的录入和存储依次论述。之所以称数据采集的逻辑,为“科学研究的渔网系列”,是因为,在实际操作中,我们常常发现,研究者们时常困惑于如何找一个合适的研究工具去采,就像渔夫们需要准备一张合适的渔网去打鱼一样。

1)   数据采集的常见问题

对于非文献检索类的数据采集,常见问题主要有六类,即a)研究工具不适宜,b)采集员不合适,c)采集方式不恰当,d)流程缺失,e)监督和反馈不及时,f)存储不便利。具体内容阐述见下文。

2)   数据采集不当伤害了研究的什么?

首先是单个样本数据的精确性不足或准确性不够;其次整体样本数据缺乏信度和效度;再者,研究的真实性(效度)和可靠性(信度)被破坏。(这里面有些新名词,效度/信度,这里不一一展开,伙伴们可以详细看《科学研究的逻辑——思考、判断胜于一切》的第七章)

数据采集的核对清单(checklist)

阶段

任务

注意事项

准备阶段

明确目标

确定数据携带者(即研究对象)的入选标准;确定抽样方法;计算样本量。

选择和准备研究工具

访谈提纲,以有逻辑关系的、开放式问题为主。一般需自行制定。(步骤:确立访谈目的→定位访谈阶段→搜集访谈问题→递进式罗列访谈问题)

问卷,以封闭式问题为主。可从类似研究中挑选,也可自行制定。(挑选注意:研究目的一致,数据携带者特征差异小;制定步骤:确定研究问题和研究假设→建立指标体系→探索性研究→设计问卷初稿→预调查→修改定稿)

量表,多个具有逻辑结构或是经验结构的项目组成。多从现有量表中选取,也可自行开发。(选取标准与问卷类似,开发流程与问卷类似)

病例报告表(CRF),记录实验方案中对受试者要求的所有信息、并向申办者报告的文件。多自行设计。(步骤:梳理数据项、收集时间、收集频率→探讨收集目的和可能性,各处数据项定义、处理方法→CRF版面与项目设计→对照方案和数据库,检查一致性→CRF关联文件设计)

确定采集员

采集员特征:研究者能经常联系上,采集员自身能接触或找到数据携带者,有能力采集研究者所需数据。

采集员培训:目的在于统一认识,积累和分享采集技能,是必不可少的一步。可自问自训、交互培训、团队培训结合使用。

选择采集方式

采集方式包括语言沟通技巧、采集时间、采集空间。选择采集方式时,需考虑数据携带者的空间分布情况、适宜采集时间段和不同特征数据携带者的沟通技巧。一项研究的数据采集往往是多种采集方式混合进行。

确定监督人员

监督人员负责数据采集的进度监督和问题收集,并及时组织采集员商讨解决方案。一般为研究者或研究负责人担任。

制定采集流程

包括数据采集的步骤、职责、注意事项等内容。

实施阶段

与多方沟通

沟通对象:采集地的关键联系人,采集助手,数据携带者。

沟通技巧:问题同义转换,顺序因需安排,同义拆分。

收尾阶段

数据汇总和管理

数据汇总包括发放和回收数统计,采集工作评价和经验总结。数据汇总和管理需由专人负责。

数据录入与存储

选择合适的录入和存储工具

工具选取标准:方便浏览数据,方便被常用统计软件调取分析。常用为excel,Epidata等。

招募数据录入人员

招募要求:可在连续时间内全称参与数据录入的人员。

数据录入注意事项培训

研究者、研究负责人或数据监管人自己尝试数据录入,总结注意事项,形成文本,再进行录入人员的统一培训。

录入数据

可安排两人同时录入,以便发掘错误。

录入编码技巧:①只有两个选项的题目,可以将其归为二分类变量,以0、1分别表示取值;②有三个及三个以上选项的题目,可以将其归为多分类变量或定序变量,以1、2、3……依次代表每个选项,尤其适用于不同取值之间存在递进关系的定序变量;③对于多选题,可以每一个选项设为二分类变量,选择记为1,未选记为0。

审核数据

确保审核者审核的不是自己录入的数据。

存档

存档包括原始数据存档和录入数据存档。注意保障数据完备性。

购书链接

科学研究的逻辑、方法和工具


版权所有 ©2018 智医创工具 All Rights Reserved. 沪ICP备12048712号-4